龙空技术网

让围棋AI腾飞的蒙特卡洛算法——围棋AI进化史(1)

找借口安静 225

前言:

当前姐妹们对“蒙特卡洛树算法程序”大约比较关注,各位老铁们都想要学习一些“蒙特卡洛树算法程序”的相关内容。那么小编同时在网摘上汇集了一些关于“蒙特卡洛树算法程序””的相关文章,希望你们能喜欢,朋友们一起来了解一下吧!

原址:

原题:囲碁AI飛躍させたモンテカルロ木探索 長かった黎明期

摘自:日本经济新闻

作者:大桥拓文 六段

翻译和整理:找借口安静 这个好像周更?

现在的围棋AI已经远远超过了人类的实力,从今天开始由大桥拓文介绍电脑围棋的历史和进化的过程。

5年前,英国DeepMind团队开发的围棋AI“AlphaGo”突然横空出世,击败了韩国顶尖棋手李世石九段。如今AI的实力已经远远超过了人类的水平,实际上围棋AI从黎明期就开始了开发。

最早的围棋软件出现在上世纪60年代的美国,当时的实力大概是38级​。日本国内刚刚入门的爱好者,大概是从30级开始起步的,所以说38级这个水平,就很难说是​会下围棋了。还有很多棋是下在​下一手棋就能被对手吃掉的地方。

日本也从上世纪60年代后期开始开发围棋软件,1970年的大阪世博会中,富士通公司准备了一台像柜子一样大的电脑,向大家表演了如何吃掉对手的“死活题”​。被誉为日本电脑之父,1970年成为富士通董事长的池田敏雄,在日本棋院的杂志《棋道》中表示:“可见围棋的本质非常深奥,因为围棋蕴含着很多永恒的问题”。电脑刚刚起步,他们就​期待和幻想着能通过电脑解读围棋。

此后出现了个人电脑之后,很多人就可以购买电脑,​然后电脑软件的围棋大会也随之召开。不过棋力最高也只达到了15级,相较于人们的热情,水平却很难看到​显著提升。

围棋虽然起源于中国,但是日本棋手在明治时期之后​传播于海外。就连爱因斯坦都很喜欢下围棋,在欧美国家很多理科专家​都对围棋很感兴趣。1997年美国IBM公司击败了​国际象棋世界冠军之后,很多研究者就开始研究起了围棋。但是相较于64格的国际象棋,19路盘的围棋范围更大,庞大的变化量使得研究者们​寸步难行。

到了2006年,出现了蒙特卡洛模拟算法,以及像树形图一样的树木检索合成的“蒙特卡洛树搜索”​的新技术。每一个局面出现新的手段之后,就会大量模拟出下到最后的局面。这个时候把胜率较高的手段作为之后的手段​。如果算不清变化的话,就用实力和对手抗衡的​技术。

但是完全是​随机,所以就会出现毫无精准度的手段。所以后来就让软件学习小跳或者小飞,这种经常出现的“好手”。这样一来选择就集中在了一些看上去还不错的手段,效率变高的同时准确性也​随之提升。采用新手段的法国研究者Rémi Coulom开发的Crazy Stone,终于将围棋软件的实力提升到了人类的业余1段水平。

于是其他开发者也引进了​这个技术,在这当中有突出表现的是日本的Zen。开发者将人类下棋时,将意识到和没意识到的手段,像说明书一样的对每一个板块逐一进行编程。这种日本人独有的匠人精神,使得Zen的实力突飞猛进,到了2012年达到了日本业余6段,能和业余强豪一决高下的水平。

即便如此,在和职业棋手之间还有3~4子​的差距。围棋软件的成长也到了极限,在开发者之间,开始摸索起了全新的技术革命。

标签: #蒙特卡洛树算法程序