让围棋AI腾飞的蒙特卡洛算法——围棋AI进化史（1）

找借口安静 07-16 225

前言：

当前姐妹们对“蒙特卡洛树算法程序”大约比较关注，各位老铁们都想要学习一些“蒙特卡洛树算法程序”的相关内容。那么小编同时在网摘上汇集了一些关于“蒙特卡洛树算法程序””的相关文章，希望你们能喜欢，朋友们一起来了解一下吧！

原址：

原题：囲碁AI飛躍させたモンテカルロ木探索　長かった黎明期

摘自：日本经济新闻

作者：大桥拓文六段

翻译和整理：找借口安静这个好像周更？

现在的围棋AI已经远远超过了人类的实力，从今天开始由大桥拓文介绍电脑围棋的历史和进化的过程。

5年前，英国DeepMind团队开发的围棋AI“AlphaGo”突然横空出世，击败了韩国顶尖棋手李世石九段。如今AI的实力已经远远超过了人类的水平，实际上围棋AI从黎明期就开始了开发。

最早的围棋软件出现在上世纪60年代的美国，当时的实力大概是38级。日本国内刚刚入门的爱好者，大概是从30级开始起步的，所以说38级这个水平，就很难说是会下围棋了。还有很多棋是下在下一手棋就能被对手吃掉的地方。

日本也从上世纪60年代后期开始开发围棋软件，1970年的大阪世博会中，富士通公司准备了一台像柜子一样大的电脑，向大家表演了如何吃掉对手的“死活题”。被誉为日本电脑之父，1970年成为富士通董事长的池田敏雄，在日本棋院的杂志《棋道》中表示：“可见围棋的本质非常深奥，因为围棋蕴含着很多永恒的问题”。电脑刚刚起步，他们就期待和幻想着能通过电脑解读围棋。

此后出现了个人电脑之后，很多人就可以购买电脑，然后电脑软件的围棋大会也随之召开。不过棋力最高也只达到了15级，相较于人们的热情，水平却很难看到显著提升。

围棋虽然起源于中国，但是日本棋手在明治时期之后传播于海外。就连爱因斯坦都很喜欢下围棋，在欧美国家很多理科专家都对围棋很感兴趣。1997年美国IBM公司击败了国际象棋世界冠军之后，很多研究者就开始研究起了围棋。但是相较于64格的国际象棋，19路盘的围棋范围更大，庞大的变化量使得研究者们寸步难行。

到了2006年，出现了蒙特卡洛模拟算法，以及像树形图一样的树木检索合成的“蒙特卡洛树搜索”的新技术。每一个局面出现新的手段之后，就会大量模拟出下到最后的局面。这个时候把胜率较高的手段作为之后的手段。如果算不清变化的话，就用实力和对手抗衡的技术。

但是完全是随机，所以就会出现毫无精准度的手段。所以后来就让软件学习小跳或者小飞，这种经常出现的“好手”。这样一来选择就集中在了一些看上去还不错的手段，效率变高的同时准确性也随之提升。采用新手段的法国研究者Rémi Coulom开发的Crazy Stone，终于将围棋软件的实力提升到了人类的业余1段水平。

于是其他开发者也引进了这个技术，在这当中有突出表现的是日本的Zen。开发者将人类下棋时，将意识到和没意识到的手段，像说明书一样的对每一个板块逐一进行编程。这种日本人独有的匠人精神，使得Zen的实力突飞猛进，到了2012年达到了日本业余6段，能和业余强豪一决高下的水平。

即便如此，在和职业棋手之间还有3~4子的差距。围棋软件的成长也到了极限，在开发者之间，开始摸索起了全新的技术革命。

本文地址：http://www.longkongtuishu.com/ca5f4BA1sBloCCFc.html

标签： #蒙特卡洛树算法程序

让围棋AI腾飞的蒙特卡洛算法——围棋AI进化史（1）

自学围棋的AlphaGo Zero，你也可以用PyTorch造一个｜附代码

让围棋AI腾飞的蒙特卡洛算法——围棋AI进化史（1）