龙空技术网

CAAI智库 | 让计算机博弈在我国生根、开花和结果

中国人工智能学会 378

前言:

眼前看官们对“uct算法金融”大概比较重视,咱们都需要分析一些“uct算法金融”的相关内容。那么小编在网上收集了一些关于“uct算法金融””的相关知识,希望同学们能喜欢,看官们一起来学习一下吧!

原创: 徐心和、王亚杰 今天

文 | 原刊于中国人工智能学会通讯

文 | 2019年第9卷第01期

图 | 源自网络

计算机博弈(Computer Games)也称为机器博弈,就是让计算机能够像人类一样思维、判断和推理,做出理性决策,与人类选手或另一台计算机进行各种棋类的对弈。它是人工智能领域的重要应用,是人工智能挑战性课题,是研究人类思维和实现机器思维最好的实验载体,是人工智能研究的“果蝇”。当谷歌公司的AlphaGo、Master、Alpha Zero 接连横空出世,这一里程碑成果在学术界产生了空前的影响,它既是机器博弈发展史上的重大胜利,也是人工智能发展史上的一次大的跃迁。

中国机器博弈起步较晚,首先值得一提的是中山大学化学系教授陈志行老先生,他编写了围棋博弈程序《手谈》,并且赢得了1995—1997 连续3 年的6 项世界冠军,成为机器博弈史上的一朵奇葩;再值得提及的便是许峰雄博士,在台湾大学毕业后到美国卡内基梅隆攻读博士学位,特别钟爱国际象棋计算机博弈,毕业后到IBM 公司组织了深蓝课题组,并在1997 年以战胜卡斯帕罗夫的辉煌战绩赢得了世人的尊重;另外,台湾交通大学资讯工程系吴毅成教授的团队,也多年潜心开展机器博弈研究,发明了六子棋,并在国际赛场上取得优异成绩。

计算机博弈在中国大陆虽然姗姗来迟,但发展非常迅速。2005 年,中国人工智能学会成立了机器博弈专业委员会(简称“专委会”),一批热心这一领域的科技工作者开始学习国际的先进理论与算法。2006年,专委会于北京科技馆组织了首届中国象棋计算机博弈锦标赛,期间举办了人机大战,以东北大学的“棋天大圣”为首的5支代表队挑战了中国象棋的顶尖高手许银川、柳大华、徐天红、卜凤波等特级大师,并取得势均力敌的战绩,令国人刮目相看。“棋天大圣”代表队还夺得了由ICGA 组织的2006、2007 年国际棋类奥林匹克大赛中国象棋冠军。

2008 年,专委会在北京举办了ICGA国际计算机博弈大赛,有14 个国家的71支代表队参赛,是水平非常高的一次国际赛事,向世界传递了中国机器博弈研究的声音,也展示了中国参赛队的风采。

2010 年,专委会与教育部高等学校计算机类专业教学指导委员会联合主办了首届全国大学生计算机博弈大赛暨全国锦标赛,共有18 所高校的53 支代表队参赛。此次赛事在全国高校产生了非常好的反响与效果,吸引了更多的高校师生参与到机器博弈研究浪潮中。

2015 年,该竞赛被国家体育总局棋牌运动管理中心列入第三届全国智力运动会项目,并在中国棋院(北京)举行赛事,共有40 余所高校220 多支代表队参赛。计算机博弈与棋牌运动良性互动、相互促进,共同追求更高、更快、更强的奥林匹克精神,此次赛会进一步扩大了比赛的影响力和知名度。

计算机博弈竞赛在我国已走过12 年,该竞赛坚持以学生喜闻乐见、娱乐性强、高对抗性、挑战无穷的棋牌游戏为研究载体,以理论与实际系统构建相结合为原则,旨在调动大学生学习与研究热情,激发大学生创新潜能,促进人工智能创新人才培养。由表1 可以看出,目前竞赛项目从中象1 个项目,到19 个比赛项目;从不足10所高校,到50 多所高校5 000 余师生参与;从完全信息博弈(棋类),到不完全信息博弈(牌类);从没有棋谱规范到制定了棋牌谱标准并共享数据。目前我国已是计算机博弈大国,但还不是强国。

表1 2006-2018年中国计算机博弈竞赛数据

典型的计算机博弈系统主要包括博弈平台和搜索引擎两大模块。其中,博弈平台主要负责界面显示、棋规判断、行棋过程控制、信息传递等,在其设计过程中,通常考虑通用性、易用性、健壮性、艺术性;博弈引擎主要负责知识学习、开(或残)局库设计 、棋局评估、博弈树搜索、着法生成等。在整个系统中,搜索算法和评估函数是核心部分。

围棋因其空间复杂度极大、局面非常难于评价等问题被认为是完备信息棋类博弈中的最后堡垒,围棋博弈技术经历了Alpha-Beta 搜索、静态方法、UCT 算法、深度学习算法等过程。谷歌公司的AlphaGo通过深度学习与蒙特卡洛树搜索算法的结合,构建策略网络和估值网络,实现了招法选择和局势评价;同时提出了一种异步分布式并行算法,使其可运行于CPU/GPU集群上。AlphaGo Zero 则通过自我博弈的强化学习进行训练,达到了更好的博弈效果,此算法也被成功应用在国际象棋和日本将棋上。国内的西安电子科技大学的学子也将Alpha Zero 算法应用在五子棋和不围棋博弈中,分别获得中国大学生计算机博弈大赛的冠军和亚军。

在完备信息博弈研究方面,已经取得了许多惊人的成果,但对于军棋、麻将、桥牌、扑克等非完备信息博弈,以及具有模糊性和随机性的不确定性博弈,虽然在基于案例的策略研究方面有了一定进展,但因其相关理论研究还不成熟,相应的程序智力有限,仍难以战胜人类真正的高手。因此,在非完备信息和不确定性机器博弈方面,具有高效学习与抽象思维能力的博弈技术还有待进一步研究。

机器博弈的产业化前景也是很可观的。AlphaGo 的成功,使得深度学习算法在各个领域得到广泛重视和应用。丰富多彩的博弈搜索算法无疑可以应用到面对决策优化的各种场合。随着不完全信息博弈、随机环境博弈搜索算法的不断完善,也将在兵棋推演、战略、战役与战术博弈中加以应用。博弈是人类经济、政治、军事、反恐、治霾和日常生活中无所不在的内容,机器博弈的概念和技术也必然大有用武之地。

希望广大师生能够将互联网+、大数据、云计算等先进科学技术引进到计算机博弈中,让计算机博弈活动在更多的学校生根、开花和结果;希望各高校能使计算机博弈项目成为人工智能人才培养的落地项目,不忘教育初心,拥抱AI 时代。同时借助计算机博弈活动,促进产学研相结合,推动我国人工智能技术的发展,加速我国早日成为人工智能领域的大国和强国。

作者简介

徐心和

东北大学教授,博士生导师。中国人工智能学会机器博弈专业委员会荣誉主任,CAAI Felow。曾任国际机器博弈协会(ICGA)副主席,中国人工智能学会常务理事、机器博弈专业委员会主任。发起并组织中国机器人大赛、中国大学生计算机博弈大赛暨中国机器博弈锦标赛。获2012 年吴文俊人工智能科学技术创新奖二等奖。

王亚杰

沈阳航空航天大学教授,辽宁省教学名师。中国人工智能学会常务理事、机器博弈专业委员会副主任。2013—2018 年负责组织每年的中国大学生计算机博弈大赛暨中国机器博弈锦标赛。获2012 年吴文俊人工智能科学技术创新奖二等奖。

标签: #uct算法金融