龙空技术网

从Alpha Go到元萝卜,人类冠军输给了AI但赢得了时代

澎湃新闻 1963

前言:

如今兄弟们对“alpha go源代码”大致比较关心,你们都想要学习一些“alpha go源代码”的相关知识。那么小编也在网摘上网罗了一些对于“alpha go源代码””的相关文章,希望你们能喜欢,朋友们快快来了解一下吧!

“没想到,没想到……这下难弄了”在看到对手走出一步“炮4平3”的怪棋后,有着“胡司令”之称的中国象棋泰斗胡荣华在解说席上连连感叹,而在场上被这一着怪棋难住的,正是他的得意门生,中国象棋特级大师、第48届全国象棋个人锦标赛冠军谢靖。

AI棋手再次战胜人类

而把谢靖难住的这位对手,其实并不是什么知名的象棋大师,而是一台售价仅为1999元的民用级别的机器人——由商汤科技所开发的“元萝卜SenseRobot”AI下棋机器人。这个场景,出现在商汤科技与上海棋院联合举办的首场“元萝卜杯人机巅峰对决”挑战赛上。“元萝卜”根据AI水平设置了26个难度等级,谢靖所对决的,正是“元萝卜”最难的26关。谢靖一贯以来以“稳”字著称,在他的老师胡荣华看来,AI不会犯错,与AI对手对决,最重要的就是每一步都需要心思缜密,稳扎稳打,谢靖的“稳”就是这次对决中的关键。

谢靖善于防守,策略上追求稳中求胜,在行家看来,这应该是挑战AI的最适当的战术。

谢靖开局不差,被胡司令评价为“堂堂正正”,但随着“元萝卜”的这一着怪棋,这位特级大师陷入了沉思,随后场上局面便急转直下。随着约定的30分钟时限将至,面对越来越差的残局,谢靖最终无奈认负,这一次人类在中国象棋领域挑战AI的尝试也终于告负。而在他之前,15岁的青少年象棋冠军顾博文也尝试挑战了16关的“元萝卜”,同样遗憾告负。

AI能成为一个好陪练,但不是教练

赛后,谢靖表示,“元萝卜”的“思路非常奇特”,棋行险着,这一点与人类对手非常不同。他表示,这对他而言也是一次特别的体验,平时训练他们很少真正与AI对弈,更多的是利用电脑来做棋局分析。而胡荣华也表示,如今看来AI无疑在算法层面要超过人类,但AI下的棋并没有到人类看不懂的地步,“如果看不懂,那就说明差距大了”。他认为,AI相比人类,最大的优势就是不会疲劳,不会犯错,而这一点在高水平的对弈中就非常关键。

那么,如果AI的“棋力”已经超过了人类,是否意味着象棋、围棋这类运动失去了意义?在这一点上,谢靖和胡荣华的观点是一致的:当然不是。机器的速度、力量早已超越了人类,但这也不影响在运动场上人类仍然在追求自己体能的极限,而在脑力运动领域也同样如此。谢靖表示,自己当初学象棋,到现在成为职业选手,最大的原因就是“乐趣”。象棋对弈的过程本身无论胜负,都是充满着思考、博弈的乐趣的,这种乐趣本身就足以支持着这项运动继续发扬光大。而在胡荣华看来,除了乐趣之外,AI在实践中还是不能真正成为一名好的“象棋教练”,因为教练还是需要人与人之间的相互了解与沟通,需要多方面的个性化关怀,根据选手的实际情况制定有温度的训练方案。但是,未来AI可以成为一名特别好的“陪练”。

“它可以把我们前人下的所有好棋都记住,下坏了的就排除,所以很厉害。”胡荣华表示。“有这个陪练,可以省去很多的麻烦,中国女排也好,其它的体育项目也好,在训练过程中,陪练是非常关键的。”他认为,未来如果有对象棋感兴趣的小朋友,想要系统性的学习,这个“元萝卜”机器人就完全可以担当陪练的角色。在此基础上,小朋友还是需要一位真正的教练对其指点,帮助其分析、理解、解释目前棋局,这样他的成长会很快。“而且它不需要小朋友一直盯着屏幕,而是跟机器人下一盘实体的棋,这种体验挺好的。”对此,谢靖补充道。

从Alpha Go到“元萝卜”,有什么不一样

由这一次中国象棋的“人机大战”,人们很容易联想到在2016、2017年,谷歌旗下DeepMind公司开发的Alpha Go与李世石、柯洁等人类冠军所进行的围棋“人机大战”。对于人们“元萝卜”和Alpha Go两项“大战”的对比,商汤科技创新工程院院长沈徽表示:“我们面临的挑战跟AlphaGo有点不太一样,AlphaGo是一个实验室的产品,当时它上线跟人类棋手对决的时候,用了数千块的GPU加CPU,光这个东西的成本按今天的价格可能都是好几千万,这还不是最重要的,后面还有一大票非常高精尖的技术人才去做支持。我们要在一个2000块钱左右的价格区间内做出一款产品,它要有足够好的质量,足够交互,足够好的应用,其实这是我们面临的很大的一个挑战。”

除了在AI算法上的区别,“元萝卜”与Alpha Go的另一个重要区别,是在交互体验上。Alpha Go要实现与人类对弈,还是需要一个人来帮它“走棋”的,而“元萝卜”作为一款家庭用产品,显然需要更好的交互体验,能让它自己与人下棋。“我们必须要把它做成一个可以自动走棋的产品,需要把它做成个机器人,其实这是我们面临的另外一个挑战。”

沈徽表示,商汤是率先把用于家庭交互式的机械臂机器人带到千家万户的,做的是“从0到1”的事情。而这其中最重要、也是最难实现的是两点:第一必须保证它要接近完美地完成任务,比如抓取棋子这个动作,如果一盘棋40步、38步机器人都能走,有两步需要人帮挪一下——这种情况在实验室环境下没有问题,但对实际用户来说,这样走棋就变得索然无味了。第二是价格,商汤给这款产品设定的价格区间就是2000元上下,而当下市场上并没有现成的如此低成本的、能完美运作的机械臂产品,这里面很多零件都是由商汤自己设计、制造出来的。

为什么要做这样一个机器人?为什么选择象棋?面对这个问题,沈徽表示,商汤一直在尝试积极推动AI技术赋能和发扬传统文化。他认为,机器人也可以成为中国传统文化内容的承载物,通过AI机器人传达传统文化,使新一代年轻人和孩子更容易接受。“以往商汤有大量的to B的AI类型的应用或赋能型的平台进入到产业界,我们觉得现在AI的技术已经到了一个程度,它能够有条件进入到to C消费类的市场……象棋其实是个很好的形式,因为象棋本身就流传了一千多年,说明它具有很强的生命力,也很有趣味性,同时又有益智功能。”在“元萝卜”上市后,收到了许多用户的好评,并积极地期待他们推出迭代产品,“包括询问有没有围棋、国际象棋飞行棋等等,还有问能不能打麻将、打扑克牌,如果能打麻将的话,一个人买三台,这样一个人就可以打麻将……”沈徽表示,对于这些建议和要求,他们都看到了,也在评估可行性。

结语:

当前的时代,科技进步速度日新月异。但是,包括AI在内的科技,说到底只有尽可能地“平民化”,才能触及和服务每一个人。商汤的这次“人机大战”,创新展示了AI改变普通人生活的另一种可能,而只有能让所有人都能轻松使用并受益的AI技术,才有可能获得更广阔的发展空间。

标签: #alpha go源代码