龙空技术网

当AI学会了打麻将,人类高手们还能“吃胡”吗?

南方+客户端 147

前言:

今天朋友们对“麻将ai胡牌算法”可能比较讲究,各位老铁们都想要知道一些“麻将ai胡牌算法”的相关文章。那么小编也在网络上网罗了一些对于“麻将ai胡牌算法””的相关资讯,希望你们能喜欢,小伙伴们一起来学习一下吧!

7 月 11 日,腾讯宣布自研棋牌类 AI “绝艺LuckyJ” 在国际知名麻将平台“天凤”上已经达到十段水平,刷新了 AI 在麻将领域的最好成绩。

资料显示,日本在线麻将竞技平台“天凤”创建于 2006 年,拥有体系化的竞技规则和专业段位规则,受到职业麻将界的广泛认可。截至目前,天凤平台活跃人数 23.8万,而能达到十段的仅 27 人(含AI),不到万分之一。相比其他麻将AI和人类玩家,“绝艺 LuckyJ”不仅稳定段位更高,从零开始达到十段所需的对战局数也明显更少,仅需要 1321 局。

腾讯 AI Lab 研究员表示,现实世界中充满了需要在非完美信息状态下做决策的场景,比如金融交易、自动驾驶、交通物流、拍卖系统等。在游戏环境中推进决策AI的能力,最终是希望AI能从虚拟走向现实,解决真实世界的复杂问题。此前,游戏在人工智能技术的演进中发挥了重要的作用。游戏多样化的情境为AI的训练和学习提供了便利的研究场景,从国际象棋到围棋,再到德州扑克、王者荣耀等游戏,AI 不断在游戏场景中拓展能力边界。

围棋、象棋都属于完美信息博弈,参与竞技双方的每次决策,都可以看到全局的信息。AI能够通过强大的计算力来枚举各种可能性,从而找到制胜策略。而麻将无法看到对手的手牌,加上还有大量未揭开的牌,存在大量的隐藏信息,是典型的非完美信息博弈。

据介绍,麻将一共有136张牌,每一位玩家只能看到很少的牌,包括自己的13张手牌和所有人打出来的牌。牌局开始时,另外三位玩家的手牌以及墙牌都是看不到的,面对如此多的隐藏未知信息,麻将玩家的每一个决策都需要兼顾进攻和防守。

此外,在麻将的对战中,除了正常的摸牌、打牌之外,还要决定是否吃牌、碰牌、杠牌、立直以及是否胡牌。任意一位玩家的吃碰杠以都会改变摸牌的顺序,这一过程也涉及了大量的决策。

为了更好地解决麻将游戏中存在的大量隐藏信息的难题,提升AI的决策能力,腾讯 AI Lab基于强化学习和遗憾值最小化的自我博弈技术,使得AI能从零开始自我学习和提高,并最终收敛到一个最强的混合策略,让AI在实际对战的过程中拥有更加平衡的策略能力。

同时,考虑到传统的非完美信息搜索算法在麻将面前很难发挥太大的作用,腾讯 AI Lab基于乐观价值估计的思想,提出了一种高效的非完美搜索方法,使得AI在有海量隐藏信息的游戏状态中,仍可以实时调整当前策略,从而更好地应对多变的战局。

相比人类,“绝艺 LuckyJ“在麻将游戏中,拥有更加平衡的策略,对局势的计算更精确,其中包括打每张牌的期望收益、未来可能胡哪些番型等等,通过这样的“策略”训练,也为AI走入更多行业打下了基础。

天凤平台开发公司C-EGG的CEO角田真吾表示:“这是麻将AI的又一次突破,LuckyJ进一步拓宽了麻将AI的能力边界。令人感到兴奋的是,在特上房包括人类玩家在内的对战1000局以上的所有玩家中,LuckJ的稳定段位排名第一”。

值得一提的是,“绝艺LuckyJ“在国标麻将中也有亮眼表现,在线下职业选手邀请赛中击败六位职业选手,成为首个战胜国标麻将顶尖职业选手的麻将AI。

决策与生成是当前人工智能发展的两大主线,也是研究通用人工智能的必由之路。在模拟真实世界的虚拟游戏中,AI学会快速分析、决策与行动,就能执行更困难复杂的任务并发挥更大作用。从 2017 年开始,腾讯AI Lab自研的绝艺、绝悟两款决策AI,借助棋牌、MOBA等多类游戏场景,探索用AI解决现实中的复杂问题。

南方+记者 叶丹

【作者】 叶丹

【来源】 南方报业传媒集团南方+客户端

标签: #麻将ai胡牌算法