龙空技术网

前阿里P10打造的星际AI,现在向顶级人类职业选手发起挑战

量子位 2354

前言:

今天咱们对“天猫动态算法是什么”大致比较珍视,我们都需要学习一些“天猫动态算法是什么”的相关内容。那么小编在网络上收集了一些对于“天猫动态算法是什么””的相关文章,希望你们能喜欢,兄弟们快快来了解一下吧!

允中 发自 凹非寺

量子位 报道 | 公众号 QbitAI

围棋之后,决智星际。

目前在人机对战领域,即时对抗类游戏《星际争霸》正在成为AI玩家们的新挑战对象。

这不,中国人工智能平台公司、前阿里淘宝推荐算法团队创始人袁泉(算法P10)创办的启元世界将摆下另一场擂台,迎战人类顶级职业选手。

《星际争霸I/II》全国冠军黄慧明(TooDming),以及首位晋级世界锦标赛全球总决赛的中国大陆选手、2018年《星际争霸II》黄金总决赛冠军李培楠(TIME),将成为此次人机大战的人类代表。

此前,相比于已经被AlphaGo彻底征服的围棋,《星际争霸》是一块更加难啃的“硬骨头”,即使与AlphaGo师出同门的AlphaStar也尚未彻底征服人类职业选手。

AlphaStar与人类职业选手的第一次对战放出的是测试比赛录像,并在一盘现场对战中失利。后来AlphaStar为了防止被职业玩家抓住漏洞,匿名参加《星际争霸II》欧洲天梯对战系统,在与大师和宗师级选手的比赛中互有胜负。

作为即时对抗类游戏,《星际争霸》中玩家必须做出毫秒级决策;相比于围棋在361个落子点之内的选择和完全信息可见,《星际争霸》的决策空间高达10的26次方并充满了战争迷雾;相比于《DOTA2》、《王者荣耀》的5对5英雄对战,《星际争霸》涉及200个单位的战役、战术策略博弈和经济、科技发展决策,所以对AI极具挑战性。

《星际争霸》考验的是AI全方位的综合能力,既要能看得懂游戏态势,又要能深刻理解敌我局面,还要在正确的时间做出正确的决策,根据对方行动随机应变。这要求AI不仅能实时感知、认知环境,还需要适应环境,做出数千步连续决策以求得胜利。

所以,通过《星际争霸》训练出来的AI更接近各个行业真实的应用场景:环境复杂多变、策略空间巨大、响应时间实时,而AI可以在此类复杂场景中甄别、提取有效信息,在信息不完全情况下进行推理和决策。

这也是为何目前包括DeepMind、Facebook在内的顶尖研究机构,将目光锁定《星际争霸》的核心原因。

而作为2017年创办的公司,启元世界曾披露过最新技术进展——仅使用了DeepMind AlphaStar 1%的算力,就已经达到人类顶级高手的水平,并敢于在公平设定下(与人类选手近似的APM操作限制),在线下公开与顶级职业选手进行实时对战。

这也是此次敢于向顶尖人类职业选手发起挑战、并现场直播的原因。

最后,再简单介绍一下这家前阿里P10创办的公司。

启元世界创办于2017年8月,致力于打造智能体产品,并把智能体带入每个行业、每个家庭、每个人,提升产业效能和生活体验。公司团队核心成员来自BAT、Netflix、IBM、香港科大、伯克利等国内外知名高科技企业和一流学府,屡获NeurIPS、CVPR等国际竞赛大奖。

核心创始团队成员来自阿里。

袁泉,离职前担任阿里认知计算实验室负责人、资深总监,是手机淘宝、手机天猫推荐算法团队缔造者,2013年到2016年期间率队打造了“千人千面”的手淘推荐系统,因此还拿下了当年双11的CEO特别贡献奖。“有好货”、“猜你喜欢”等电商个性化产品,均出自其间。

加入阿里前,袁泉是IBM中国研究院的研究员,从事推荐等智能决策算法的研究,是IBM2011年全球银行业FOAK创新项目发起人。

学术方面,还有十余篇论文中标国际顶级会议ACM RecSys、KDD、SDM等,拥有多项中美技术专利,长期担任ACM RecSys审稿人、IEEE Transaction on Games审稿人。

龙海涛则是袁泉阿里和IBM中国研究院的老战友。在2013-2017年期间,龙海涛在阿里巴巴负责搜索广告业务的架构设计,主导了其核心的离线系统、在线引擎和索引内核的升级换代,并因此获得了阿里妈妈“最佳团队奖”、“最佳项目奖”和“双十一个人创新特别奖”。

IBM研究院期间,他则从事移动计算方面的研究。之后还有过多年成功的技术创业经历,为电信、银行、能源等大型企业提供过IT解决方案。

目前,袁泉和龙海涛已经组建起了一支几十人规模的团队,在位于北京海淀区的办公室,整日“吃饭睡觉打游戏”,以及搞AI。

另外,本次人机大战的具体时间为:2020年6月21日下午2点。

如果你对此次对战或启元AI还有其他问题,也欢迎留言交流。

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

标签: #天猫动态算法是什么