赢了世界冠军不意外 和AI在DOTA中并肩作战才让人又纠结又兴奋

发表于 5年以前  | 总阅读数:533 次

OpenAI CTO Greg Brockman 和 OG 战队五位成员的合影

“OpenAI Five”首先对阵了 2018 年 DOTA2 世界邀请赛(Ti 8)冠军 OG 战队,在三局两胜的比赛中以 2:0 完胜 OG 战队。接下来,OpenAI 安排了人机合作比赛,双方都是两名人类选手和 3 个 AI —— 这部分比赛非常耐人寻味,我们猜测人类选手和 AI(如果有思维的话)都会在心里想:我这几个队友是怎么回事、怎么老是和我节奏不一样、这比赛还让人怎么玩。最后,OpenAI 宣布,这个 DOTA2 AI 将会对全世界的 DOTA2 玩家免费开放,下周起就可以体验。

表演赛 Part 1 - “OpenAI Five”vs OG 战队

在去年七八月的表演赛中,“OpenAI Five”就曾在 5v5 比赛中击败人类高水平玩家乃至(前)职业选手。虽然 AI 没能赢下所有场次的比赛,但 AI 的各种亮眼操作(以及 AI 让人摸不着头脑的随地插眼的做法)仍然给大家留下了深刻的印象。在比赛告一段落后,OpenAI CTO Greg Brockman 继续在推特上更新着“OpenAI Five”的最近进展,甚至表示最新的版本已经能够以高胜率击败公开展示过的几个版本了。这样一来,继续优化到今天,尤其是 Greg Brockman 表示“OpenAI Five”在游戏中的训练时间相当于 4 万 5 千年那么长,在今天的比赛中完胜了人类职业战队的世界冠军 OG 战队也就不令人意外了。

需要说明的是,目前最新的“OpenAI Five”仍然使用的是和 Ti8 表演赛中一样的规则:一共 18 个英雄供双方选择,不允许使用圣剑和魔瓶,不允许使用召唤物和幻象。我们似乎更有理由相信 AI 在这样的设定下获胜是合理的:在这个复杂度降低的设定中,AI 经过了足够长时间的训练,已经可以逼近某个最优解了 —— 相比之下人类职业选手就肯定不习惯这样的设定了,仅英雄选择一方面就大大限制了人类选手的发挥。

另一方面,去年表演赛结束后我们结合 OpenAI 公开的资料分析过“OpenAI Five”的设计方式,结合今天“OpenAI Five”的表现来看,他们很有可能是维持了同样的模式,最大的改进在于更多的训练时间。

在第一局中,OG 阵容选出的阵容是小牛、巫医、隐刺、毒龙、影魔,“OpenAI Five”为冰女,死亡先知,火枪,矮人直升机,流浪剑客。一选时“OpenAI Five”预估的自己的胜率为 65.1%,全部选择完毕之后还继续上升到了 67.6%。

比赛一开始 AI 方就在天辉上路赏金符处拿到了一血,然后在公屏打字“我们预期赢得这场比赛的胜率超过 80%”(就和去年的表演赛一样)。AI 方的线上进攻依旧主动凶狠,即便 OG 有小牛在各路积极游走和保护、而且 AI 方也没有针对隐刺买眼买粉而让他占了不少便宜,双方在前十几分钟仍然打得势均力敌。随着比赛进行,AI 方的经济和击杀数逐渐建立起优势,最终 38 分钟时夜魇方基地被攻破,AI 方与 OG 的人头比为 52:29。

第二局比赛中 OG 阵容为火枪、小牛、死亡先知、小鱼人、恶魔巫师,“OpenAI Five”阵容为冰女、矮人直升机、流浪剑客、巫医、毒龙。这次“OpenAI Five”选人完毕时的预测胜率只有 60%,但 OG 在对线期就打出了很大劣势,最终这局比赛 14 分钟上高地、 20 分钟就以 45:6 的人头比结束了。这一点想起来很有趣:“OpenAI Five”认为这次开局时自己的优势不如上一局大,但针对的是自己在操作这样阵容的情况做出的判断,显然没有预料到人类的表现和自己大有不同。

AI 也继续展现了亮眼的团战操作。比如下面动图,第一局比赛中 OG 小牛和隐刺绕后冰女,结果在 AI 的火枪配合下隐刺和巫医双双被反杀,OG 的影魔也葬身之后才最终带走了冰女。

第二局中,AI 的冰女利用暗影护符和地形卡视野黑血秀 OG 的矮人狙击手,并成功反杀。

AI 当然也继续表现出了秒沉默之类的快速反应,但其实除了这些之外,更令人意外的是“OpenAI Five”表现出的比赛风格。比如所有英雄都会正常发展自己的经济,冰女甚至几分钟时就会自己打野,可以说这和中国 DOTA 战队中常见的“四保一”打法形成鲜明对比,在前中期团战时发挥出了不小威力;等级低时 AI 的英雄经常死亡后立即买活,简直像是人类玩家在赌气。

两局比赛结束后,OpenAI 还透露,在准备今天表演赛的过程中 OpenAI 还邀请了三支一线 DOTA2 战队尝试挑战 AI,全部都以 2:0 负于“OpenAI Five”。OG 战队今天的表现,对 OpenAI 来说可以说是完全在预料之中了。

表演赛 Part 2 - 人类和“OpenAI Five”并肩作战

不知道大家是否记得,2017 年五月 AlphaGo Master 在中国乌镇对局柯洁的时候,在同一个峰会中也安排了人类棋手和 AlphaGo 的配对赛,古力和连笑两位棋手分别和 AlphaGo 组成小组,双方对局中人类和 AlphaGo 轮流落子。两位棋手赛后都表示 AlphaGo 和自己的思路、风格不一样,经常下出让自己感到意外的棋来 —— 类似的事情自然也会在今天的“OpenAI Five”表演赛中出现。

人机合作比赛双方都是两名人类选手和 3 个 AI,四位人类选手都是游戏解说,所以作为表演赛,他们就像直播一样,一边比赛一边对着所有观众说出自己的所想。在解说们这种边玩边吐槽、也边玩边期待 AI 和自己配合的过程中,大家对这个 AI 都有了很多全新的感受:

  • 最根本的,其实 AI 并不知道自己的队友有一些不是 AI,它仍然会好像自己的队友都是和自己一样的 AI 那样去处理,也许 AI 也会觉得不适应?但反过来,即便人类控制的英雄已经出现过很多低级错误,我们相信 AI 仍然可以像相信 AI 队友那样地相信他。
  • 对出击策略的把握有很大区别,人类选手在河道吃了隐身符准备对对方中路英雄发动攻击的时候, 自己中路的 AI 却径直去了边路;人类选手表示很郁闷。
  • 人类无法捉摸 AI 的步调,不知道 AI 是否认为己方是优势、是否应该主动攻击。那么理想情况下人类应该如何和 AI 沟通呢,肯定不会总是听人类的、也不会总让 AI 带领节奏。实际上 AI 有时候会 直接打字告诉人类自己的决定(比如自己要打 1 号位),但是对人类发的信息就不怎么做出反应(简直像是人机交互的负面案例)

  • 和以前一样,AI 的插眼方式很奇怪 —— 这可能是相比去年的版本,唯一没有显著提升的方面,我们完全可以猜测这是因为训练插眼时用的反馈仍然是“要留出空格子来”。Blitz 甚至直接问“上路到底发生什么了,为什么地上插了 4 个眼???”另一方的人类选手 Sheever 说:“我们的 AI 总把眼插在奇怪的地方,但是我想插都买不了,一直在冷却。”(后来 AI 在这里又插了一个眼,一共 5 个)
  • AI 对某些英雄的理解和人类完全不同。比如 AI 认为死亡先知在十到二十分钟的时间段内是一个非常强的英雄,会让它非常积极地使用技能、参与团战。但人类就会认为这时候的死亡先知并不厉害。
  • 有观战者根据 AI 的表现猜测影响 AI 战场决策最重要的因素是站位和技能冷却;同时 AI 也确实会考虑自己队友的位置。也所以,人机合作比赛的节奏要明显慢于五人都是 AI 的状况 —— 两个人类队友的位置和其它三个 AI 的节奏不一致,它们的集体组队进攻也就没有那么积极果断了。
  • AI 在树丛里找人的技术好像不怎么样,当然了这件事本来学起来也比较难。另外人类也很难在和 AI 对局的时候练习这个方面,人类在逃命的时候会有一些“下意识”的操作,但是很难说 AI 的处理方式是出于什么样的原因。
  • 人类选手之一的 Blitz 在比赛中说:“不管我走的哪一路,去了以后都感觉自己好像走错路了。从这个角度来说,和 AI 一起玩还挺难受的。但是如果我去哪的时候 AI 也一起来了,那我就感觉挺好的。仿佛是一边打游戏一边解谜一样。”

表演赛 Part 3 - 人人都可以挑战“OpenAI Five”

在赛前的开场演讲中,Greg Brockman 说到要通过“OpenAI Five”展示 AI 有高能力水平、高可拓展性,以及可以增强人类的能力。在前面 Part 1 的人机对战和 Part 2 的合作对战中,算是展现出了高能力水平以及一部分“可以增强人类的能力”,那么在 Part 3,我们终于看到了“高可拓展性”意味着什么:每个人都可以和 OpenAI 的 DOTA2 AI 对战,可以是作为对手,也可以作为自己的队友,下周开始,在 arena.openai.com 注册即可体验!

在表演赛结束后的讨论中,有人提到阻碍“OpenAI Five”这样的高水平竞技 AI 大规模普及的最大障碍之一显然是它需要的训练时间太长,Greg Brockman 也在推特上回应道解决这个问题会是他们的下一个目标。显然根据这次表演赛来说,除了这种深度学习技术方面的继续钻研,人类和 AI 如何高效地沟通、并肩合作也已经是一个浮出水面的问题。我们期待 OpenAI 未来也在这方面带来一些惊喜。

 相关推荐

刘强东夫妇:“移民美国”传言被驳斥

京东创始人刘强东和其妻子章泽天最近成为了互联网舆论关注的焦点。有关他们“移民美国”和在美国购买豪宅的传言在互联网上广泛传播。然而,京东官方通过微博发言人发布的消息澄清了这些传言,称这些言论纯属虚假信息和蓄意捏造。

发布于:1年以前  |  808次阅读  |  详细内容 »

博主曝三大运营商,将集体采购百万台华为Mate60系列

日前,据博主“@超能数码君老周”爆料,国内三大运营商中国移动、中国电信和中国联通预计将集体采购百万台规模的华为Mate60系列手机。

发布于:1年以前  |  770次阅读  |  详细内容 »

ASML CEO警告:出口管制不是可行做法,不要“逼迫中国大陆创新”

据报道,荷兰半导体设备公司ASML正看到美国对华遏制政策的负面影响。阿斯麦(ASML)CEO彼得·温宁克在一档电视节目中分享了他对中国大陆问题以及该公司面临的出口管制和保护主义的看法。彼得曾在多个场合表达了他对出口管制以及中荷经济关系的担忧。

发布于:1年以前  |  756次阅读  |  详细内容 »

抖音中长视频App青桃更名抖音精选,字节再发力对抗B站

今年早些时候,抖音悄然上线了一款名为“青桃”的 App,Slogan 为“看见你的热爱”,根据应用介绍可知,“青桃”是一个属于年轻人的兴趣知识视频平台,由抖音官方出品的中长视频关联版本,整体风格有些类似B站。

发布于:1年以前  |  648次阅读  |  详细内容 »

威马CDO:中国每百户家庭仅17户有车

日前,威马汽车首席数据官梅松林转发了一份“世界各国地区拥车率排行榜”,同时,他发文表示:中国汽车普及率低于非洲国家尼日利亚,每百户家庭仅17户有车。意大利世界排名第一,每十户中九户有车。

发布于:1年以前  |  589次阅读  |  详细内容 »

研究发现维生素 C 等抗氧化剂会刺激癌症生长和转移

近日,一项新的研究发现,维生素 C 和 E 等抗氧化剂会激活一种机制,刺激癌症肿瘤中新血管的生长,帮助它们生长和扩散。

发布于:1年以前  |  449次阅读  |  详细内容 »

苹果据称正引入3D打印技术,用以生产智能手表的钢质底盘

据媒体援引消息人士报道,苹果公司正在测试使用3D打印技术来生产其智能手表的钢质底盘。消息传出后,3D系统一度大涨超10%,不过截至周三收盘,该股涨幅回落至2%以内。

发布于:1年以前  |  446次阅读  |  详细内容 »

千万级抖音网红秀才账号被封禁

9月2日,坐拥千万粉丝的网红主播“秀才”账号被封禁,在社交媒体平台上引发热议。平台相关负责人表示,“秀才”账号违反平台相关规定,已封禁。据知情人士透露,秀才近期被举报存在违法行为,这可能是他被封禁的部分原因。据悉,“秀才”年龄39岁,是安徽省亳州市蒙城县人,抖音网红,粉丝数量超1200万。他曾被称为“中老年...

发布于:1年以前  |  445次阅读  |  详细内容 »

亚马逊股东起诉公司和贝索斯,称其在购买卫星发射服务时忽视了 SpaceX

9月3日消息,亚马逊的一些股东,包括持有该公司股票的一家养老基金,日前对亚马逊、其创始人贝索斯和其董事会提起诉讼,指控他们在为 Project Kuiper 卫星星座项目购买发射服务时“违反了信义义务”。

发布于:1年以前  |  444次阅读  |  详细内容 »

苹果上线AppsbyApple网站,以推广自家应用程序

据消息,为推广自家应用,苹果现推出了一个名为“Apps by Apple”的网站,展示了苹果为旗下产品(如 iPhone、iPad、Apple Watch、Mac 和 Apple TV)开发的各种应用程序。

发布于:1年以前  |  442次阅读  |  详细内容 »

特斯拉美国降价引发投资者不满:“这是短期麻醉剂”

特斯拉本周在美国大幅下调Model S和X售价,引发了该公司一些最坚定支持者的不满。知名特斯拉多头、未来基金(Future Fund)管理合伙人加里·布莱克发帖称,降价是一种“短期麻醉剂”,会让潜在客户等待进一步降价。

发布于:1年以前  |  441次阅读  |  详细内容 »

光刻机巨头阿斯麦:拿到许可,继续对华出口

据外媒9月2日报道,荷兰半导体设备制造商阿斯麦称,尽管荷兰政府颁布的半导体设备出口管制新规9月正式生效,但该公司已获得在2023年底以前向中国运送受限制芯片制造机器的许可。

发布于:1年以前  |  437次阅读  |  详细内容 »

马斯克与库克首次隔空合作:为苹果提供卫星服务

近日,根据美国证券交易委员会的文件显示,苹果卫星服务提供商 Globalstar 近期向马斯克旗下的 SpaceX 支付 6400 万美元(约 4.65 亿元人民币)。用于在 2023-2025 年期间,发射卫星,进一步扩展苹果 iPhone 系列的 SOS 卫星服务。

发布于:1年以前  |  430次阅读  |  详细内容 »

𝕏(推特)调整隐私政策,可拿用户发布的信息训练 AI 模型

据报道,马斯克旗下社交平台𝕏(推特)日前调整了隐私政策,允许 𝕏 使用用户发布的信息来训练其人工智能(AI)模型。新的隐私政策将于 9 月 29 日生效。新政策规定,𝕏可能会使用所收集到的平台信息和公开可用的信息,来帮助训练 𝕏 的机器学习或人工智能模型。

发布于:1年以前  |  428次阅读  |  详细内容 »

荣耀CEO谈华为手机回归:替老同事们高兴,对行业也是好事

9月2日,荣耀CEO赵明在采访中谈及华为手机回归时表示,替老同事们高兴,觉得手机行业,由于华为的回归,让竞争充满了更多的可能性和更多的魅力,对行业来说也是件好事。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI操控无人机能力超越人类冠军

《自然》30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,该系统驾驶无人机的能力可在真实世界中一对一冠军赛里战胜人类对手。

发布于:1年以前  |  423次阅读  |  详细内容 »

AI生成的蘑菇科普书存在可致命错误

近日,非营利组织纽约真菌学会(NYMS)发出警告,表示亚马逊为代表的电商平台上,充斥着各种AI生成的蘑菇觅食科普书籍,其中存在诸多错误。

发布于:1年以前  |  420次阅读  |  详细内容 »

社交媒体平台𝕏计划收集用户生物识别数据与工作教育经历

社交媒体平台𝕏(原推特)新隐私政策提到:“在您同意的情况下,我们可能出于安全、安保和身份识别目的收集和使用您的生物识别信息。”

发布于:1年以前  |  411次阅读  |  详细内容 »

国产扫地机器人热销欧洲,国产割草机器人抢占欧洲草坪

2023年德国柏林消费电子展上,各大企业都带来了最新的理念和产品,而高端化、本土化的中国产品正在不断吸引欧洲等国际市场的目光。

发布于:1年以前  |  406次阅读  |  详细内容 »

罗永浩吐槽iPhone15和14不会有区别,除了序列号变了

罗永浩日前在直播中吐槽苹果即将推出的 iPhone 新品,具体内容为:“以我对我‘子公司’的了解,我认为 iPhone 15 跟 iPhone 14 不会有什么区别的,除了序(列)号变了,这个‘不要脸’的东西,这个‘臭厨子’。

发布于:1年以前  |  398次阅读  |  详细内容 »