人工智能里程碑:新AlphaGo Zero横空出世,彻底摆脱人类


摘要:谷歌人工智能团队DeepMind宣布,新版AlphaGo——AlphaGo Zero可以只在了解比赛的规则,且没有人类指导的情况下自我学习。短短3天,AlphaGo Zero就完胜曾击败世界冠军李世石的AlphaGo。

本文来自华尔街见闻(微信ID:wallstreetcn),作者方凌。更多精彩资讯请登陆wallstreetcn.com,或下载华尔街见闻APP。

打败目前人类围棋最高水平选手才过去不久,DeepMind团队又宣布了一个在AI历史上具有里程碑式意义的重磅消息:新版AlphaGo可以彻底摆脱人类的知识。

10月18日,谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文,宣布新版AlphaGo——AlphaGo Zero可以在没有人类指导的情况下学习。

我们在这里介绍一种仅基于强化学习(reinforcement learning)的算法,没有超越游戏规则的人类数据、指导或领域知识。 也就是说,AlphaGo Zero就像人类初学者一样,只是了解比赛的规则和比赛的最终目标来自我学习。而作为首个击败人类围棋冠军的程序,之前版本的AlphaGo是通过分析人类围棋高手的数千棋局来学习,并在自我对弈中不断强化。

AlphaGo Zero学到的围棋知识(图片来源:DeepMind 论文)

当今世界围棋第一人柯洁更是直言,这样的AlphaGo是最强的,对于Alphago的自我进步来讲,人类太多余了。

此次的亮点在于,AlphaGo Zero无需人类指导就能让自己成为自己的老师,并且训练的时间更短。

短短3天时间,AlphaGo Zero不但从头开始学习了围棋,并且击败了先前版本的AlphaGo。在与击败世界冠军李世石的AlphaGo对弈中,AlphaGo Zero以100:0的比分完胜。

AlphaGo Zero在击败AlphaGo Lee之前,进行了490万次自我对弈;而AlphaGo Lee的训练时间则是数月。

仅仅40天后,AlphaGo Zero已经可以在与最先进版本的AlphaGo对弈中获得90%的胜率了。

AlphaGo Zero和先前版本AlphaGo的表现比较(图片来源:DeepMind 论文)

DeepMind团队表示,人工智能的最大挑战是研发一种能从零开始、以超人类的水平学习复杂概念的算法。此次AlphaGo Zero的出现不仅仅意味着围棋上的成功,还意味着距离通过创建通用算法来解决科学中的难题又进了一步。

目前深度学习需要大量数据,而数据的获得成本高昂且难度十分大,有了这项技术后,人类今后将有可能解决更大的挑战,给人类生活带来根本性的变化。

DeepMind首席执行官Demis Hassabis承认,可以运用这个技术解决实际生活中的许多问题。范围可以包括预测蛋白质分子的形状,这也是新药研发过重的重要一环;还可以设计新材料和进行气候建模。


xcguan - 热点新闻即时更新,百姓生活柴米油盐
Published under (CC) BY-NC-SA in categories 科技  tagged with 科技