专访AlphaGo“教练”:要不要和中国选手比一场
http://n.sinaimg.cn/tech/transform/20160314/Sa_j-fxqhmvc2396825.jpg3月13日,哈萨比斯(中)与大卫·席尔瓦(右)在赛后发布会上向李世石庆祝战胜AlphaGo。新浪科技 周峰 在AlphaGo还没有被李世石逆转之前,新浪科技在当天上午专访了DeepMind巩固学习小组负责人大卫·席尔瓦(David Silver)。在两个月前,《自然》杂志刊登的那篇论文上,有两个名字处在了第一作者的位置。一个是比赛赛场坐在李世石对面,替AlphaGo落子的黄士杰。另外一个作者的名字就是他。 实际上,作为AlphaGo团队的技术负责人,席尔瓦完全可以称得上是一个“教练”级的角色。在接近半个小时的专访里,我们了解到了AlphaGo如何走出一手“神来之笔”,怎样和李世石进行赛后交流、以及有没有和聂卫平比一场的想法——而且不止聂老,这个挑战名单上还有马晓春、常昊、古力、柯洁…… 新浪科技:作为AlphaGo的开发者,DeepMind的员工下围棋吗? 大卫·席尔瓦:我是业余水平。可能只有业余一级。 我们团队里下得最好的是黄士杰,就是代替AlphaGo和李世石下棋的那位。在DeepMind,我的同事们都开始对围棋产生兴趣,很多人开始下围棋,学习规则。我们还有一个围棋俱乐部,大家玩得都很开心。但我觉得最棒的事情是AlphaGo引起了整个西方世界学习围棋兴趣,我很高兴,希望西方可以更多了解这项智力运动的魅力。 新浪科技:我们看到很多韩国媒体都在报道人工智能技术,希望能够推动这一技术的进展。我觉得在推广科技方面,你们也做了同样的事情。 大卫·席尔瓦:我希望如此。 新浪科技:AlphaGo和李世石比赛这几天,是不是还在进行自我训练? 大卫·席尔瓦:AlphaGo对战李世石的比赛之前,我们已经暂停了AlphaGo的研发。因为我们需要决定用哪个版本来与李世石对战,我们还需要进行测试,小心确保所有事情都能顺利进行。所以我们不会在对战过程中改变版本。如果李世石在比赛中采用新策略的话,我们也不会从中学习的。 其实这几场比赛所提供的数据也不足以提高AlphaGo的能力,之前的学习能力都是通过几十万场比赛获得的,一两场比赛的意义并没有那么大。 新浪科技:从AlphaGo的开发者的角度出发,你觉得李世石的前三场比赛表现如何? 大卫·席尔瓦:我觉得他对AlphaGo比赛风格的适应能力比AlphaGo对适应他的能力高多了。李世石天赋很高,力量很大,我很高兴看到他只根据一两场对弈的经验,就在过去几场比赛中分别找到了不同的方式来试探AlphaGo的能力。 新浪科技:李世石每次认输之后的状况都很不好,部分原因可能是他很难和电脑沟通。人类棋手在比赛之后都会一起复盘,看看对方在比赛时是怎么思考的。我很好奇DeepMind有没有把数据反馈给他,帮助他从比赛中学习? 大卫·席尔瓦:这是个好问题。因为我们对职业围棋不太了解,所以我觉得我们还没能理解,赛后分析对棋手来说有多重要。所以我们也还没有开发与能李世石进行交流的程序,目前来看这项工作还是非常难的。 我觉得我们可能会在比赛之后,找一个时间,和李世石共同了解一下AlphaGo对棋局的分析,看看双方会不会有什么交流。我觉得这是一件很好的事情。但比赛之前我们没有意识到这点。不过实际上,我们了解到这件事有多重要,所以我们也邀请了他,问他如果可能,也愿意的话,希望他能邀请他的助手,还有更多的专业棋手参与进来,和他一起来分析比赛。这样的话,就不是他一个人孤军奋战了。 新浪科技:Facebook也在研究围棋方面的人工智能,而且他们的团队用自己的算法分析了这几天的比赛,并给出了每盘比赛的关键步,你怎么看待他们的研究? 大卫·席尔瓦:我也看到其他优秀程序在这方面的分析了,比如Crazy Stone等等。我对看其他围棋程序怎么思考很感兴趣,就像有优秀分析能力的人类棋手也对其他棋手的想法感兴趣一样。我觉得,对比赛过程有很多不同方面的观点,这是件好事。当然,AlphaGo对于谁的胜算更大,有自己的判断,李世石也是这样。 新浪科技:很多职业棋手都说AlphaGo在第二局比赛里的第37手棋不像是人类会下的棋,它是怎么下出来这手棋的? 大卫·席尔瓦:其实,我第二局比赛结束之后,看了下AlphaGo。因为我知道很多职业棋手都觉得AlphaGo的第37手棋下得不同凡响,所以我后来专门查看了下AlphaGo。 有意思的是,职业棋手都说没有人类能下出这手棋,人类能下出这样一手棋的可能性极小。所以我就问了AlphaGo,因为它有人类棋谱的模型,它其实是在向人类学习的。AlphaGo说它觉得人类会下出来这步棋,概率是万分之一。 所以它其实知道这手棋人类不太可能会下,但它同时对位置进行了分析,并且根据自己的理解,通过更深层次的评估,相信这手棋的力量很大。 虽然它的能力来自对人类棋手的学习,这样一步棋可能已经意味着它已经准备好超越人类,创造和发现新的风格和棋路。 新浪科技:DeepMind创始人哈萨比斯前两天接受采访的时候提到过会开发新版本的AlphaGo,让它从0开始学习围棋,不会借鉴任何人类棋谱。这个版本的AlphaGo与目前的版本会有什么不同? 大卫·席尔瓦:在未来,我们对(AlphaGo)能否从完全没有人类专业经验,纯粹自学很感兴趣。如果我们能开发出这样一个AlphaGo的话,我们或许就会发现风格相当不一样的下法。不过这个事情很难。 目前和李世石比赛的这个版本,仍然从人类经验中吸取了大量的原型数据,帮助它开始学习。所以我觉得这是个非常有趣的挑战。不过距离实现还有很长的路要走。 新浪科技:聂卫平觉着AlphaGo在这几场中的表现非常不错,他还表示要对AlphaGo在第二局比赛中的第37手棋脱帽致敬。 大卫·席尔瓦:听到这件事我很荣幸。非常感谢你告诉我。 新浪科技:聂卫平对前50步之内保持对AlphaGo的优势非常自信,他个人也想和AlphaGo较量一下。而且不止聂卫平,马晓春、常昊、古力、柯洁在内的顶级棋手都想与AlphaGo过招,甚至愿意组队与AlphaGo对弈。AlphaGo有没有考虑过接受其他职业棋手的挑战? 大卫·席尔瓦:实话说,我们目前主要是考虑的还是这场比赛,我们对目前取得的结果也很高兴,我们已经三比零领先。 我们通常认为,我们应该在决定AlphaGo将来做什么之前,等一等,看一看。因为我们真不知道它和世界顶级棋手比赛时,到底会出现什么情况。我们也在讨论下一步的计划,也在讨论接下来让AlphaGo干什么。 对于大家对人工智能的兴趣,以及大家想要和AlphaGo交流的情况,我们很高兴。我们会尽快作出决定。 新浪科技:和李世石比赛之后,有这么多职业棋手想要挑战AlphaGo,你是怎么看待这件事的? 大卫·席尔瓦:我觉得这是一种褒奖,是对AlphaGo的一种褒奖。和李世石比赛之前,很多人认为AlphaGo不能对围棋顶尖棋手造成威胁。但现在,人们都很兴奋,也迫切想和AlphaGo切磋一下。所以我觉得这对AlphaGo来说,是一种极大的鼓励。 新浪科技:可是大家都开始觉得AlphaGo有威胁了,聂卫平都很关心DeepMind会不会继续开发AlphaGo。目前人工智能带来了有一种有威胁的情绪,不只是围棋界,还有其他领域。你怎么看待人工智能带来的这种焦虑? 大卫·席尔瓦:我相信这对围棋来说,真的是一次极好的机遇。未来围棋程序进步之后,我们会有很多机会来学习新的下法,就像第二盘37手那样。我觉得,能看到围棋得到新的发展是一件好事。而围棋得到这么大的关注度,其实也是一件好事。围棋或许因此被引入了西方世界,让世界其他地区的人们也能领略到围棋的魅力,我觉得这是让人高兴的事。 新浪科技:那么其他领域呢? 大卫·席尔瓦:至于其他领域,AlphaGo对人工智能的发展,对于人类的发展,也是积极的一步。因为它能帮助解决很多人类所面对的共同问题,我真的希望人类和人工智能可以一道面对这些挑战,比如医疗健康。 如果在这一领域也有像AlphaGo这样水平的机器人,那么个性化的医疗就可以出现,因为它可以学会分析数据,通过更为准确和明智地治疗疾病。我们希望人们对这类技术能持一种期待的态度。我觉得这能带来很大的飞跃。 所以我希望人们能够为这些机遇感到高兴。 新浪科技:这次比赛之后,DeepMind比赛之后还会有什么样大的动作? 大卫·席尔瓦:我们希望能运用到AlphaGo的核心开发理念,来学习人类的专长,并且从数据中进行学习,来解决人类社会最重大的问题。人工智能在与英国国家健康体系(NHS)的合作,家庭机器人和智能手机操作系还是可以有所作为的。 新浪科技:你个人有没有和AlphaGo下过棋? 大卫·席尔瓦:我在开发AlphaGo的过程中,跟它下过几次,但是我的水平差太多,所以对围棋历史的意义来说不是太大。
页:
[1]