专访AlphaGo“教练”：要不要和中国选手比一场

evilatman 发表于 2016-3-14 10:33

http://n.sinaimg.cn/tech/transform/20160314/Sa_j-fxqhmvc2396825.jpg3月13日，哈萨比斯(中)与大卫·席尔瓦(右)在赛后发布会上向李世石庆祝战胜AlphaGo。
　　新浪科技周峰　　在AlphaGo还没有被李世石逆转之前，新浪科技在当天上午专访了DeepMind巩固学习小组负责人大卫·席尔瓦(David Silver)。在两个月前，《自然》杂志刊登的那篇论文上，有两个名字处在了第一作者的位置。一个是比赛赛场坐在李世石对面，替AlphaGo落子的黄士杰。另外一个作者的名字就是他。　　实际上，作为AlphaGo团队的技术负责人，席尔瓦完全可以称得上是一个“教练”级的角色。在接近半个小时的专访里，我们了解到了AlphaGo如何走出一手“神来之笔”，怎样和李世石进行赛后交流、以及有没有和聂卫平比一场的想法——而且不止聂老，这个挑战名单上还有马晓春、常昊、古力、柯洁……　　新浪科技：作为AlphaGo的开发者，DeepMind的员工下围棋吗？　　大卫·席尔瓦：我是业余水平。可能只有业余一级。　　我们团队里下得最好的是黄士杰，就是代替AlphaGo和李世石下棋的那位。在DeepMind，我的同事们都开始对围棋产生兴趣，很多人开始下围棋，学习规则。我们还有一个围棋俱乐部，大家玩得都很开心。但我觉得最棒的事情是AlphaGo引起了整个西方世界学习围棋兴趣，我很高兴，希望西方可以更多了解这项智力运动的魅力。　　新浪科技：我们看到很多韩国媒体都在报道人工智能技术，希望能够推动这一技术的进展。我觉得在推广科技方面，你们也做了同样的事情。　　大卫·席尔瓦：我希望如此。　　新浪科技：AlphaGo和李世石比赛这几天，是不是还在进行自我训练？　　大卫·席尔瓦：AlphaGo对战李世石的比赛之前，我们已经暂停了AlphaGo的研发。因为我们需要决定用哪个版本来与李世石对战，我们还需要进行测试，小心确保所有事情都能顺利进行。所以我们不会在对战过程中改变版本。如果李世石在比赛中采用新策略的话，我们也不会从中学习的。　　其实这几场比赛所提供的数据也不足以提高AlphaGo的能力，之前的学习能力都是通过几十万场比赛获得的，一两场比赛的意义并没有那么大。　　新浪科技：从AlphaGo的开发者的角度出发，你觉得李世石的前三场比赛表现如何？　　大卫·席尔瓦：我觉得他对AlphaGo比赛风格的适应能力比AlphaGo对适应他的能力高多了。李世石天赋很高，力量很大，我很高兴看到他只根据一两场对弈的经验，就在过去几场比赛中分别找到了不同的方式来试探AlphaGo的能力。　　新浪科技：李世石每次认输之后的状况都很不好，部分原因可能是他很难和电脑沟通。人类棋手在比赛之后都会一起复盘，看看对方在比赛时是怎么思考的。我很好奇DeepMind有没有把数据反馈给他，帮助他从比赛中学习？　　大卫·席尔瓦：这是个好问题。因为我们对职业围棋不太了解，所以我觉得我们还没能理解，赛后分析对棋手来说有多重要。所以我们也还没有开发与能李世石进行交流的程序，目前来看这项工作还是非常难的。　　我觉得我们可能会在比赛之后，找一个时间，和李世石共同了解一下AlphaGo对棋局的分析，看看双方会不会有什么交流。我觉得这是一件很好的事情。但比赛之前我们没有意识到这点。不过实际上，我们了解到这件事有多重要，所以我们也邀请了他，问他如果可能，也愿意的话，希望他能邀请他的助手，还有更多的专业棋手参与进来，和他一起来分析比赛。这样的话，就不是他一个人孤军奋战了。　　新浪科技：Facebook也在研究围棋方面的人工智能，而且他们的团队用自己的算法分析了这几天的比赛，并给出了每盘比赛的关键步，你怎么看待他们的研究？　　大卫·席尔瓦：我也看到其他优秀程序在这方面的分析了，比如Crazy Stone等等。我对看其他围棋程序怎么思考很感兴趣，就像有优秀分析能力的人类棋手也对其他棋手的想法感兴趣一样。我觉得，对比赛过程有很多不同方面的观点，这是件好事。当然，AlphaGo对于谁的胜算更大，有自己的判断，李世石也是这样。　　新浪科技：很多职业棋手都说AlphaGo在第二局比赛里的第37手棋不像是人类会下的棋，它是怎么下出来这手棋的？　　大卫·席尔瓦：其实，我第二局比赛结束之后，看了下AlphaGo。因为我知道很多职业棋手都觉得AlphaGo的第37手棋下得不同凡响，所以我后来专门查看了下AlphaGo。　　有意思的是，职业棋手都说没有人类能下出这手棋，人类能下出这样一手棋的可能性极小。所以我就问了AlphaGo，因为它有人类棋谱的模型，它其实是在向人类学习的。AlphaGo说它觉得人类会下出来这步棋，概率是万分之一。　　所以它其实知道这手棋人类不太可能会下，但它同时对位置进行了分析，并且根据自己的理解，通过更深层次的评估，相信这手棋的力量很大。虽然它的能力来自对人类棋手的学习，这样一步棋可能已经意味着它已经准备好超越人类，创造和发现新的风格和棋路。　　新浪科技：DeepMind创始人哈萨比斯前两天接受采访的时候提到过会开发新版本的AlphaGo，让它从0开始学习围棋，不会借鉴任何人类棋谱。这个版本的AlphaGo与目前的版本会有什么不同？　　大卫·席尔瓦：在未来，我们对(AlphaGo)能否从完全没有人类专业经验，纯粹自学很感兴趣。如果我们能开发出这样一个AlphaGo的话，我们或许就会发现风格相当不一样的下法。不过这个事情很难。　　目前和李世石比赛的这个版本，仍然从人类经验中吸取了大量的原型数据，帮助它开始学习。所以我觉得这是个非常有趣的挑战。不过距离实现还有很长的路要走。　　新浪科技：聂卫平觉着AlphaGo在这几场中的表现非常不错，他还表示要对AlphaGo在第二局比赛中的第37手棋脱帽致敬。　　大卫·席尔瓦：听到这件事我很荣幸。非常感谢你告诉我。　　新浪科技：聂卫平对前50步之内保持对AlphaGo的优势非常自信，他个人也想和AlphaGo较量一下。而且不止聂卫平，马晓春、常昊、古力、柯洁在内的顶级棋手都想与AlphaGo过招，甚至愿意组队与AlphaGo对弈。AlphaGo有没有考虑过接受其他职业棋手的挑战？　　大卫·席尔瓦：实话说，我们目前主要是考虑的还是这场比赛，我们对目前取得的结果也很高兴，我们已经三比零领先。　　我们通常认为，我们应该在决定AlphaGo将来做什么之前，等一等，看一看。因为我们真不知道它和世界顶级棋手比赛时，到底会出现什么情况。我们也在讨论下一步的计划，也在讨论接下来让AlphaGo干什么。　　对于大家对人工智能的兴趣，以及大家想要和AlphaGo交流的情况，我们很高兴。我们会尽快作出决定。　　新浪科技：和李世石比赛之后，有这么多职业棋手想要挑战AlphaGo，你是怎么看待这件事的？　　大卫·席尔瓦：我觉得这是一种褒奖，是对AlphaGo的一种褒奖。和李世石比赛之前，很多人认为AlphaGo不能对围棋顶尖棋手造成威胁。但现在，人们都很兴奋，也迫切想和AlphaGo切磋一下。所以我觉得这对AlphaGo来说，是一种极大的鼓励。　　新浪科技：可是大家都开始觉得AlphaGo有威胁了，聂卫平都很关心DeepMind会不会继续开发AlphaGo。目前人工智能带来了有一种有威胁的情绪，不只是围棋界，还有其他领域。你怎么看待人工智能带来的这种焦虑？　　大卫·席尔瓦：我相信这对围棋来说，真的是一次极好的机遇。未来围棋程序进步之后，我们会有很多机会来学习新的下法，就像第二盘37手那样。我觉得，能看到围棋得到新的发展是一件好事。而围棋得到这么大的关注度，其实也是一件好事。围棋或许因此被引入了西方世界，让世界其他地区的人们也能领略到围棋的魅力，我觉得这是让人高兴的事。　　新浪科技：那么其他领域呢？　　大卫·席尔瓦：至于其他领域，AlphaGo对人工智能的发展，对于人类的发展，也是积极的一步。因为它能帮助解决很多人类所面对的共同问题，我真的希望人类和人工智能可以一道面对这些挑战，比如医疗健康。　　如果在这一领域也有像AlphaGo这样水平的机器人，那么个性化的医疗就可以出现，因为它可以学会分析数据，通过更为准确和明智地治疗疾病。我们希望人们对这类技术能持一种期待的态度。我觉得这能带来很大的飞跃。　　所以我希望人们能够为这些机遇感到高兴。　　新浪科技：这次比赛之后，DeepMind比赛之后还会有什么样大的动作？　　大卫·席尔瓦：我们希望能运用到AlphaGo的核心开发理念，来学习人类的专长，并且从数据中进行学习，来解决人类社会最重大的问题。人工智能在与英国国家健康体系(NHS)的合作，家庭机器人和智能手机操作系还是可以有所作为的。　　新浪科技：你个人有没有和AlphaGo下过棋？　　大卫·席尔瓦：我在开发AlphaGo的过程中，跟它下过几次，但是我的水平差太多，所以对围棋历史的意义来说不是太大。

页: [1]

爱福特车友会's Archiver

专访AlphaGo“教练”：要不要和中国选手比一场