当前位置：K88软件开发 → 文章中心 → 编程资讯 → 编程资讯19 → 文章内容

AlphaGo Zero多恐怖？自学3天虐李世石版100比0

减小字体

增大字体作者：华军来源：华军资讯发布时间：2019-2-18 2:07:07

人机大战时柯洁面对的就是AlphaGo Zero北京时间10月19日凌晨，DeepMind 如约公布了他们最新版AlphaGo论文，文中透露最新版本的AlphaGo Zero，使用纯强化学习，将价值网络和策略网络整合为一个神经网络，3天训练后就以100比0击败了上一版本的AlphaGo，也就是那个4-1战胜李世石的版本。今年5月乌镇围棋大赛时，DeepMind CEO哈萨比斯表示，将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天，这个承诺如约兑现，DeepMind将他们最新的内容发表于Nature的一篇论文中，详细介绍了迄今最强大的一版AlphaGo—— AlphaGo Zero。AlphaGo Zero完全不依赖于人类数据，仅在条件确定的情况下进行自我对弈训练，也就是通常我们所理解的“左右互搏”。一开始它只是一个初学者，但是随着数据和训练的积累，AlphaGo Zero很快掌握了下棋的技巧。由最开始的关注吃子，逐渐摸索到势与地这些围棋最难判断的技术区域。仅仅3天的训练过后，AlphaGo Zero就能以100-0击败第一次人机大战时4-1击败李世石的版本，也就是AlphaGo Lee（V18）。训练21天后，它就已经达到AlphaGo Master的水准。随后的AlphaGo Zero已经远远超过Master的水准，而这样一个恐怖的“怪物”就是柯洁在5月份乌镇所面对的对手。人机大战时柯洁面对的就是AlphaGo Zero北京时间10月19日凌晨，DeepMind 如约公布了他们最新版AlphaGo论文，文中透露最新版本的AlphaGo Zero，使用纯强化学习，将价值网络和策略网络整合为一个神经网络，3天训练后就以100比0击败了上一版本的AlphaGo，也就是那个4-1战胜李世石的版本。今年5月乌镇围棋大赛时，DeepMind CEO哈萨比斯表示，将在今年晚些时候公布战胜了柯洁的那版AlphaGo的技术细节。今天，这个承诺如约兑现，DeepMind将他们最新的内容发表于Nature的一篇论文中，详细介绍了迄今最强大的一版AlphaGo—— AlphaGo Zero。AlphaGo Zero完全不依赖于人类数据，仅在条件确定的情况下进行自我对弈训练，也就是通常我们所理解的“左右互搏”。一开始它只是一个初学者，但是随着数据和训练的积累，AlphaGo Zero很快掌握了下棋的技巧。由最开始的关注吃子，逐渐摸索到势与地这些围棋最难判断的技术区域。仅仅3天的训练过后，AlphaGo Zero就能以100-0击败第一次人机大战时4-1击败李世石的版本，也就是AlphaGo Lee（V18）。训练21天后，它就已经达到AlphaGo Master的水准。随后的AlphaGo Zero已经远远超过Master的水准，而这样一个恐怖的“怪物”就是柯洁在5月份乌镇所面对的对手。

AlphaGo Zero多恐怖？自学3天虐李世石版100比0

[] [返回上一页] [打印]

·上一篇文章：任天堂Switch增加简体中文与繁体中文系统选项
·下一篇文章：女子公交站等车被公交撞伤致十级伤残获赔30万

AlphaGo Zero多恐怖？自学3天虐李世石版100比0

文章评论评论内容只代表网友观点，与本站立场无关！

频道栏目导航

本类热门阅览

相关文章