- ·上一篇文章:Mac 用户发现名为“mshelper”的恶意挖矿软件
- ·下一篇文章:家门口的快递黑科技:菜鸟小盒让收寄包裹更方便
魔方全能小王子降临:一个完全不依赖人类知识的AI
类似,学到了一些“套路”,包括用复杂的排列组合来解魔方,以及与人类速拧选手相近的策略。比如,DeepCube大量使用一组特定的操作,即aba-1。就是先执行某个转动a,再执行另外一个转动b,最后把a步骤转回去。团队检查了DeepCube处理640个完全打乱的魔方时,发现AI经常使用这样的操作,这样能在移动某些方格的过程中,让其他方格不要受到影响。具体来说,就是查看每三次相邻的转动,出现频次最高的14种,都是aba-1格式。比其他格式的出现频率明显要高。至于现在嘛,团队可能觉得,自家的AI复原三阶魔方已经百发百中了,于是就开始研究四阶魔方,以及各种奇奇怪怪的魔方。另外,走出魔方的世界,他们觉得这种方法也可以用来处理其他组合优化问题,比如预测蛋白质的三级结构。许多组合优化问题,都可以想成序列决策问题,也就可以用强化学习来解决。团队可能觉得,自家的AI复原三阶魔方已经百发百中了,于是就开始研究四阶魔方,以及各种奇奇怪怪的魔方。另外,走出魔方的世界,他们觉得这种方法也可以用来处理其他组合优化问题,比如预测蛋白质的三级结构。论文这篇论文已经提交到NIPS,题目是:Solving the Rubik’s Cube Without Human Knowledge传送门在此:https://arxiv.org/pdf/1805.07470v1.pdfOMT有奖 (吗) 竞猜,那个碎掉魔方的机器人选手,来自哪里?在量子位公众号(ID:QbitAI)对话界面,回复:“魔方”两个字,答案立刻揭晓。—完—
魔方全能小王子降临:一个完全不依赖人类知识的AI