`
wx1568520008
  • 浏览: 20378 次
最近访客 更多访客>>
文章分类
社区版块
存档分类
最新评论

给人类支三招对付AlphaGo

 
阅读更多

以下是根据鄙人对阿法狗的工作原理理解,想出的可以对付AlphaGo的三招,从可行性最低到最高排序。

第一招:制造征子,并引征

首先,我知道AlphaGo是有专门算法来处理征子的,但我还是认为在征子方面,人类可能有一些技巧可以利用。因为征子在围棋里是一种很特殊的形状。通常一个字落在某点,它的作用力是随着距离而递减的。但是一旦出现征子,那么一个棋盘上距离离征子很远的一个子就可以对征子的结果产生决定性影响。

而AlphaGo的两个大脑之一的策略网络是使用卷积神经网络技术来学习的,这种技术通常用在图像识别领域,所以AlphaGo在局部棋形的感觉特别好,它能飞快判断局部某个棋形的要点。但是“引征”这一手的重要性是需要与棋盘很远远处的形状结合判断的,所以它的策略网络很可能忽略到这一手,或者说对引征的子价值判断较低。

另一方面,AlphaGo的第二个大脑,价值网络又是使用蒙特卡洛算法工作的,我不太清楚AlphaGo如何判断征子的发生。不过可以考虑这种情况,假设一个局部定式会导致征子发生,并且征子结果决定了这个局部的好坏,那么蒙特卡洛算法算法在这个局部定式刚开始时是很难判断清楚这个定式的结果的,因为你很难随机性的正好走出征子,又能在征子出现后,随机的产生正确的征子吃子步骤。这就可能导致价值网络漏算某些带征子的结果。

所以,人可以采取的一个办法就是制造征子,然后来一部美妙的“引征”。我看到有人跟我持类似观点:http://forum.sports.sina.com.cn/thread-2301040-1-1.html

第二招 模仿棋

跟电脑下,模仿棋是个好东西啊。首先,我时间节省,让你AlphaGo去算吧,你算的结果我来用:)其次,因为盘面对称,所以价值网络判断的结果,每次都会有几手显得价值都很接近,所以AlphaGo会难以取舍,迫使价值网络运行更多计算。

另外,人类棋手知道,破解模仿棋的关键在于谁先下在天元附近,并且要使这手棋成为好棋。下在天元附近,一般就会迫使模仿者停止模仿了。对AlphaGo来说,它也许打过一些模仿棋的棋谱,但是很难说AlphaGo知道自己打了一份模仿棋的棋谱,它只是机械的学习每一步,并且使自己的策略网络能够调整到“局部这个形状,接下来就可以下那里”的这种状态。所以,AlphaGo不会知道自己需要设法把局面引向中央,迫使对手停止模仿。

模仿棋是一种简单易行的方法,值得一试。

第三招 骗招

所谓骗招,就是每一步都走的符合棋理,堂堂正正,最后却掉入对手布置的陷阱中。职业棋手对局中基本没有骗招,因为知道骗不了,所以AlphaGo就很难从打谱中学习对付骗招的方法。而骗招每一步棋形又是堂堂正正的,所以,AlphaGo的策略网络肯定能将被骗的下法列入优先的可能下法。这之后就要看AlphaGo的价值网络能否正确的排除被骗的下法了。这就要看蒙特卡洛算法了,但这是一种看运气的算法。

从AlohaGo与李世石第四局的棋谱中,AlphaGo明显漏算了李世石第78手挖,也可以说李世石的从AlphaGo下了第71手时,就看出挖这个好手,就开始着手酝酿,到78 下出挖,一下子把AlphaGo打蒙了。这也看出,AlphaGo在对付骗招上可能有弱点。

这第三招我认为是对付AlphaGo最有效的一招,但也是最难实施的,因为勉强去走骗招肯定是受损的,只有一步步巧妙的引诱对手走入陷阱才行,有时这是可遇不可求的局面。

总结

对付AlphaGo其实就两个要点,分别攻击它的两个大脑:

  • 制造一种牵涉全局的局面,也就是下一步需要从全局形状来判断。这就是攻击策略网络。
  • 制造一种需要非常深度且精确计算的局部局面。比如征子和骗招,也就是每一步必须在特定位置下才能得到局面正确的结果,这就是攻击价值网络。

希望下一位跟AlphaGo下棋的人类棋手能看到本文,期待下一次人机大战!

转载于:https://my.oschina.net/webcraft/blog/661303

分享到:
评论

相关推荐

    人类能战胜ALPHAGO吗?

    ### 人类能战胜AlphaGo吗? #### AI的发展历程 探讨人类是否能战胜AlphaGo之前,首先需要回顾一下人工智能(AI)的发展历程。自1936年图灵提出图灵机概念以来,人工智能经历了从理论到实践的重大飞跃。 - **1936...

    AlphaGo VS AlphaGo Zero 对比分析讲解

    本文档是对两个版本的AlphaGo的网络结果和MCTS结构的对比分析.

    Alphago Zero 自我对弈50盘

    AlphaGo Zero是谷歌DeepMind公司研发的围棋人工智能程序,它通过自我对弈的方式,无需任何人类棋谱,仅依靠强化学习和深度神经网络,在短短几小时内达到了超越人类顶尖棋手的水平。这一突破性技术不仅在围棋界产生了...

    AlphaGo如何战胜人类围棋大师:智能硬件TensorFlow实践

    在此基础上,介绍AlphaGo结合深度学习和强化学习技术,如何战胜人类围棋大师的原理。接下来,将深度学习的理论转化为实践,给出如何通过掌握TensorFlow和Keras深度学习框架,制作声控智能硬件的例子,同时给出机器...

    alphaGo论文

    AlphaGo是谷歌旗下DeepMind公司开发的人工智能程序,它在围棋游戏中达到了超越人类顶尖水平的成就。AlphaGo的研发成功标志着人工智能领域的重大突破,尤其是深度学习和强化学习技术的应用。AlphaGo论文详细介绍了这...

    深度解读AlphaGo原理

    AlphaGo在与人类顶尖围棋选手的对局中取得的胜利,标志着人工智能在理解复杂、非规则性问题方面取得了重大进步。AlphaGo的成功不仅仅是因为它有更强大的计算能力,更因为它在模式识别、决策制定和策略规划等方面展现...

    alphago 自然杂志 nature google

    AlphaGo是谷歌旗下的人工智能公司DeepMind开发的一款程序,在2016年取得了前所未有的成就:它首次击败了人类围棋职业选手。围棋是一种古老的棋类游戏,其复杂度远高于国际象棋等其他棋类游戏,因此长期以来被视为...

    ( AlphaGo Zero slides.pdf )

    2017年1月,升级版AlphaGo Master利用人类数据和特征,在线比赛中以60比0的战绩击败了最强的人类职业棋手。 与之前的版本相比,AlphaGo Zero的创新之处在于它完全通过自我对弈的强化学习进行训练,不需要任何人为...

    Google Deepmind AlphaGo原理解析(54页PPT详解)

    AlphaGo的出现代表了人工智能在理解和模仿人类思维能力上的巨大进步。 AlphaGo使用了深度学习和蒙特卡罗树搜索(MCTS)技术,与以往的计算机围棋AI相比,它的一个重要特点是能够通过神经网络学习和模仿人类顶尖棋手...

    如何理解AlphaGo Zero背后涉及到的技术

    AlphaGo Zero摒弃了人类知识的输入,完全通过自我学习的方式,在没有人类数据的情况下,通过深度学习(DNN)和蒙特卡洛树搜索(MCTS)算法实现了与人类围棋高手抗衡的水平。AlphaGo Zero相较于前代AlphaGo Lee,最大...

    AlphaGo源码

    4. 模型融合:AlphaGo Zero是AlphaGo的升级版,它不再依赖于人类棋谱,而是从零开始通过纯强化学习训练。在训练过程中,AlphaGo Zero结合了策略网络和价值网络,使其成为一个单一的神经网络,进一步提升了性能。 5....

    AlphaGo原理解析(2)源码

    AlphaGo之后,DeepMind推出了AlphaGo Zero,它无需任何人类棋谱,完全依赖于自我对弈进行学习。这展示了深度学习和强化学习的强大潜力,也推动了人工智能在其他领域的发展。 总结来说,AlphaGo的成功在于将深度学习...

    AlphaGo论文

    《AlphaGo论文》是机器学习领域的一篇里程碑式文献,它标志着人工智能在围棋这一复杂智力游戏中的重大突破。这篇论文详细介绍了DeepMind团队如何利用深度学习和强化学习技术,结合蒙特卡洛树搜索(Monte Carlo Tree ...

    AlphaGo自我对弈50盘棋谱

    每一局棋都代表了AlphaGo在不断学习和优化过程中的思想演变,体现了AI在围棋策略上的独特见解和超越人类的理解。在这些棋谱中,我们可以窥见人工智能如何模拟人类的思维模式,以及如何超越这些模式,创造出前所未有...

    AlphaGo源码(来自GitHub)

    《AlphaGo源码解析——深度学习与围棋智能的融合》 AlphaGo,这款由Google DeepMind研发的围棋人工智能程序,自2016年在人机大战中击败世界冠军李世石以来,就成为了人工智能领域的一个里程碑。其背后的源代码不仅...

    AlphaGo算法原理概述

    AlphaGo算法原理概述,阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发

    Alphago发布在Nature上的论文

    本文详细讲解了AlphaGo的设计理念、核心技术以及它如何达到击败人类顶尖选手的水平。 1. 围棋游戏的挑战:围棋被认为是对人工智能最具挑战性的经典游戏之一,原因在于其巨大的搜索空间以及评估棋盘位置和走法的难度...

    AlphaGo Zero – How and Why it Works – Tim Wheeler

    AlphaGo Zero是DeepMind开发的一款围棋AI程序,其突破性的成就在于无需借助人类棋局数据,仅通过自我对弈的方式,在短时间内达到了超越人类围棋顶尖水平的成就。AlphaGo Zero的工作原理和成功原因是一个涉及机器学习...

    AlphaGo 浅析ppt

    AlphaGo 浅析ppt

Global site tag (gtag.js) - Google Analytics