注册 找回密码
搜索
查看: 931|回复: 0
打印 上一主题 下一主题

围棋下法与致胜的规则都最简单有利于计算机取胜 节点 自练

[复制链接]
跳转到指定楼层
1#
发表于 2017-10-23 09:12:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 邓文龙 于 2017-10-23 09:25 编辑

吴中祥  科学网博客  博文

围棋下法与致胜的规则都最简单有利于计算机取胜

对于人脑来说,学习是一个在神经元之间形成并加强关联的过程。“深层学习”系统采取了类似方式,因而被称作“神经网络”。它在软件中建立起数十亿节点和关联,使用案例“训练集”来强化刺激(正在下的棋)和反应(下一步棋)间的关联,而后再对系统进行新刺激,并观察其反应。通过另一种名叫“强化学习”的技术,“阿尔法围棋”还和自己下了数百万盘棋,以记住有效走法和战略  “强化学习”的技术,“阿尔法围棋”还和自己下了数百万盘棋,以记住有效走法和战略  
“深层学习”系统“神经网络” 在软件中建立起数十亿节点和关联,用案例训练   “强化学习”和自己下了数百万盘棋,以记住有效走法和战略  节点 自练

《自然》已登一篇论文

已有 146 次阅读 2017-10-22 21:55 |个人分类:数理|系统分类:观点评述|关键词:围棋下法与致胜的规则都最简单有利于计算机取胜

围棋下法与致胜的规则都最简单有利于计算机取胜

围棋下法与致胜的规则都最简单,双方相互应对影响致胜的几率因素有限,高手较容易根据对手的数次应对,选得致胜途径。

但是,人脑估算的速度有限,即使总结有某些经验规律,可确定的致胜途径,能应对对手应对的次数也不会很多。

计算机运算的速度远远超过人脑,可以根据对手多得多次数,试探多得多种可能致胜的方案,选其优,只要一个程序设计得完善,就必然胜过人脑。

原‘阿尔法狗’(AlphaGo)所谓“会用强化学习”就是:“学习”对手“致胜之道”,因运算速度远远超过人脑,而能胜过世界冠军的人脑。

新版‘阿尔法狗’(AlphaGo Zero)并非“学习”对手“致胜之道”,而是根据围棋下法与致胜的规则,自行试探应对对手多次各种可能的应对达到致胜之道的“自学”、“创新”,更好地发挥运算速度快的优势,就更加必然能胜过人脑。

至于麻将,其打法与致胜的规则都远较复杂,4方相互应对影响致胜的几率,不确定的因素,也多得多,各方致胜的几率也相差很大,且各次不同。即使运算速度再快,也很难有确切致胜的方案。只能根据实际进行中的最佳几率考虑少犯大错。

而不可能每次必胜。

新版阿尔法狗自学围棋3天胜“旧狗”:具备强化学习能力

韩媒称,谷歌DeepMind联合创始人德米斯·哈萨比斯和首席科学家大卫·西尔弗于17-10-18日在国际期刊《自然》刊登一篇论文,表明:“‘阿尔法狗’(AlphaGo)的最新版本‘Zero’的性能超越了打败世界围棋冠军的‘阿尔法狗’。”
韩国《朝鲜日报》称,韩国电子通讯研究院(ETRI)高级研究员李京远(音)表示:“阿尔法元程序的优势是会用强化学习。”强化学习是人类或动物大脑的实际运作方式。专家们期待阿尔法元程序增大人工智能运用幅度。

2017-10-20 00:15:01 来源:参考消息网

据韩国《朝鲜日报》17-10月19日报道,谷歌DeepMind首席执行官哈萨比斯称:“阿尔法元程序(AlphaGo Zero)通过三天的围棋自学就以100:0的比分完胜对阵李世石的AlphaGo Lee,经过21天的学习就超越了以3:0战胜柯杰九段的AlphaGo Master。”
报道称,“阿尔法狗”之前通过人类棋手的棋谱进行训练,学习如何下围棋。去年以4:1打败李世石九段的AlphaGo Lee,利用七个月的时间学习了16万份棋谱。但是阿尔法元程序与之前的版本不同,只掌握了围棋基本规则,并无其他任何信息的输入。即在没有输入人类棋谱数据的情况下,通过下围棋的过程自动生成了大数据。
报道称,韩国电子通讯研究院(ETRI)高级研究员李京远(音)表示:“阿尔法元程序的优势是会用强化学习。”强化学习是人类或动物大脑的实际运作方式。
世界著名脑科学家、美国耶鲁大学医学教授李大烈(音)表示:“强化学习是100年前出现的心理学概念,但是最近在脑科学领域运用十分活跃,脑科学的研究成果直接对人工智能开发产生积极影响。”
报道称,专家们期待阿尔法元程序增大人工智能运用幅度。例如,向阿尔法元程序输入首尔市人口分布和业务空间数据,在没有任何其他相关数据的情况下,也能绘制出与当前完全不同的、高效的地铁及公交路线图。还能对无人驾驶车运行提供安全保障,目前靠人类无法计算出其在运行过程当中出现事故的所有情况,但是通过阿尔法元程序可以预测所有可能性,包括目前从未出现的情况。
报道称,但阿尔法元程序也存在局限性。韩国科学技术计划评价院车斗元研究员表示:“目前人们无法明确解释阿尔法元程序算出的每一种走法,所以运用到实际生活,将有可能出现一些副作用。”
美媒:“阿尔法围棋”获胜诠释“深层学习”威力
参考消息网3月19日报道
美媒称,“阿尔法围棋”这个由谷歌旗下“深层思维”公司创建的人工智能系统,在人机围棋大赛中以四比一的成绩击败了围棋冠军李世石。这场人机大赛究竟重要在哪里?毕竟1997年国际象棋冠军加里·卡斯帕罗夫就败在了国际商用机器公司的“深蓝”计算机手下。那么为何说“阿尔法围棋”的胜利具有特别重要的意义呢?
据美国《纽约时报》网站3月16日文章称,和国际象棋一样,围棋是高度复杂的战略游戏,无法依靠机会和运气取胜。然而和象棋不同的是,没人能解释高段位围棋该如何下。事实上,甚至连围棋大师都无法完全搞懂自己为什么会下得一手好棋。从驾车到辨认面孔,这种不自知是存在于人类诸多能力中的一种普遍现象。英国哲学家、科学家迈克尔·波拉尼描绘这种奇异的状态时说:“我们知道的要比我们能表达的多。”人们将这种现象称为“波拉尼的悖论”。
文章称,“波拉尼的悖论”并没有妨碍人民使用电脑来完成一些复杂工作。这些活动的编程需要极高的精确度,以命令电脑具体该做什么。而给电脑编程的老方法在应用方面非常受限,在很多领域都行不通。
“深蓝”之所以能够有超人的绝佳表现,几乎纯粹是靠运算能力:它被输入了数百万个国际象棋案例,因此能在众多可能性中进行筛选,从而确定下一步棋的最佳位置。然而围棋落子的可能性要多得多,即便是运算速度最快的电脑都无法模拟哪怕其中一小部分。
文章称,“阿尔法围棋”生动地诠释了新方法的威力。这个方法是创建一个几乎完全靠自学,并通过观察成功与失败案例来掌握得胜技巧的系统。
“阿尔法围棋”确实使用了模拟的方式和传统搜索算法来帮它下了几步棋,但真正的突破则在于它能够克服“波拉尼的悖论”。之所以能做到这点,是因为它既能通过具体案例,也能通过自身经验来得出决胜战略。这些案例取材于2500年围棋史上出自围棋大师之手的无数经典棋局。为了弄清这些棋局中蕴含的决胜策略,系统使用了一种名为“深层学习”的超凡方法,能够梳理出模式并一下抓住重点,而不会迷失在信息海洋中。
文章称,对于人脑来说,学习是一个在神经元之间形成并加强关联的过程。“深层学习”系统采取了类似方式,因而被称作“神经网络”。它在软件中建立起数十亿节点和关联,使用案例“训练集”来强化刺激(正在下的棋)和反应(下一步棋)间的关联,而后再对系统进行新刺激,并观察其反应。通过另一种名叫“强化学习”的技术,“阿尔法围棋”还和自己下了数百万盘棋,以记住有效走法和战略。
“深层学习”和“强化学习”并非新生事物,然而直到最近,我们才认清其威力以及其所能到达的境地。
文章称,虽然还有很长的路要走,但其意义深远。未来数年内,技术带来的变革将会波及人类经济。了解并解决科技迅速发展所带来的社会挑战仍是人类所面临的任务,没有机器能够替代我们完成。
(2016-03-19 11:28:07)
中国网友向阿尔法围棋挑战:敢来打麻将吗?
参考消息网17-3月16日报道
港媒称,先是国际象棋。然后是围棋。现在,中国网民问,人工智能敢不敢接受终极挑战——麻将。
据香港《南华早报》网站3月15日报道,这项挑战是在谷歌研制的电脑程序“阿尔法围棋”(AlphaGo)在一系列比赛中获胜后提出的。
报道称,“阿尔法围棋”已经证明自己可以打败某些最优秀的围棋选手:它最近连赢了韩国棋手李世石三局。
麻将通常有四个人打,每人从144张牌中抓牌,然后出牌,可以吃碰别人的牌,组成一副能和的牌。与围棋相比,麻将的排列组合要少得多,但包括运气和其他一些有利于人类的因素。
报道称,很多人表示对“阿尔法围棋”的胜利感到高兴,也有些人认为,要打败中国麻将选手则困难得多。
一位内地网民在新浪微博上称:“围棋从数学角度看是最难的游戏,但麻将从人类智力角度看最难。”
这位用户写道:“‘阿尔法围棋’能挑战中国麻将吗?我敢肯定,一位普通四川大妈就可以完胜它。”
报道称,有些研究也支持这种看法。一篇名叫《走进科学:为什么AlphaGo不敢挑战麻将》的文章说,一台安装了“阿尔法围棋”的电脑挑战三个人类选手一点儿胜算没有;就算有两台安装了“阿尔法围棋”的电脑挑战两个人类选手,人类也会战胜机器,因为一位人类选手可以看懂另一位的表情暗示;而三个“阿尔法围棋”就太贵了。
这篇文章还称,中国不同地区的居民发明了不同的麻将玩法,麻将的变化因此比围棋还多。
作者还称:“要学习麻将,‘阿尔法围棋’还得熟悉人们在打牌时使用的方言。”
报道称,关于麻将问题,有一位网民给出最终的答案:“阻止‘阿尔法围棋’战胜人类的最快办法就是拔掉电源。”
(2016-03-16 10:04:40)
台媒:大陆电脑围棋欲战AlphaGo 称其计算上有失误
参考消息网17-3月31日报道 台媒称,谷歌人工智能AlphaGo击败李

链接地址:http://blog.sciencenet.cn/blog-226-1082013.html



(華成旅行最便宜 03-3833-9823)
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关于都市网 | 服务条款 | 开放平台 | 广告服务 | 商务洽谈 | 都市网招聘 | 都市网公益 | 客服中心 | 网站导航 | 版权所有

手机版|小黑屋|Comsenz Inc.  

© 2001-2013 源码论坛 Inc.    Powered by Weekend Design Discuz! X3.2

GMT+8, 2024-11-22 22:15 , Processed in 0.072547 second(s), 18 queries .

快速回复 返回顶部 返回列表