ALPHAGO输棋分析之二 -- 原理 - Go版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Go版 - ALPHAGO输棋分析之二 -- 原理

相关主题
● ALPHAGO输棋分析之三 -- 原因	● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● ALPHAGO输棋分析之一 -- 现象	● 金明完9段点评AlphaGo: 缺点明显
● ALPHAGO输棋分析之四 -- 解决	● 罗洗河让AlphaGo四子的说法没有什么错
● ALPHAGO输棋分析之五 -- 其他	● 谈谈AlphaGo的算法【转载】
● 说说human learning吧	● AlphaGo对战李世石谁能赢？两万字长文深挖围棋AI技术
● 猜一下几个AlphaGo崩了的原因	● 是不是今晚就要下了？
● 又一个布局请大家点评	● alphaGo会发明新的应手和定势！
● master 布局一般中盘厉害	● alphaGO还是有弱点的

相关话题的讨论汇总
话题: alphago话题: 仿真话题: 招法话题: 输棋话题: 线路

进入Go版参与讨论

1

(共1页)

s***u 发帖数: 80	1 为什么前三局表现强悍的ALPHAGO这一次会出现这么大的毛病？从原理上讲，蒙特卡洛算法考虑下哪一手棋，要进行数百万次的仿真，其实质是每一次仿真相当于投入一个单位的计算资源（把当前局面从头仿真到棋局结束），从无比庞大的对局博弈树中索取回一点点信息。其控制过程保证了这次投入仿真的路径是最有希望获得有价值信息的。（控制过程的细节就不讲了，但是基本思路是下一次再仿真时候选择的路径和前面仿真得到的胜负信息和招法信息是非常相关的），所以不要以为选择哪个路线仿真是完全随机的。那为什么第78手棋以及后面的正确应手，在机器计算自己的第77、75、73乃至更早之前的招法，没有给这条线路投入足够多的计算量？第一种可能，蒙特卡洛算法本身就有一定的随机性，在局面复杂，招法线路非常隐蔽的条件下，可能就会被别的线路所淹没，需要收敛到正确招法上的仿真次数远远大于数百万次。但是我认为这不是主要原因，因为就ALPHAGO前面几局表现出来的能力，我估计这个计算在他的能力范围之内。当然我也不能完全肯定，因为78手的情况比较复杂，一是位于棋盘中央，相比于边边角角，计算机学习的更少。二是78手的线路牵扯到一个可能的劫和一个征子，从后面看来，计算机是有点晕头。（但如果真是三合一带来的问题，那人类能复现的机率就更小了）
n***i 发帖数: 4627	2 应该还是阿狗的评估体系对劫不能正确评估，这个里面讲的很清楚 http://mp.weixin.qq.com/s?__biz=MzI0MzA3OTI1MA==&mid=403616229& 【在 s***u 的大作中提到】 : 为什么前三局表现强悍的ALPHAGO这一次会出现这么大的毛病？ : 从原理上讲，蒙特卡洛算法考虑下哪一手棋，要进行数百万次的仿真，其实质是每一次 : 仿真相当于投入一个单位的计算资源（把当前局面从头仿真到棋局结束），从无比庞大 : 的对局博弈树中索取回一点点信息。其控制过程保证了这次投入仿真的路径是最有希望 : 获得有价值信息的。（控制过程的细节就不讲了，但是基本思路是下一次再仿真时候选 : 择的路径和前面仿真得到的胜负信息和招法信息是非常相关的），所以不要以为选择哪 : 个路线仿真是完全随机的。 : 那为什么第78手棋以及后面的正确应手，在机器计算自己的第77、75、73乃至更早之前 : 的招法，没有给这条线路投入足够多的计算量？ : 第一种可能，蒙特卡洛算法本身就有一定的随机性，在局面复杂，招法线路非常隐蔽的
g****y 发帖数: 2810	3 谷歌的人回去肯定要看狗的log 【在 s***u 的大作中提到】 : 为什么前三局表现强悍的ALPHAGO这一次会出现这么大的毛病？ : 从原理上讲，蒙特卡洛算法考虑下哪一手棋，要进行数百万次的仿真，其实质是每一次 : 仿真相当于投入一个单位的计算资源（把当前局面从头仿真到棋局结束），从无比庞大 : 的对局博弈树中索取回一点点信息。其控制过程保证了这次投入仿真的路径是最有希望 : 获得有价值信息的。（控制过程的细节就不讲了，但是基本思路是下一次再仿真时候选 : 择的路径和前面仿真得到的胜负信息和招法信息是非常相关的），所以不要以为选择哪 : 个路线仿真是完全随机的。 : 那为什么第78手棋以及后面的正确应手，在机器计算自己的第77、75、73乃至更早之前 : 的招法，没有给这条线路投入足够多的计算量？ : 第一种可能，蒙特卡洛算法本身就有一定的随机性，在局面复杂，招法线路非常隐蔽的
k*l 发帖数: 2574	4 为什么没人请这个教授去啊。比北邮那个教授强多了

1

(共1页)

进入Go版参与讨论

相关主题
● alphaGO还是有弱点的	● 说说human learning吧
● MCTS是怎么判断形势的	● 猜一下几个AlphaGo崩了的原因
● [田渊栋] AlphaGo反倒是有时候局部弱，对杀会有问题	● 又一个布局请大家点评
● 看来电脑围棋压倒人类就在今年了 (转载)	● master 布局一般中盘厉害
● ALPHAGO输棋分析之三 -- 原因	● Nature重磅封面：谷歌人工智能击败欧洲围棋冠军
● ALPHAGO输棋分析之一 -- 现象	● 金明完9段点评AlphaGo: 缺点明显
● ALPHAGO输棋分析之四 -- 解决	● 罗洗河让AlphaGo四子的说法没有什么错
● ALPHAGO输棋分析之五 -- 其他	● 谈谈AlphaGo的算法【转载】

相关话题的讨论汇总
话题: alphago话题: 仿真话题: 招法话题: 输棋话题: 线路

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)