由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 猜一下几个AlphaGo崩了的原因
相关主题
从第四盘棋看狗狗的弱点Alphago分析,狗狗只能算4手棋。
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军阿法狗第二局最令人震惊的地方在于
阿法狗下围棋离人类还差的远大家对Alphago的胜率理解有误
技术贴(懂围棋的请进)第三局估计也没啥可看了
原来阿尔法下的是5秒版的ZENALPHAGO输棋分析之二 -- 原理
神经网络的结构决定了他的极限阿发狗片面追求胜率
Crazystone 作者改行做麻将了?zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
败招是黑79第四盘阿法狗为啥要认输呀
相关话题的讨论汇总
话题: alphago话题: 白棋话题: move话题: hassabis
进入Go版参与讨论
1 (共1页)
L*********4
发帖数: 883
1
1.78没有算到。那个地方比较宽,位置比较多,很难算全。神经网络根据以往手段估计
的都是其它普通手,AlphaGo根据估计的其它普通手算下去自己都是赢,所以就按照赢
棋的优势思维路子走了。
2.下到那个地方之后,局部没有什么好的应手,打劫的那些变化太长了,把系统算超时
了,没有时间之后选择了在浪费时间去算打劫变化之前搜到的最好手段,其实还有好多
即时的应手没有来得及搜(MCTS是个深度优先算法)。
3.白棋联络以后突然觉得自己不行了瞬间进入搅棋模式,如果看CrazyStone,就会发现
在AlphaGo乱下的时候,那时候的胜率从70%以上一下暴跌到接近0,估计AlphaGo的局势
估计也是差不多的.我其实不知道为什么会突然暴跌到接近0,按照人类观点应该还是有
的下的局面。可能他试的大多数分支里白棋都全体连回然后下面又用了很严厉的打入导
致黑棋全局除了上方两角以外完全没有空,要不就是左边一块全死(因为他的白棋太厉
害了,可能都已经看到了绝杀的手段)。所以直接瞬间进入搅棋模式开始在左下角找非
常小概率能成的劫(需要连走三手)。于是立刻大损,然后就没什么戏了。
a****t
发帖数: 7049
2
(因为他的白棋太厉害了,可能都已经看到了绝杀的手段)
这个有可能
d****v
发帖数: 458
3
阴谋论现在最fit
但是拔网线的人是个围棋选手,看出来78太厉害了
x**w
发帖数: 7947
4
本质还是不懂神之一手的意义。狗靠概率,不是逻辑。说错也没错。因为人类顶级棋手
都不是常能下出神之一首。
d*********2
发帖数: 48111
5
78没那么严厉
我还是更认可这一段
(因为他的白棋太厉害了,可能都已经看到了绝杀的手段)
这个有可能
狗的胜率巨幅变化, 然后找一些无理手搅局, 正常下还不到劣势的程度, 细官子

【在 d****v 的大作中提到】
: 阴谋论现在最fit
: 但是拔网线的人是个围棋选手,看出来78太厉害了

d*********2
发帖数: 48111
6
我能想到87唯一的逻辑就是弃子在右上角多抢2,3目的棋.
这里一定是狗的盘面判断出现了大的起伏

【在 a****t 的大作中提到】
: (因为他的白棋太厉害了,可能都已经看到了绝杀的手段)
: 这个有可能

d****v
发帖数: 458
7
stack overflow?
t******l
发帖数: 10908
8
那大概率的是蓝屏。。。

【在 d****v 的大作中提到】
: stack overflow?
L*********4
发帖数: 883
9
应该不是简单的程序bug。CrazyStone也有同样形势判断突然暴跌到0.可见用MCTS算法
的所有程序应该都得出了差不多的结论。

【在 d****v 的大作中提到】
: stack overflow?
L*********4
发帖数: 883
10
Demis Hassabis ‏@demishassabis 2h2 hours ago
When I say 'thought' and 'realisation' I just mean the output of #AlphaGo
value net. It was around 70% at move 79 and then dived on move 87
Demis Hassabis ‏@demishassabis 2h2 hours ago
Mistake was on move 79, but #AlphaGo only came to that realisation on around
move 87

【在 L*********4 的大作中提到】
: 应该不是简单的程序bug。CrazyStone也有同样形势判断突然暴跌到0.可见用MCTS算法
: 的所有程序应该都得出了差不多的结论。

相关主题
神经网络的结构决定了他的极限Alphago分析,狗狗只能算4手棋。
Crazystone 作者改行做麻将了?阿法狗第二局最令人震惊的地方在于
败招是黑79大家对Alphago的胜率理解有误
进入Go版参与讨论
a****t
发帖数: 7049
11
几路棋如果后果价值差很大的话,任何中值都不是好的概括。如果是人的话,会有赌徒
心理,不会用中值作判断。所以也许这里的堆积算法里对各种棋路的概率判断太理性而
不人化了(毕竟最终是判断和人走棋)。

【在 L*********4 的大作中提到】
: 应该不是简单的程序bug。CrazyStone也有同样形势判断突然暴跌到0.可见用MCTS算法
: 的所有程序应该都得出了差不多的结论。

d****v
发帖数: 458
12
79到87就6手棋,
6手远都算不到吗?

around

【在 L*********4 的大作中提到】
: Demis Hassabis ‏@demishassabis 2h2 hours ago
: When I say 'thought' and 'realisation' I just mean the output of #AlphaGo
: value net. It was around 70% at move 79 and then dived on move 87
: Demis Hassabis ‏@demishassabis 2h2 hours ago
: Mistake was on move 79, but #AlphaGo only came to that realisation on around
: move 87

a****t
发帖数: 7049
13
几百个点的六次方,你觉得呢?

【在 d****v 的大作中提到】
: 79到87就6手棋,
: 6手远都算不到吗?
:
: around

d*********2
发帖数: 48111
14
狗应该不是靠算的, 他应该是有一套胜率evaluation系统

【在 d****v 的大作中提到】
: 79到87就6手棋,
: 6手远都算不到吗?
:
: around

L*********4
发帖数: 883
15
价值网络不是用那个穷搜法的。价值网络是用MCTS,前面科普过,就是几个业三业五水
平的狗加一定随机性互下一直下到棋局结束然后算胜率。这个局部恐怕下对了的业五狗
极少。大部分业五狗都下错了所以导致误以为赢面还很高。

【在 d****v 的大作中提到】
: 79到87就6手棋,
: 6手远都算不到吗?
:
: around

a****t
发帖数: 7049
16
业余狗只是初始化,主要靠后来自学。自学必然有盲点,需要高手指点很正常,现在不
是来拜师了吗

【在 L*********4 的大作中提到】
: 价值网络不是用那个穷搜法的。价值网络是用MCTS,前面科普过,就是几个业三业五水
: 平的狗加一定随机性互下一直下到棋局结束然后算胜率。这个局部恐怕下对了的业五狗
: 极少。大部分业五狗都下错了所以导致误以为赢面还很高。

d****v
发帖数: 458
17
应该引入胜负手的感念
该多算多时候多算会儿

【在 L*********4 的大作中提到】
: 价值网络不是用那个穷搜法的。价值网络是用MCTS,前面科普过,就是几个业三业五水
: 平的狗加一定随机性互下一直下到棋局结束然后算胜率。这个局部恐怕下对了的业五狗
: 极少。大部分业五狗都下错了所以导致误以为赢面还很高。

r******i
发帖数: 1445
18
蒙特卡洛法用的是业余狗。业余狗一步棋用2微妙,专业狗要用2毫秒,时间上差了1000
倍。蒙特卡洛法要在短时间内大量模拟对局,用不起专业狗。

【在 a****t 的大作中提到】
: 业余狗只是初始化,主要靠后来自学。自学必然有盲点,需要高手指点很正常,现在不
: 是来拜师了吗

1 (共1页)
进入Go版参与讨论
相关主题
第四盘阿法狗为啥要认输呀原来阿尔法下的是5秒版的ZEN
阿狗多了一天时间处理数据神经网络的结构决定了他的极限
锵锵请的港大计算机系主任不懂啊Crazystone 作者改行做麻将了?
金明完9段点评AlphaGo: 缺点明显败招是黑79
从第四盘棋看狗狗的弱点Alphago分析,狗狗只能算4手棋。
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军阿法狗第二局最令人震惊的地方在于
阿法狗下围棋离人类还差的远大家对Alphago的胜率理解有误
技术贴(懂围棋的请进)第三局估计也没啥可看了
相关话题的讨论汇总
话题: alphago话题: 白棋话题: move话题: hassabis