L*********4 发帖数: 883 | 1 1.78没有算到。那个地方比较宽,位置比较多,很难算全。神经网络根据以往手段估计
的都是其它普通手,AlphaGo根据估计的其它普通手算下去自己都是赢,所以就按照赢
棋的优势思维路子走了。
2.下到那个地方之后,局部没有什么好的应手,打劫的那些变化太长了,把系统算超时
了,没有时间之后选择了在浪费时间去算打劫变化之前搜到的最好手段,其实还有好多
即时的应手没有来得及搜(MCTS是个深度优先算法)。
3.白棋联络以后突然觉得自己不行了瞬间进入搅棋模式,如果看CrazyStone,就会发现
在AlphaGo乱下的时候,那时候的胜率从70%以上一下暴跌到接近0,估计AlphaGo的局势
估计也是差不多的.我其实不知道为什么会突然暴跌到接近0,按照人类观点应该还是有
的下的局面。可能他试的大多数分支里白棋都全体连回然后下面又用了很严厉的打入导
致黑棋全局除了上方两角以外完全没有空,要不就是左边一块全死(因为他的白棋太厉
害了,可能都已经看到了绝杀的手段)。所以直接瞬间进入搅棋模式开始在左下角找非
常小概率能成的劫(需要连走三手)。于是立刻大损,然后就没什么戏了。 |
a****t 发帖数: 7049 | 2 (因为他的白棋太厉害了,可能都已经看到了绝杀的手段)
这个有可能 |
d****v 发帖数: 458 | 3 阴谋论现在最fit
但是拔网线的人是个围棋选手,看出来78太厉害了 |
x**w 发帖数: 7947 | 4 本质还是不懂神之一手的意义。狗靠概率,不是逻辑。说错也没错。因为人类顶级棋手
都不是常能下出神之一首。 |
d*********2 发帖数: 48111 | 5 78没那么严厉
我还是更认可这一段
(因为他的白棋太厉害了,可能都已经看到了绝杀的手段)
这个有可能
狗的胜率巨幅变化, 然后找一些无理手搅局, 正常下还不到劣势的程度, 细官子
【在 d****v 的大作中提到】 : 阴谋论现在最fit : 但是拔网线的人是个围棋选手,看出来78太厉害了
|
d*********2 发帖数: 48111 | 6 我能想到87唯一的逻辑就是弃子在右上角多抢2,3目的棋.
这里一定是狗的盘面判断出现了大的起伏
【在 a****t 的大作中提到】 : (因为他的白棋太厉害了,可能都已经看到了绝杀的手段) : 这个有可能
|
d****v 发帖数: 458 | |
t******l 发帖数: 10908 | 8 那大概率的是蓝屏。。。
【在 d****v 的大作中提到】 : stack overflow?
|
L*********4 发帖数: 883 | 9 应该不是简单的程序bug。CrazyStone也有同样形势判断突然暴跌到0.可见用MCTS算法
的所有程序应该都得出了差不多的结论。
【在 d****v 的大作中提到】 : stack overflow?
|
L*********4 发帖数: 883 | 10 Demis Hassabis @demishassabis 2h2 hours ago
When I say 'thought' and 'realisation' I just mean the output of #AlphaGo
value net. It was around 70% at move 79 and then dived on move 87
Demis Hassabis @demishassabis 2h2 hours ago
Mistake was on move 79, but #AlphaGo only came to that realisation on around
move 87
【在 L*********4 的大作中提到】 : 应该不是简单的程序bug。CrazyStone也有同样形势判断突然暴跌到0.可见用MCTS算法 : 的所有程序应该都得出了差不多的结论。
|
|
|
a****t 发帖数: 7049 | 11 几路棋如果后果价值差很大的话,任何中值都不是好的概括。如果是人的话,会有赌徒
心理,不会用中值作判断。所以也许这里的堆积算法里对各种棋路的概率判断太理性而
不人化了(毕竟最终是判断和人走棋)。
【在 L*********4 的大作中提到】 : 应该不是简单的程序bug。CrazyStone也有同样形势判断突然暴跌到0.可见用MCTS算法 : 的所有程序应该都得出了差不多的结论。
|
d****v 发帖数: 458 | 12 79到87就6手棋,
6手远都算不到吗?
around
【在 L*********4 的大作中提到】 : Demis Hassabis @demishassabis 2h2 hours ago : When I say 'thought' and 'realisation' I just mean the output of #AlphaGo : value net. It was around 70% at move 79 and then dived on move 87 : Demis Hassabis @demishassabis 2h2 hours ago : Mistake was on move 79, but #AlphaGo only came to that realisation on around : move 87
|
a****t 发帖数: 7049 | 13 几百个点的六次方,你觉得呢?
【在 d****v 的大作中提到】 : 79到87就6手棋, : 6手远都算不到吗? : : around
|
d*********2 发帖数: 48111 | 14 狗应该不是靠算的, 他应该是有一套胜率evaluation系统
【在 d****v 的大作中提到】 : 79到87就6手棋, : 6手远都算不到吗? : : around
|
L*********4 发帖数: 883 | 15 价值网络不是用那个穷搜法的。价值网络是用MCTS,前面科普过,就是几个业三业五水
平的狗加一定随机性互下一直下到棋局结束然后算胜率。这个局部恐怕下对了的业五狗
极少。大部分业五狗都下错了所以导致误以为赢面还很高。
【在 d****v 的大作中提到】 : 79到87就6手棋, : 6手远都算不到吗? : : around
|
a****t 发帖数: 7049 | 16 业余狗只是初始化,主要靠后来自学。自学必然有盲点,需要高手指点很正常,现在不
是来拜师了吗
【在 L*********4 的大作中提到】 : 价值网络不是用那个穷搜法的。价值网络是用MCTS,前面科普过,就是几个业三业五水 : 平的狗加一定随机性互下一直下到棋局结束然后算胜率。这个局部恐怕下对了的业五狗 : 极少。大部分业五狗都下错了所以导致误以为赢面还很高。
|
d****v 发帖数: 458 | 17 应该引入胜负手的感念
该多算多时候多算会儿
【在 L*********4 的大作中提到】 : 价值网络不是用那个穷搜法的。价值网络是用MCTS,前面科普过,就是几个业三业五水 : 平的狗加一定随机性互下一直下到棋局结束然后算胜率。这个局部恐怕下对了的业五狗 : 极少。大部分业五狗都下错了所以导致误以为赢面还很高。
|
r******i 发帖数: 1445 | 18 蒙特卡洛法用的是业余狗。业余狗一步棋用2微妙,专业狗要用2毫秒,时间上差了1000
倍。蒙特卡洛法要在短时间内大量模拟对局,用不起专业狗。
【在 a****t 的大作中提到】 : 业余狗只是初始化,主要靠后来自学。自学必然有盲点,需要高手指点很正常,现在不 : 是来拜师了吗
|