由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 昨天的比赛至少是让先差距
相关主题
看阿法狗的自战棋谱有彻底崩溃的感觉哈比斯说没用高手期局训练啊
master给柯杰赢了周志华:关于强化学习策略
台湾的CGI竟然赢了腾讯的绝艺我靠,这10多年前的小说要火!太像Alphago了!
引出一个问题:看棋谱判断棋力,是不是很难精确?谷歌推出真正2.0版本AlphaGo 摈弃人类棋谱(图)
李世石是不是对alphago的下棋方法了解太少了Alphago Zero
阿法狗第二局最令人震惊的地方在于从这两段话,可以看出柯洁确实要高出古力一筹
alphago真是深不可测呀可靠资料显示,狗认为自己第二局曾短暂落后
阿法狗生怕人类还不够绝望第三局估计也没啥可看了
相关话题的讨论汇总
话题: alphago话题: 三子话题: 柯杰话题: 胜率话题: 半目
进入Go版参与讨论
1 (共1页)
j**********r
发帖数: 3798
1
分先实在没得下。
a*w
发帖数: 4495
2
半目,最小的差距了

【在 j**********r 的大作中提到】
: 分先实在没得下。
z****l
发帖数: 5282
3
黑收后,盘面6目,输一目半。


: 半目,最小的差距了



【在 a*w 的大作中提到】
: 半目,最小的差距了
j**********r
发帖数: 3798
4
那不说明问题,机器追求的是最简赢,不是最大赢。中盘白治孤之后是盘面相当的局面。

【在 z****l 的大作中提到】
: 黑收后,盘面6目,输一目半。
:
:
: 半目,最小的差距了
:

b*******8
发帖数: 37364
5
如果真是说的内部比赛能让去年狗三子,那真是无法想象了。有生之年能看到棋谱,死
了也值了。
O**l
发帖数: 12923
6
已经确认了 让两子全胜
让三子赢一半


: 如果真是说的内部比赛能让去年狗三子,那真是无法想象了。有生之年能看到棋
谱,死

: 了也值了。



【在 b*******8 的大作中提到】
: 如果真是说的内部比赛能让去年狗三子,那真是无法想象了。有生之年能看到棋谱,死
: 了也值了。

x**8
发帖数: 1939
7
柯杰让4子能扛住就不错,
昨天的棋根本看不出来阿狗多深,

【在 j**********r 的大作中提到】
: 分先实在没得下。
l*****a
发帖数: 3630
8
让4子是多么棋盲的说法

【在 x**8 的大作中提到】
: 柯杰让4子能扛住就不错,
: 昨天的棋根本看不出来阿狗多深,

x**8
发帖数: 1939
9
你觉得让4子就能摆脱半目负的命运么?

【在 l*****a 的大作中提到】
: 让4子是多么棋盲的说法
o********s
发帖数: 971
10
中盘最多的时候落后11-12目,所以让先绝对没问题,让两子不好说了。
相关主题
阿法狗第二局最令人震惊的地方在于哈比斯说没用高手期局训练啊
alphago真是深不可测呀周志华:关于强化学习策略
阿法狗生怕人类还不够绝望我靠,这10多年前的小说要火!太像Alphago了!
进入Go版参与讨论
x**8
发帖数: 1939
11
关键是啊狗看差不多够了就收手了,
并且之前的招法也可以下得更复杂,

【在 o********s 的大作中提到】
: 中盘最多的时候落后11-12目,所以让先绝对没问题,让两子不好说了。
b*******8
发帖数: 37364
12
如果是电脑之间让三子,好胜负不奇怪,如果被让的电脑采取保守走法,不断退让,最
后企图半目赢。但由于对方也是狗,最后保半目不像对科杰那么稳妥,一不小心就变输
半目了。如果是这样的话对人就很难让三子。
还是让人三子下下看看,或者把狗让狗三子的棋谱拿出来看看。就清楚了。
n*******s
发帖数: 17267
13
半目就是半目,别吹些没用的,真是中盘领先那么多最后只赢半目只能说明电脑臭
a*****g
发帖数: 19398
14
因为围棋现在被搞成了输赢的竞技,只管输赢不管多少了
如果是按输赢的子数加码,那又不一样了

【在 n*******s 的大作中提到】
: 半目就是半目,别吹些没用的,真是中盘领先那么多最后只赢半目只能说明电脑臭
n******n
发帖数: 409
15
今天应该下让二子棋其实。
w***u
发帖数: 17713
16
可能目标函数有问题,只追求输赢,不会扩大战果,当占有优势时,不追求赢更多,反
而退缩以提高赢的概率。就像足球比赛,前20分钟搞了个3比0,然后全队退守禁区附近
搞铁桶战术,很没有体育精神。这可能是google程序员的问题。

【在 n*******s 的大作中提到】
: 半目就是半目,别吹些没用的,真是中盘领先那么多最后只赢半目只能说明电脑臭
e*****1
发帖数: 27
17

ZT:
误区二:AlphaGo也会下出一些明显不好的招数,是因为他自我判断形式占优,而放松
了自身的要求。
AlphaGo的搜索策略就是优先对获胜概率比较大的分支进行更多的深度搜索,这个
策略在任何时候都不会改变,也不能改变。他不会觉得自己优势了就下出缓手。下得不
好的时候是因为其价值判断本来就是一个近似,而且搜索空间也不能穷尽,得不到最优
解,因此,有时估计还不错的棋,其实不一定是真的最好的下法,AlphaGo出现这种不
稳定状况是正常的。这也是人类善存的希望所在。当然人类也有自身的弱点,如疲劳、
情绪波动等,人也会判断失误。而且棋局很长,有些之前不太好的棋,经过后面的变化
(包括不是预料中的变化)有可能会变成好棋。所以,不是所有的错误,都会直接影响
到比赛的结果。而且现在大家似乎有点怕AlphaGo了,即便是AlphaGo下出一招不好的棋
,大家更多的是怀疑自己的水平(是不是我们没看懂啊?),而选择相信AlphaGo的“
深谋远虑“。
误区三:AlphaGo可以不断自学习,从新的棋局里获取经验,快速提升自己。
AlphaGo的系统由于参数非常多,需要大量的数据来训练,新增的几幅棋谱对提高
它的棋力起不到任何作用。而且AlphaGo在做参数调整时是针对一大批数据的整体优化
,也必须对很多棋谱做批量处理,训练时间非常长,不可能在很短时间内大幅提升自身
的水平。即便是同一组训练棋谱,参数调整方法不一样也会训练出棋力水平差异较大的
系统。其实AlphaGo是通过自我对弈来生成很多棋谱,然后利用棋谱中的(两个连续的
)盘面跟最后的胜负对应关系训练出价值网络来。这里只是借用了一下强化学习的框架
来训练深度神经网络的参数而已,主要贡献还是深度学习的近似能力带来的(解决了传
统强化学习针对复杂环境和动作状态无法求解的难题)。因此,AlphaGo并没有大家想
象的那种自我博弈就能自己不断进步的能力。
误区四:AlphaGo会故意放水输掉一局比赛。
这个没有可能。要想输还不能输的那么难看和明显,是一件非常难办的事情,可能
比赢棋还要难。在模型训练好之后,AlphaGo能够临时改动的只有在搜索部分投入的资
源多少(搜索多大的空间)可以改动。缩减的太小,几乎不会有太大变化,但如果缩减
太多,就会下出一些非常低级的棋来。这点从技术角度来讲很难把握。
误区五:计算机的计算能力一定比人强,所以不要去跟AlphaGo比计算,应该把局
面简单化,避免复杂的战斗。
AlphaGo依靠的是一种基于树的搜索算法,遇到复杂局面搜索空间变大,对未来输
赢的价值判断也会变难。因此,人算不过来的复杂局面,对AlphaGo来说也很困难。如
果局面太简单,机器可以非常好的计算出比较优的解,人类棋手更加没有希望。因此,
把局面弄复杂,人类棋手才有希望获胜,虽然这个对人类也提出了更大的挑战。

【在 j**********r 的大作中提到】
: 分先实在没得下。
o*****p
发帖数: 2977
18
Deepmind头说了,柯洁第二盘前一百手和Alphago不分上下。这种情况还能让2子是不
可能的。不要说三子四子了。
柯洁的第二盘可以说探到阿法狗的深度了。

【在 x**8 的大作中提到】
: 柯杰让4子能扛住就不错,
: 昨天的棋根本看不出来阿狗多深,

O**l
发帖数: 12923
19
这话去年李世石第三盘结束时候的发布会 deepmind也说过

【在 o*****p 的大作中提到】
: Deepmind头说了,柯洁第二盘前一百手和Alphago不分上下。这种情况还能让2子是不
: 可能的。不要说三子四子了。
: 柯洁的第二盘可以说探到阿法狗的深度了。

o*****p
发帖数: 2977
20
那就同理,说明那时候的阿法狗不能让李世石2子。

【在 O**l 的大作中提到】
: 这话去年李世石第三盘结束时候的发布会 deepmind也说过
相关主题
谷歌推出真正2.0版本AlphaGo 摈弃人类棋谱(图)可靠资料显示,狗认为自己第二局曾短暂落后
Alphago Zero第三局估计也没啥可看了
从这两段话,可以看出柯洁确实要高出古力一筹对我狗的崇拜要盲目
进入Go版参与讨论
O**l
发帖数: 12923
21
未必 去年的阿法狗比现在的绝艺应该稍强
现在的柯杰对绝艺的胜率有多少
而且今天比赛 deepmind发布会原话是50手差不多 100手差距比任何人小
但是差距是多小 ? deepzengo给的差距是40% vs 60%
在开劫之前deepzengo给的胜率是72%
局面复杂的情况下 本身不容易收敛 需要大量分支去找最优子树
找到了哪怕高1% 都是必胜
而且现在职业棋手下完以后冷静分析 目前结论也都回归完败了
讲棋的时候压根没算清

【在 o*****p 的大作中提到】
: 那就同理,说明那时候的阿法狗不能让李世石2子。
O**l
发帖数: 12923
22
话说柯杰已经是5连败阿狗了 全是不超过120手 胜负已定
可以降格了
o*****p
发帖数: 2977
23
deepzen的几率预测不会比一流旗手强。这个40% vs 60%;72%没多少credit。
至于“找到了哪怕高1% 都是必胜”这就是胡扯了。找到了就是应该预测100%。

【在 O**l 的大作中提到】
: 未必 去年的阿法狗比现在的绝艺应该稍强
: 现在的柯杰对绝艺的胜率有多少
: 而且今天比赛 deepmind发布会原话是50手差不多 100手差距比任何人小
: 但是差距是多小 ? deepzengo给的差距是40% vs 60%
: 在开劫之前deepzengo给的胜率是72%
: 局面复杂的情况下 本身不容易收敛 需要大量分支去找最优子树
: 找到了哪怕高1% 都是必胜
: 而且现在职业棋手下完以后冷静分析 目前结论也都回归完败了
: 讲棋的时候压根没算清

o*****p
发帖数: 2977
24
降格没问题。让2子就未必。3子4子,那纯属扯了。

【在 O**l 的大作中提到】
: 话说柯杰已经是5连败阿狗了 全是不超过120手 胜负已定
: 可以降格了

O**l
发帖数: 12923
25
deepzengo中盘实力碾压柯杰现在有悬念?
找到了就是应该预测100% LOL
你压根UCB1公式是啥 UCB1永远不可能是100%
而且同样是找到必胜分支 先找到比后找到的胜率要高得多得多!!

【在 o*****p 的大作中提到】
: 降格没问题。让2子就未必。3子4子,那纯属扯了。
O**l
发帖数: 12923
26
柯杰现在处于乱战被杀崩没机会
功夫棋被安乐死也没机会
让两子 怎么下?

【在 o*****p 的大作中提到】
: 降格没问题。让2子就未必。3子4子,那纯属扯了。
o*****p
发帖数: 2977
27

这是啥奇葩逻辑。

【在 O**l 的大作中提到】
: 柯杰现在处于乱战被杀崩没机会
: 功夫棋被安乐死也没机会
: 让两子 怎么下?

o*****p
发帖数: 2977
28
胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后100
盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,那么
就该在预测的胜率上表现出来。
“找到了哪怕高1% 都是必胜”真是胡扯得没边了。

【在 O**l 的大作中提到】
: deepzengo中盘实力碾压柯杰现在有悬念?
: 找到了就是应该预测100% LOL
: 你压根UCB1公式是啥 UCB1永远不可能是100%
: 而且同样是找到必胜分支 先找到比后找到的胜率要高得多得多!!

O**l
发帖数: 12923
29
让两子 优势不够大 下功夫棋可以被阿狗子效高慢慢磨 耗光
下对杀 你让的两子还有优势? 现在看阿狗对杀远强人类
这里还要假设你布局不中他飞刀 现在看阿狗布局飞刀无数

【在 o*****p 的大作中提到】
: 胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后100
: 盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,那么
: 就该在预测的胜率上表现出来。
: “找到了哪怕高1% 都是必胜”真是胡扯得没边了。

O**l
发帖数: 12923
30
对于你们这外行来说 当然只能说胜率了
我跟你说UCB1你听得懂吗?
内部函数是最大化 UCB1 自己去查公式

100

【在 o*****p 的大作中提到】
: 胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后100
: 盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,那么
: 就该在预测的胜率上表现出来。
: “找到了哪怕高1% 都是必胜”真是胡扯得没边了。

相关主题
再次思考“胜率”的误区master给柯杰赢了
Google的AlphaGo和李世石围棋比赛后有哪些影响台湾的CGI竟然赢了腾讯的绝艺
看阿法狗的自战棋谱有彻底崩溃的感觉引出一个问题:看棋谱判断棋力,是不是很难精确?
进入Go版参与讨论
M********n
发帖数: 4650
31
我倒觉得对杀阿花狗不见得特强,昨天就是例证,但狗狗一向求稳当,自己的棋都走得
很严实,我渣劫材少很可以理解,或者几乎是必然的。

【在 O**l 的大作中提到】
: 让两子 优势不够大 下功夫棋可以被阿狗子效高慢慢磨 耗光
: 下对杀 你让的两子还有优势? 现在看阿狗对杀远强人类
: 这里还要假设你布局不中他飞刀 现在看阿狗布局飞刀无数

o*****p
发帖数: 2977
32
这就是你在臆想了,没有任何真实数据支持。高低职业棋手之间都让不了两子。对你
是飞刀无数,对柯洁可不是。

【在 O**l 的大作中提到】
: 让两子 优势不够大 下功夫棋可以被阿狗子效高慢慢磨 耗光
: 下对杀 你让的两子还有优势? 现在看阿狗对杀远强人类
: 这里还要假设你布局不中他飞刀 现在看阿狗布局飞刀无数

O**l
发帖数: 12923
33
现在看昨天柯一直处于崩盘状
右下被封起来 硬杀气白就死了
昨天古力讲棋的是没算清而已
如果你提前考虑右下已经死了 哪来的机会啊

【在 M********n 的大作中提到】
: 我倒觉得对杀阿花狗不见得特强,昨天就是例证,但狗狗一向求稳当,自己的棋都走得
: 很严实,我渣劫材少很可以理解,或者几乎是必然的。

O**l
发帖数: 12923
34
柯杰这5盘几乎盘盘中飞刀
职业高手能打职业低手60+:0? 而且几乎盘盘100多手就完蛋?
柯杰对业5能有这表现吗

【在 o*****p 的大作中提到】
: 这就是你在臆想了,没有任何真实数据支持。高低职业棋手之间都让不了两子。对你
: 是飞刀无数,对柯洁可不是。

o*****p
发帖数: 2977
35

“胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后
100盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,
那么就该在预测的胜率上表现出来。”
你比阿法狗都牛逼。人家俩阿法狗互有输赢40% vs 60%,你就是高过1%必胜了。你这么
内行去指导阿法狗指导出个围棋之神好了。

【在 O**l 的大作中提到】
: 对于你们这外行来说 当然只能说胜率了
: 我跟你说UCB1你听得懂吗?
: 内部函数是最大化 UCB1 自己去查公式
:
: 100

o*****p
发帖数: 2977
36
“一直处于崩盘状”你神志不清了吧?

【在 O**l 的大作中提到】
: 现在看昨天柯一直处于崩盘状
: 右下被封起来 硬杀气白就死了
: 昨天古力讲棋的是没算清而已
: 如果你提前考虑右下已经死了 哪来的机会啊

O**l
发帖数: 12923
37
神志不清应该是你
自己看围棋TV昨天的视频 一直没机会
看看今天范廷钰 胡耀月的棋评都是完败
阿狗只是说前100手差距小 到底差多少?
同门比柯杰强的deepzen说60%+ 119以后72%
你不信 LOL

【在 o*****p 的大作中提到】
: “一直处于崩盘状”你神志不清了吧?
O**l
发帖数: 12923
38
傻货 他说的互有胜负的胜率
和盘面估价的胜率不是一个东西 一个统计胜负比较关系 一个是估价函数
行棋时候的胜率是估价函数UCB1 lol

【在 o*****p 的大作中提到】
: “一直处于崩盘状”你神志不清了吧?
o*****p
发帖数: 2977
39

这是30秒。对AI这30秒几乎不是限制,对人类就是限制巨大。
类似可以比较:如果职业高手任意耗时,职业低手30秒,两人都是高度集中,全力以
赴,能不能60+:0? 而且几乎盘盘100多手就完蛋?
未必不能。两种状态下差距很大。

【在 O**l 的大作中提到】
: 柯杰这5盘几乎盘盘中飞刀
: 职业高手能打职业低手60+:0? 而且几乎盘盘100多手就完蛋?
: 柯杰对业5能有这表现吗

o*****p
发帖数: 2977
40

范廷钰 胡耀月的棋评在这里
https://www.zhihu.com/question/60279568
所以我说你是神志不清了。

【在 O**l 的大作中提到】
: 神志不清应该是你
: 自己看围棋TV昨天的视频 一直没机会
: 看看今天范廷钰 胡耀月的棋评都是完败
: 阿狗只是说前100手差距小 到底差多少?
: 同门比柯杰强的deepzen说60%+ 119以后72%
: 你不信 LOL

相关主题
引出一个问题:看棋谱判断棋力,是不是很难精确?alphago真是深不可测呀
李世石是不是对alphago的下棋方法了解太少了阿法狗生怕人类还不够绝望
阿法狗第二局最令人震惊的地方在于哈比斯说没用高手期局训练啊
进入Go版参与讨论
O**l
发帖数: 12923
41
30秒 一步 柯杰能对哪个职业初段 60:0
尼玛 满棋柯最近刚输了个职业初段

【在 o*****p 的大作中提到】
:
: 范廷钰 胡耀月的棋评在这里
: https://www.zhihu.com/question/60279568
: 所以我说你是神志不清了。

O**l
发帖数: 12923
42
范廷钰这盘棋有说过 柯有机会?
我靠这个中文看不懂了
范一个柯的好棋都举不出来 45手就说柯完蛋了
打脸啊
貌似昨天李世石也说44手完蛋
胡耀月文章一颗上有 标题明确完败

【在 o*****p 的大作中提到】
:
: 范廷钰 胡耀月的棋评在这里
: https://www.zhihu.com/question/60279568
: 所以我说你是神志不清了。

o*****p
发帖数: 2977
43
。。。你这状态我再争就是浪费时间了。

【在 O**l 的大作中提到】
: 傻货 他说的互有胜负的胜率
: 和盘面估价的胜率不是一个东西 一个统计胜负比较关系 一个是估价函数
: 行棋时候的胜率是估价函数UCB1 lol

O**l
发帖数: 12923
44
这是说柯杰有机会 不是明明在说柯杰完败吗
我靠这智商基本告别自行车了

【在 o*****p 的大作中提到】
: 。。。你这状态我再争就是浪费时间了。
o*****p
发帖数: 2977
45

“一直处于崩盘状”你神志不清了吧?

【在 O**l 的大作中提到】
: 这是说柯杰有机会 不是明明在说柯杰完败吗
: 我靠这智商基本告别自行车了

O**l
发帖数: 12923
46
你这智商 和我争纯属show下限

【在 o*****p 的大作中提到】
:
: “一直处于崩盘状”你神志不清了吧?

O**l
发帖数: 12923
47
范一个柯的好棋都举不出来 45手就说柯完蛋了
打脸啊
貌似昨天李世石也说44手完蛋
胡耀月文章一颗上有 标题明确完败

【在 o*****p 的大作中提到】
:
: “一直处于崩盘状”你神志不清了吧?

o*****p
发帖数: 2977
48
关于让三子,AlphaGo首席研究员David Silver下午通过邮件做了个声明。简单来说,
就是新版可以让旧版三子,不代表能和棋力与旧版差不多的人类棋手对弈时,也能让三子
“新版本的AlphaGo, 已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色
。也因此,新版本的AlphaGo可以让旧的版本三个子。但这和AlphaGo与从未对弈过的人
类棋手对局,这没有什么意义(doesn't mean anything),尤其是柯洁这样的围棋大
师,他可能发现Alphago未曾展露的新弱点。这样的度量是无法比较的。对于本周的第
二轮和第三轮对局,我们拭目以待。 ”
The new version of AlphaGo has trained against itself millions of times, and
has learned to become very good at exploiting the weaknesses in previous
versions. That's why it's about three stones stronger in head-to-head games
against its older self. But that doesn't mean anything when it comes up
against a human player with whom AlphaGo has never trained - particularly a
great master like Ke Jie, who can uncover new weaknesses we don't know about
. The scales just aren't comparable. We are excited for the second and third
games this week!
O**l
发帖数: 12923
49
人家谦虚来个 “这样的度量是无法比较的”
其实就是没有下过不确定的意思
你这玩意一口咬定做不到 这么多盘表现的实力像做不到吗
柯杰自己说了 AlphaGo能让绝艺两子 柯杰被绝艺多少连杀来着

三子
and
games

【在 o*****p 的大作中提到】
: 关于让三子,AlphaGo首席研究员David Silver下午通过邮件做了个声明。简单来说,
: 就是新版可以让旧版三子,不代表能和棋力与旧版差不多的人类棋手对弈时,也能让三子
: “新版本的AlphaGo, 已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色
: 。也因此,新版本的AlphaGo可以让旧的版本三个子。但这和AlphaGo与从未对弈过的人
: 类棋手对局,这没有什么意义(doesn't mean anything),尤其是柯洁这样的围棋大
: 师,他可能发现Alphago未曾展露的新弱点。这样的度量是无法比较的。对于本周的第
: 二轮和第三轮对局,我们拭目以待。 ”
: The new version of AlphaGo has trained against itself millions of times, and
: has learned to become very good at exploiting the weaknesses in previous
: versions. That's why it's about three stones stronger in head-to-head games

1 (共1页)
进入Go版参与讨论
相关主题
第三局估计也没啥可看了李世石是不是对alphago的下棋方法了解太少了
对我狗的崇拜要盲目阿法狗第二局最令人震惊的地方在于
再次思考“胜率”的误区alphago真是深不可测呀
Google的AlphaGo和李世石围棋比赛后有哪些影响阿法狗生怕人类还不够绝望
看阿法狗的自战棋谱有彻底崩溃的感觉哈比斯说没用高手期局训练啊
master给柯杰赢了周志华:关于强化学习策略
台湾的CGI竟然赢了腾讯的绝艺我靠,这10多年前的小说要火!太像Alphago了!
引出一个问题:看棋谱判断棋力,是不是很难精确?谷歌推出真正2.0版本AlphaGo 摈弃人类棋谱(图)
相关话题的讨论汇总
话题: alphago话题: 三子话题: 柯杰话题: 胜率话题: 半目