j**********r 发帖数: 3798 | |
a*w 发帖数: 4495 | 2 半目,最小的差距了
【在 j**********r 的大作中提到】 : 分先实在没得下。
|
z****l 发帖数: 5282 | 3 黑收后,盘面6目,输一目半。
: 半目,最小的差距了
【在 a*w 的大作中提到】 : 半目,最小的差距了
|
j**********r 发帖数: 3798 | 4 那不说明问题,机器追求的是最简赢,不是最大赢。中盘白治孤之后是盘面相当的局面。
【在 z****l 的大作中提到】 : 黑收后,盘面6目,输一目半。 : : : 半目,最小的差距了 :
|
b*******8 发帖数: 37364 | 5 如果真是说的内部比赛能让去年狗三子,那真是无法想象了。有生之年能看到棋谱,死
了也值了。 |
O**l 发帖数: 12923 | 6 已经确认了 让两子全胜
让三子赢一半
: 如果真是说的内部比赛能让去年狗三子,那真是无法想象了。有生之年能看到棋
谱,死
: 了也值了。
【在 b*******8 的大作中提到】 : 如果真是说的内部比赛能让去年狗三子,那真是无法想象了。有生之年能看到棋谱,死 : 了也值了。
|
x**8 发帖数: 1939 | 7 柯杰让4子能扛住就不错,
昨天的棋根本看不出来阿狗多深,
【在 j**********r 的大作中提到】 : 分先实在没得下。
|
l*****a 发帖数: 3630 | 8 让4子是多么棋盲的说法
【在 x**8 的大作中提到】 : 柯杰让4子能扛住就不错, : 昨天的棋根本看不出来阿狗多深,
|
x**8 发帖数: 1939 | 9 你觉得让4子就能摆脱半目负的命运么?
【在 l*****a 的大作中提到】 : 让4子是多么棋盲的说法
|
o********s 发帖数: 971 | 10 中盘最多的时候落后11-12目,所以让先绝对没问题,让两子不好说了。 |
|
|
x**8 发帖数: 1939 | 11 关键是啊狗看差不多够了就收手了,
并且之前的招法也可以下得更复杂,
【在 o********s 的大作中提到】 : 中盘最多的时候落后11-12目,所以让先绝对没问题,让两子不好说了。
|
b*******8 发帖数: 37364 | 12 如果是电脑之间让三子,好胜负不奇怪,如果被让的电脑采取保守走法,不断退让,最
后企图半目赢。但由于对方也是狗,最后保半目不像对科杰那么稳妥,一不小心就变输
半目了。如果是这样的话对人就很难让三子。
还是让人三子下下看看,或者把狗让狗三子的棋谱拿出来看看。就清楚了。 |
n*******s 发帖数: 17267 | 13 半目就是半目,别吹些没用的,真是中盘领先那么多最后只赢半目只能说明电脑臭 |
a*****g 发帖数: 19398 | 14 因为围棋现在被搞成了输赢的竞技,只管输赢不管多少了
如果是按输赢的子数加码,那又不一样了
【在 n*******s 的大作中提到】 : 半目就是半目,别吹些没用的,真是中盘领先那么多最后只赢半目只能说明电脑臭
|
n******n 发帖数: 409 | |
w***u 发帖数: 17713 | 16 可能目标函数有问题,只追求输赢,不会扩大战果,当占有优势时,不追求赢更多,反
而退缩以提高赢的概率。就像足球比赛,前20分钟搞了个3比0,然后全队退守禁区附近
搞铁桶战术,很没有体育精神。这可能是google程序员的问题。
【在 n*******s 的大作中提到】 : 半目就是半目,别吹些没用的,真是中盘领先那么多最后只赢半目只能说明电脑臭
|
e*****1 发帖数: 27 | 17
ZT:
误区二:AlphaGo也会下出一些明显不好的招数,是因为他自我判断形式占优,而放松
了自身的要求。
AlphaGo的搜索策略就是优先对获胜概率比较大的分支进行更多的深度搜索,这个
策略在任何时候都不会改变,也不能改变。他不会觉得自己优势了就下出缓手。下得不
好的时候是因为其价值判断本来就是一个近似,而且搜索空间也不能穷尽,得不到最优
解,因此,有时估计还不错的棋,其实不一定是真的最好的下法,AlphaGo出现这种不
稳定状况是正常的。这也是人类善存的希望所在。当然人类也有自身的弱点,如疲劳、
情绪波动等,人也会判断失误。而且棋局很长,有些之前不太好的棋,经过后面的变化
(包括不是预料中的变化)有可能会变成好棋。所以,不是所有的错误,都会直接影响
到比赛的结果。而且现在大家似乎有点怕AlphaGo了,即便是AlphaGo下出一招不好的棋
,大家更多的是怀疑自己的水平(是不是我们没看懂啊?),而选择相信AlphaGo的“
深谋远虑“。
误区三:AlphaGo可以不断自学习,从新的棋局里获取经验,快速提升自己。
AlphaGo的系统由于参数非常多,需要大量的数据来训练,新增的几幅棋谱对提高
它的棋力起不到任何作用。而且AlphaGo在做参数调整时是针对一大批数据的整体优化
,也必须对很多棋谱做批量处理,训练时间非常长,不可能在很短时间内大幅提升自身
的水平。即便是同一组训练棋谱,参数调整方法不一样也会训练出棋力水平差异较大的
系统。其实AlphaGo是通过自我对弈来生成很多棋谱,然后利用棋谱中的(两个连续的
)盘面跟最后的胜负对应关系训练出价值网络来。这里只是借用了一下强化学习的框架
来训练深度神经网络的参数而已,主要贡献还是深度学习的近似能力带来的(解决了传
统强化学习针对复杂环境和动作状态无法求解的难题)。因此,AlphaGo并没有大家想
象的那种自我博弈就能自己不断进步的能力。
误区四:AlphaGo会故意放水输掉一局比赛。
这个没有可能。要想输还不能输的那么难看和明显,是一件非常难办的事情,可能
比赢棋还要难。在模型训练好之后,AlphaGo能够临时改动的只有在搜索部分投入的资
源多少(搜索多大的空间)可以改动。缩减的太小,几乎不会有太大变化,但如果缩减
太多,就会下出一些非常低级的棋来。这点从技术角度来讲很难把握。
误区五:计算机的计算能力一定比人强,所以不要去跟AlphaGo比计算,应该把局
面简单化,避免复杂的战斗。
AlphaGo依靠的是一种基于树的搜索算法,遇到复杂局面搜索空间变大,对未来输
赢的价值判断也会变难。因此,人算不过来的复杂局面,对AlphaGo来说也很困难。如
果局面太简单,机器可以非常好的计算出比较优的解,人类棋手更加没有希望。因此,
把局面弄复杂,人类棋手才有希望获胜,虽然这个对人类也提出了更大的挑战。
【在 j**********r 的大作中提到】 : 分先实在没得下。
|
o*****p 发帖数: 2977 | 18 Deepmind头说了,柯洁第二盘前一百手和Alphago不分上下。这种情况还能让2子是不
可能的。不要说三子四子了。
柯洁的第二盘可以说探到阿法狗的深度了。
【在 x**8 的大作中提到】 : 柯杰让4子能扛住就不错, : 昨天的棋根本看不出来阿狗多深,
|
O**l 发帖数: 12923 | 19 这话去年李世石第三盘结束时候的发布会 deepmind也说过
【在 o*****p 的大作中提到】 : Deepmind头说了,柯洁第二盘前一百手和Alphago不分上下。这种情况还能让2子是不 : 可能的。不要说三子四子了。 : 柯洁的第二盘可以说探到阿法狗的深度了。
|
o*****p 发帖数: 2977 | 20 那就同理,说明那时候的阿法狗不能让李世石2子。
【在 O**l 的大作中提到】 : 这话去年李世石第三盘结束时候的发布会 deepmind也说过
|
|
|
O**l 发帖数: 12923 | 21 未必 去年的阿法狗比现在的绝艺应该稍强
现在的柯杰对绝艺的胜率有多少
而且今天比赛 deepmind发布会原话是50手差不多 100手差距比任何人小
但是差距是多小 ? deepzengo给的差距是40% vs 60%
在开劫之前deepzengo给的胜率是72%
局面复杂的情况下 本身不容易收敛 需要大量分支去找最优子树
找到了哪怕高1% 都是必胜
而且现在职业棋手下完以后冷静分析 目前结论也都回归完败了
讲棋的时候压根没算清
【在 o*****p 的大作中提到】 : 那就同理,说明那时候的阿法狗不能让李世石2子。
|
O**l 发帖数: 12923 | 22 话说柯杰已经是5连败阿狗了 全是不超过120手 胜负已定
可以降格了 |
o*****p 发帖数: 2977 | 23 deepzen的几率预测不会比一流旗手强。这个40% vs 60%;72%没多少credit。
至于“找到了哪怕高1% 都是必胜”这就是胡扯了。找到了就是应该预测100%。
【在 O**l 的大作中提到】 : 未必 去年的阿法狗比现在的绝艺应该稍强 : 现在的柯杰对绝艺的胜率有多少 : 而且今天比赛 deepmind发布会原话是50手差不多 100手差距比任何人小 : 但是差距是多小 ? deepzengo给的差距是40% vs 60% : 在开劫之前deepzengo给的胜率是72% : 局面复杂的情况下 本身不容易收敛 需要大量分支去找最优子树 : 找到了哪怕高1% 都是必胜 : 而且现在职业棋手下完以后冷静分析 目前结论也都回归完败了 : 讲棋的时候压根没算清
|
o*****p 发帖数: 2977 | 24 降格没问题。让2子就未必。3子4子,那纯属扯了。
【在 O**l 的大作中提到】 : 话说柯杰已经是5连败阿狗了 全是不超过120手 胜负已定 : 可以降格了
|
O**l 发帖数: 12923 | 25 deepzengo中盘实力碾压柯杰现在有悬念?
找到了就是应该预测100% LOL
你压根UCB1公式是啥 UCB1永远不可能是100%
而且同样是找到必胜分支 先找到比后找到的胜率要高得多得多!!
【在 o*****p 的大作中提到】 : 降格没问题。让2子就未必。3子4子,那纯属扯了。
|
O**l 发帖数: 12923 | 26 柯杰现在处于乱战被杀崩没机会
功夫棋被安乐死也没机会
让两子 怎么下?
【在 o*****p 的大作中提到】 : 降格没问题。让2子就未必。3子4子,那纯属扯了。
|
o*****p 发帖数: 2977 | 27
这是啥奇葩逻辑。
【在 O**l 的大作中提到】 : 柯杰现在处于乱战被杀崩没机会 : 功夫棋被安乐死也没机会 : 让两子 怎么下?
|
o*****p 发帖数: 2977 | 28 胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后100
盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,那么
就该在预测的胜率上表现出来。
“找到了哪怕高1% 都是必胜”真是胡扯得没边了。
【在 O**l 的大作中提到】 : deepzengo中盘实力碾压柯杰现在有悬念? : 找到了就是应该预测100% LOL : 你压根UCB1公式是啥 UCB1永远不可能是100% : 而且同样是找到必胜分支 先找到比后找到的胜率要高得多得多!!
|
O**l 发帖数: 12923 | 29 让两子 优势不够大 下功夫棋可以被阿狗子效高慢慢磨 耗光
下对杀 你让的两子还有优势? 现在看阿狗对杀远强人类
这里还要假设你布局不中他飞刀 现在看阿狗布局飞刀无数
【在 o*****p 的大作中提到】 : 胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后100 : 盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,那么 : 就该在预测的胜率上表现出来。 : “找到了哪怕高1% 都是必胜”真是胡扯得没边了。
|
O**l 发帖数: 12923 | 30 对于你们这外行来说 当然只能说胜率了
我跟你说UCB1你听得懂吗?
内部函数是最大化 UCB1 自己去查公式
100
【在 o*****p 的大作中提到】 : 胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后100 : 盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,那么 : 就该在预测的胜率上表现出来。 : “找到了哪怕高1% 都是必胜”真是胡扯得没边了。
|
|
|
M********n 发帖数: 4650 | 31 我倒觉得对杀阿花狗不见得特强,昨天就是例证,但狗狗一向求稳当,自己的棋都走得
很严实,我渣劫材少很可以理解,或者几乎是必然的。
【在 O**l 的大作中提到】 : 让两子 优势不够大 下功夫棋可以被阿狗子效高慢慢磨 耗光 : 下对杀 你让的两子还有优势? 现在看阿狗对杀远强人类 : 这里还要假设你布局不中他飞刀 现在看阿狗布局飞刀无数
|
o*****p 发帖数: 2977 | 32 这就是你在臆想了,没有任何真实数据支持。高低职业棋手之间都让不了两子。对你
是飞刀无数,对柯洁可不是。
【在 O**l 的大作中提到】 : 让两子 优势不够大 下功夫棋可以被阿狗子效高慢慢磨 耗光 : 下对杀 你让的两子还有优势? 现在看阿狗对杀远强人类 : 这里还要假设你布局不中他飞刀 现在看阿狗布局飞刀无数
|
O**l 发帖数: 12923 | 33 现在看昨天柯一直处于崩盘状
右下被封起来 硬杀气白就死了
昨天古力讲棋的是没算清而已
如果你提前考虑右下已经死了 哪来的机会啊
【在 M********n 的大作中提到】 : 我倒觉得对杀阿花狗不见得特强,昨天就是例证,但狗狗一向求稳当,自己的棋都走得 : 很严实,我渣劫材少很可以理解,或者几乎是必然的。
|
O**l 发帖数: 12923 | 34 柯杰这5盘几乎盘盘中飞刀
职业高手能打职业低手60+:0? 而且几乎盘盘100多手就完蛋?
柯杰对业5能有这表现吗
【在 o*****p 的大作中提到】 : 这就是你在臆想了,没有任何真实数据支持。高低职业棋手之间都让不了两子。对你 : 是飞刀无数,对柯洁可不是。
|
o*****p 发帖数: 2977 | 35
“胜率的意思基本上就是指两个阿法狗下相互的输赢几率。同样下这一子,双方之后
100盘比赛结果该是多少就是多少胜率。如果下这一子,一方“胜率要高得多得多”,
那么就该在预测的胜率上表现出来。”
你比阿法狗都牛逼。人家俩阿法狗互有输赢40% vs 60%,你就是高过1%必胜了。你这么
内行去指导阿法狗指导出个围棋之神好了。
【在 O**l 的大作中提到】 : 对于你们这外行来说 当然只能说胜率了 : 我跟你说UCB1你听得懂吗? : 内部函数是最大化 UCB1 自己去查公式 : : 100
|
o*****p 发帖数: 2977 | 36 “一直处于崩盘状”你神志不清了吧?
【在 O**l 的大作中提到】 : 现在看昨天柯一直处于崩盘状 : 右下被封起来 硬杀气白就死了 : 昨天古力讲棋的是没算清而已 : 如果你提前考虑右下已经死了 哪来的机会啊
|
O**l 发帖数: 12923 | 37 神志不清应该是你
自己看围棋TV昨天的视频 一直没机会
看看今天范廷钰 胡耀月的棋评都是完败
阿狗只是说前100手差距小 到底差多少?
同门比柯杰强的deepzen说60%+ 119以后72%
你不信 LOL
【在 o*****p 的大作中提到】 : “一直处于崩盘状”你神志不清了吧?
|
O**l 发帖数: 12923 | 38 傻货 他说的互有胜负的胜率
和盘面估价的胜率不是一个东西 一个统计胜负比较关系 一个是估价函数
行棋时候的胜率是估价函数UCB1 lol
【在 o*****p 的大作中提到】 : “一直处于崩盘状”你神志不清了吧?
|
o*****p 发帖数: 2977 | 39
这是30秒。对AI这30秒几乎不是限制,对人类就是限制巨大。
类似可以比较:如果职业高手任意耗时,职业低手30秒,两人都是高度集中,全力以
赴,能不能60+:0? 而且几乎盘盘100多手就完蛋?
未必不能。两种状态下差距很大。
【在 O**l 的大作中提到】 : 柯杰这5盘几乎盘盘中飞刀 : 职业高手能打职业低手60+:0? 而且几乎盘盘100多手就完蛋? : 柯杰对业5能有这表现吗
|
o*****p 发帖数: 2977 | 40
范廷钰 胡耀月的棋评在这里
https://www.zhihu.com/question/60279568
所以我说你是神志不清了。
【在 O**l 的大作中提到】 : 神志不清应该是你 : 自己看围棋TV昨天的视频 一直没机会 : 看看今天范廷钰 胡耀月的棋评都是完败 : 阿狗只是说前100手差距小 到底差多少? : 同门比柯杰强的deepzen说60%+ 119以后72% : 你不信 LOL
|
|
|
O**l 发帖数: 12923 | 41 30秒 一步 柯杰能对哪个职业初段 60:0
尼玛 满棋柯最近刚输了个职业初段
【在 o*****p 的大作中提到】 : : 范廷钰 胡耀月的棋评在这里 : https://www.zhihu.com/question/60279568 : 所以我说你是神志不清了。
|
O**l 发帖数: 12923 | 42 范廷钰这盘棋有说过 柯有机会?
我靠这个中文看不懂了
范一个柯的好棋都举不出来 45手就说柯完蛋了
打脸啊
貌似昨天李世石也说44手完蛋
胡耀月文章一颗上有 标题明确完败
【在 o*****p 的大作中提到】 : : 范廷钰 胡耀月的棋评在这里 : https://www.zhihu.com/question/60279568 : 所以我说你是神志不清了。
|
o*****p 发帖数: 2977 | 43 。。。你这状态我再争就是浪费时间了。
【在 O**l 的大作中提到】 : 傻货 他说的互有胜负的胜率 : 和盘面估价的胜率不是一个东西 一个统计胜负比较关系 一个是估价函数 : 行棋时候的胜率是估价函数UCB1 lol
|
O**l 发帖数: 12923 | 44 这是说柯杰有机会 不是明明在说柯杰完败吗
我靠这智商基本告别自行车了
【在 o*****p 的大作中提到】 : 。。。你这状态我再争就是浪费时间了。
|
o*****p 发帖数: 2977 | 45
“一直处于崩盘状”你神志不清了吧?
【在 O**l 的大作中提到】 : 这是说柯杰有机会 不是明明在说柯杰完败吗 : 我靠这智商基本告别自行车了
|
O**l 发帖数: 12923 | 46 你这智商 和我争纯属show下限
【在 o*****p 的大作中提到】 : : “一直处于崩盘状”你神志不清了吧?
|
O**l 发帖数: 12923 | 47 范一个柯的好棋都举不出来 45手就说柯完蛋了
打脸啊
貌似昨天李世石也说44手完蛋
胡耀月文章一颗上有 标题明确完败
【在 o*****p 的大作中提到】 : : “一直处于崩盘状”你神志不清了吧?
|
o*****p 发帖数: 2977 | 48 关于让三子,AlphaGo首席研究员David Silver下午通过邮件做了个声明。简单来说,
就是新版可以让旧版三子,不代表能和棋力与旧版差不多的人类棋手对弈时,也能让三子
“新版本的AlphaGo, 已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色
。也因此,新版本的AlphaGo可以让旧的版本三个子。但这和AlphaGo与从未对弈过的人
类棋手对局,这没有什么意义(doesn't mean anything),尤其是柯洁这样的围棋大
师,他可能发现Alphago未曾展露的新弱点。这样的度量是无法比较的。对于本周的第
二轮和第三轮对局,我们拭目以待。 ”
The new version of AlphaGo has trained against itself millions of times, and
has learned to become very good at exploiting the weaknesses in previous
versions. That's why it's about three stones stronger in head-to-head games
against its older self. But that doesn't mean anything when it comes up
against a human player with whom AlphaGo has never trained - particularly a
great master like Ke Jie, who can uncover new weaknesses we don't know about
. The scales just aren't comparable. We are excited for the second and third
games this week! |
O**l 发帖数: 12923 | 49 人家谦虚来个 “这样的度量是无法比较的”
其实就是没有下过不确定的意思
你这玩意一口咬定做不到 这么多盘表现的实力像做不到吗
柯杰自己说了 AlphaGo能让绝艺两子 柯杰被绝艺多少连杀来着
三子
and
games
【在 o*****p 的大作中提到】 : 关于让三子,AlphaGo首席研究员David Silver下午通过邮件做了个声明。简单来说, : 就是新版可以让旧版三子,不代表能和棋力与旧版差不多的人类棋手对弈时,也能让三子 : “新版本的AlphaGo, 已经过几百万次的自我训练,并在检测旧版本弱点方面表现出色 : 。也因此,新版本的AlphaGo可以让旧的版本三个子。但这和AlphaGo与从未对弈过的人 : 类棋手对局,这没有什么意义(doesn't mean anything),尤其是柯洁这样的围棋大 : 师,他可能发现Alphago未曾展露的新弱点。这样的度量是无法比较的。对于本周的第 : 二轮和第三轮对局,我们拭目以待。 ” : The new version of AlphaGo has trained against itself millions of times, and : has learned to become very good at exploiting the weaknesses in previous : versions. That's why it's about three stones stronger in head-to-head games
|