由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Go版 - 【转】 田渊东:UEC比赛总结
相关主题
技术贴(懂围棋的请进)[田渊栋] AlphaGo反倒是有时候局部弱,对杀会有问题
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
AlphaGo的算法等技术分析Facebook开源了围棋人工智能 DarkForest
李世石前两局每步的胜率估计,同时DF还给出了它计算的最优手,以及实际的结果原来阿尔法下的是5秒版的ZEN
阿尔法狗介绍猜一下几个AlphaGo崩了的原因
国产围棋AI绝艺不错AlphaGo之父:下个版本会让电脑从零学围棋
不管棋渣如何炒作,赢棋是第一位的人工智能下围棋超过人类, 是一个虚假结论, 纯属误导!
依田让四子输给电脑AlphaGo终于要和柯洁作战了
相关话题的讨论汇总
话题: zen话题: uec话题: crazystone话题: 走子话题: 模拟
进入Go版参与讨论
1 (共1页)
s*****V
发帖数: 21731
1
著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:田渊栋
链接:http://zhuanlan.zhihu.com/yuandong/20680393
来源:知乎
上周我和朱岩去日本电气通信大学(University of Electro-Communications, UEC)参
加了第9届UEC杯计算机围棋比赛,获得了第二名的成绩和与小林光一九段下让3子棋的
资格,由我代替DarkForest摆子体会“肉臂”的感觉,开局稍缓,中盘战斗非常有力,
但打劫还是有问题,最后在赢棋的情况下认输了,有点可惜。而Zen同样被让3子赢了五
目左右。这次收获还挺大的,主要是能和诸位做计算机围棋的前辈进行面对面的交流。
Zen的作者加藤英树和CrazyStone的作者Remi Coulom给了我很多建议和意见。他们毕竟
做了很多年的计算机围棋,经验是非常丰富的,而且非常愿意分享。DarkForest目前为
止的主要问题还在快速走子上,快速走子有误,则最后盘面和初始盘面会天差地别,对
最后的胜者估计错误,统计上对胜率的估计也就不准。这样在选定下一招的时候就会有
错。UEC的比赛分为两天,第一天我们输给了Zen和CrazyStone,全是快速走子的问题,
对Zen的这盘将左边的死棋下成活棋,对CrazyStone的这盘则是在模拟时,未能在每次
都让对手点上死活的关键点,导致对大龙的死活判断出了问题,一半模拟认为对手大优
,另一半模拟认为己方大优,最后平均下来反而是己方略好,但事实上对手早就赢定了
。晚上复盘发现了这个问题,终于在凌晨一点修好了一部分,不过说实在离完全修好,
还有很长的路要走。所谓Devil
is in the details,就是这个意思,虽然AlphaGo的大框架很简单,但要做到它这个水
平,还是要花大量时间,两位一作在计算机围棋上多年的功力在此展现。快速走子因为
是需要快(速度达到微秒级别),神经网络目前还是使不上劲的。至少在Zen和
CrazyStone看来,在通过模拟对盘面进行估计这一方面,围棋仍然需要大量的手工规则
去解决各种特殊情况。作者们花了五至十年的时间一点一点地收集各种特殊情况,不停
地积累和调试规则,并且感叹目前为止都没有好的系统性的解决方案。AlphaGo的文章
说的是用大量局部模式加上多类Logistics回归,然而我这里实现出来并不是这样,一
些死活和对杀的情况必须要百分之百做对,而Logistics回归输出的则是概率,所以经
常有下错的时候。我猜测AlphaGo可能也会有类似的规则,但是文章中似乎并未提及。
如果他们的估值网络非常厉害,那这些规则都可以去掉了。但是看他们最新在UCI的演
讲,由快速走子和估值网络分别得到的两类胜率似乎都比较重要。第一天台湾团队的
CGI
Intelligence在小组赛中七战全胜,最后一局还赢了Zen,但在第二天的淘汰赛中输给
了我们。我猜测他们也是基于相似框架的算法,但是DCNN或者说大局观可能有所不及,
在模拟盘面方面,则同样有一些特殊情况未能处理。所以导致一开始布局就落后,然后
为了获胜而冒险侵入对方领地,却因为计算不够精确而失败。
D*******r
发帖数: 2323
2
黑森林对小林光一的那盘是赢棋认输?
我觉得阿法狗对于快速摆局的胜率统计,一些局面是作为outlier给抛弃掉的。从阿发
狗的棋谱就可以看到,它没有一盘棋是大龙死活会决定胜负的,它全按照大龙能活来做
局势判断。
所以,我猜想,摆局结果如果黑白目数差别超过某个数,这个局面就作为无效局面抛弃
掉,不计入胜率统计。

【在 s*****V 的大作中提到】
: 著作权归作者所有。
: 商业转载请联系作者获得授权,非商业转载请注明出处。
: 作者:田渊栋
: 链接:http://zhuanlan.zhihu.com/yuandong/20680393
: 来源:知乎
: 上周我和朱岩去日本电气通信大学(University of Electro-Communications, UEC)参
: 加了第9届UEC杯计算机围棋比赛,获得了第二名的成绩和与小林光一九段下让3子棋的
: 资格,由我代替DarkForest摆子体会“肉臂”的感觉,开局稍缓,中盘战斗非常有力,
: 但打劫还是有问题,最后在赢棋的情况下认输了,有点可惜。而Zen同样被让3子赢了五
: 目左右。这次收获还挺大的,主要是能和诸位做计算机围棋的前辈进行面对面的交流。

I******n
发帖数: 5952
3
这个CGI Intelligence就是输给黑嘉嘉那个吧?
D*******r
发帖数: 2323
4
想想田渊栋也很不容易,别说没有deepmind的两位在围棋软件上浸淫十多年的大拿,
deepmind二十余人的团队其中不少都有很深的其它board game软件的开发经验。田渊栋
的团队就俩人,而且另一位就是打杂的。
阿法狗是deepmind CEO力推的项目,而Facebook的小扎出来在自己的脸书账号上发过一
个帖子外,小扎就忙着去天安门跑步,然后跪舔天朝政治局常委们了,剩下田渊栋自己
孤独地携软件去日本参赛去了。

【在 s*****V 的大作中提到】
: 著作权归作者所有。
: 商业转载请联系作者获得授权,非商业转载请注明出处。
: 作者:田渊栋
: 链接:http://zhuanlan.zhihu.com/yuandong/20680393
: 来源:知乎
: 上周我和朱岩去日本电气通信大学(University of Electro-Communications, UEC)参
: 加了第9届UEC杯计算机围棋比赛,获得了第二名的成绩和与小林光一九段下让3子棋的
: 资格,由我代替DarkForest摆子体会“肉臂”的感觉,开局稍缓,中盘战斗非常有力,
: 但打劫还是有问题,最后在赢棋的情况下认输了,有点可惜。而Zen同样被让3子赢了五
: 目左右。这次收获还挺大的,主要是能和诸位做计算机围棋的前辈进行面对面的交流。

h*******2
发帖数: 5093
5
哥早就指出,不是什么阿猫阿狗都可以看个文章就赶上阿九段的
哥话撂在这里了,阿狗保持绝对领先地位至少五年

【在 s*****V 的大作中提到】
: 著作权归作者所有。
: 商业转载请联系作者获得授权,非商业转载请注明出处。
: 作者:田渊栋
: 链接:http://zhuanlan.zhihu.com/yuandong/20680393
: 来源:知乎
: 上周我和朱岩去日本电气通信大学(University of Electro-Communications, UEC)参
: 加了第9届UEC杯计算机围棋比赛,获得了第二名的成绩和与小林光一九段下让3子棋的
: 资格,由我代替DarkForest摆子体会“肉臂”的感觉,开局稍缓,中盘战斗非常有力,
: 但打劫还是有问题,最后在赢棋的情况下认输了,有点可惜。而Zen同样被让3子赢了五
: 目左右。这次收获还挺大的,主要是能和诸位做计算机围棋的前辈进行面对面的交流。

D*******r
发帖数: 2323
6
阿狗保持领先地位和其他软件达到阿狗今天的水平,是两个概念。

【在 h*******2 的大作中提到】
: 哥早就指出,不是什么阿猫阿狗都可以看个文章就赶上阿九段的
: 哥话撂在这里了,阿狗保持绝对领先地位至少五年

h*******2
发帖数: 5093
7
追到今天水平至少五年
底线是没天朝什么事

【在 D*******r 的大作中提到】
: 阿狗保持领先地位和其他软件达到阿狗今天的水平,是两个概念。
O**l
发帖数: 12923
8
只要有大公司真心想搞 半年就能搞出来
姓田的除了会吹牛逼 水平太差
现在It自己也不好意思提it那个不用Mct Kgs作弊3D的梗了

【在 h*******2 的大作中提到】
: 追到今天水平至少五年
: 底线是没天朝什么事

h*******2
发帖数: 5093
9
半年太夸张
以哥带过的中大型公司经验,复杂度弱很多的大项目熬过一年之后失败的不少
关键是人,没有对的人,公司大也没用

【在 O**l 的大作中提到】
: 只要有大公司真心想搞 半年就能搞出来
: 姓田的除了会吹牛逼 水平太差
: 现在It自己也不好意思提it那个不用Mct Kgs作弊3D的梗了

h*h
发帖数: 27852
10
正如我的感觉,电脑围棋的死穴是劫争手筋和复杂的对杀,而且是很难克服的
这些的共同特点就是计算必须绝对准确,概率往往不够。比如唯一一条路对方尽杀你的
大龙,其它都是你胜5目。人可以找到这条路,电脑一算我的胜率是90%。反之也一样,
电脑可能把赢的棋投了
相关主题
国产围棋AI绝艺不错[田渊栋] AlphaGo反倒是有时候局部弱,对杀会有问题
不管棋渣如何炒作,赢棋是第一位的zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
依田让四子输给电脑Facebook开源了围棋人工智能 DarkForest
进入Go版参与讨论
D*******r
发帖数: 2323
11
你给说说怎样才能把局面走成对方取胜的唯一一条路就是净杀你大龙的局面?
如果有人问我怎么把大象放进冰箱里,我回答说:这个容易,把大象弄成猫一样的大小
,就可以放进冰箱里了。你觉得我这个回答完美不?

【在 h*h 的大作中提到】
: 正如我的感觉,电脑围棋的死穴是劫争手筋和复杂的对杀,而且是很难克服的
: 这些的共同特点就是计算必须绝对准确,概率往往不够。比如唯一一条路对方尽杀你的
: 大龙,其它都是你胜5目。人可以找到这条路,电脑一算我的胜率是90%。反之也一样,
: 电脑可能把赢的棋投了

h*h
发帖数: 27852
12
我觉得在中腹出现复杂的对杀,计算机就不好使了。就算没有杀掉大龙,让人救回几个
僵尸子,几十目就翻过来了

【在 D*******r 的大作中提到】
: 你给说说怎样才能把局面走成对方取胜的唯一一条路就是净杀你大龙的局面?
: 如果有人问我怎么把大象放进冰箱里,我回答说:这个容易,把大象弄成猫一样的大小
: ,就可以放进冰箱里了。你觉得我这个回答完美不?

D*******r
发帖数: 2323
13
你这还是白说,为啥一定要和你走成中腹复杂的对杀?李昌镐的棋有多少盘是在中腹复
杂的对杀的?阿李第五局的时候,阿法并不强为中空,它该抢角抢角,该拆边拆边。第
三局的时候,下面的大空,黑就算后来在里面活一块你还是赢不了。

【在 h*h 的大作中提到】
: 我觉得在中腹出现复杂的对杀,计算机就不好使了。就算没有杀掉大龙,让人救回几个
: 僵尸子,几十目就翻过来了

d*****n
发帖数: 754
14
所以李昌镐后来不行了。因为杀力不够。

【在 D*******r 的大作中提到】
: 你这还是白说,为啥一定要和你走成中腹复杂的对杀?李昌镐的棋有多少盘是在中腹复
: 杂的对杀的?阿李第五局的时候,阿法并不强为中空,它该抢角抢角,该拆边拆边。第
: 三局的时候,下面的大空,黑就算后来在里面活一块你还是赢不了。

D*******r
发帖数: 2323
15
你这是啥逻辑?李昌镐后来不行了是因为他年龄大了过了巅峰期,不是因为杀力不够。
他杀力不够却统治棋坛10年,然后拿九连亚,就是说居于顶尖一线长达16-17年。杀力
够的和他同期的刘昌赫统治棋坛多久,杀力够的后辈时越又统治棋坛多久?

【在 d*****n 的大作中提到】
: 所以李昌镐后来不行了。因为杀力不够。
i***h
发帖数: 12655
16
这句话我来回读了几遍,尼玛神回复啊

【在 d*****n 的大作中提到】
: 所以李昌镐后来不行了。因为杀力不够。
1 (共1页)
进入Go版参与讨论
相关主题
AlphaGo终于要和柯洁作战了阿尔法狗介绍
AlphaGo赢樊辉的意义国产围棋AI绝艺不错
Nature重磅封面:谷歌人工智能击败欧洲围棋冠军不管棋渣如何炒作,赢棋是第一位的
柯洁谈AI(转)依田让四子输给电脑
技术贴(懂围棋的请进)[田渊栋] AlphaGo反倒是有时候局部弱,对杀会有问题
田渊栋【facebook 围棋程序负责人】:我怎么看 AlphaGo?zt【FACEBOOK 围棋软件专家 田渊栋博士对 第四盘 分析】
AlphaGo的算法等技术分析Facebook开源了围棋人工智能 DarkForest
李世石前两局每步的胜率估计,同时DF还给出了它计算的最优手,以及实际的结果原来阿尔法下的是5秒版的ZEN
相关话题的讨论汇总
话题: zen话题: uec话题: crazystone话题: 走子话题: 模拟