D*******r 发帖数: 2323 | 1 如果李世石下个星期的应氏杯半决赛胜朴廷桓两局,那么阿法狗将被送上等级分第一的
位置。 |
m**d 发帖数: 21441 | 2 为什么李世石赢,阿尔法狗排名上升?
【在 D*******r 的大作中提到】 : 如果李世石下个星期的应氏杯半决赛胜朴廷桓两局,那么阿法狗将被送上等级分第一的 : 位置。
|
D*******r 发帖数: 2323 | 3 因为一个棋手的等级分,是根据对手的等级分计算的。当然,这个计算会随着时间而衰
减,但是如果你近期战胜了某个棋手,而这个棋手又马上战胜了多名其他棋手,你的等
级分就会随着败在你手下的这位棋手后来的不断胜利而升高,不过,要是你胜了这位棋
手,而他几年后再胜其他棋手,他的等级分升高对你就几乎没影响了。
【在 m**d 的大作中提到】 : 为什么李世石赢,阿尔法狗排名上升?
|
M*******p 发帖数: 5626 | 4 石头不是刚输给古力吗? 难道狗的积分不跟着下降? |
p****l 发帖数: 197 | |
D*******r 发帖数: 2323 | 6 跟着下降了。32强的比赛降得比较少,如果是大赛的决赛半决赛对等级分影响比较大。
【在 M*******p 的大作中提到】 : 石头不是刚输给古力吗? 难道狗的积分不跟着下降?
|
l*w 发帖数: 567 | 7 感觉有点奇怪。
等级分的计算是不能回溯的吧?否则不乱套了。回溯的话,没法算清了。
还是阿法狗特事特办?
【在 D*******r 的大作中提到】 : 跟着下降了。32强的比赛降得比较少,如果是大赛的决赛半决赛对等级分影响比较大。
|
p****l 发帖数: 197 | 8 有时间权重。总之近期内对手的近期胜负都会影响。
【在 l*w 的大作中提到】 : 感觉有点奇怪。 : 等级分的计算是不能回溯的吧?否则不乱套了。回溯的话,没法算清了。 : 还是阿法狗特事特办?
|
D*******r 发帖数: 2323 | 9 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该棋手下
个月就灭了其它棋手N盘,那么你的等级分就会随着被你灭的棋手的等级分上升而有大
幅上升。如果你是五年前灭的该棋手,那么该棋手现在的等级分上升或者下降对你的等
级分都几乎无影响。
【在 l*w 的大作中提到】 : 感觉有点奇怪。 : 等级分的计算是不能回溯的吧?否则不乱套了。回溯的话,没法算清了。 : 还是阿法狗特事特办?
|
l*w 发帖数: 567 | 10 据我所知,目前中国棋院的等级分不是回溯的。业余乒乓球算积分也是不回溯的。绝大
多数等级分是不回溯的。
职业网球等级分的算法很特殊。不是根据比赛对手算,而是根据比赛总成绩算。有所谓
保分只说,就是要比较一年前自己的成绩,保不住就分数下跌。
围棋等级分的算法是,每一场比赛都会结算,影响因素是两人的当时的分数和胜负。这
个是国际上通用的公式。
不知你说的那个回溯算法是从哪里看来的。
: 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该
棋手下
: 个月就灭了其它棋手N盘,那么你的等级分就会随着被你灭的棋手的等级分上升
而有大
: 幅上升。如果你是五年前灭的该棋手,那么该棋手现在的等级分上升或者下降对
你的等
: 级分都几乎无影响。
【在 D*******r 的大作中提到】 : 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该棋手下 : 个月就灭了其它棋手N盘,那么你的等级分就会随着被你灭的棋手的等级分上升而有大 : 幅上升。如果你是五年前灭的该棋手,那么该棋手现在的等级分上升或者下降对你的等 : 级分都几乎无影响。
|
|
|
D*******r 发帖数: 2323 | 11 gratings网站注得很清楚,他们用的是WHR (Whole History Rating) algorithm.
http://www.remi-coulom.fr/WHR/
这个页面有WHR paper的链接,读读吧,它解释了一般static rating和decayed
history rating的弊端。
【在 l*w 的大作中提到】 : 据我所知,目前中国棋院的等级分不是回溯的。业余乒乓球算积分也是不回溯的。绝大 : 多数等级分是不回溯的。 : 职业网球等级分的算法很特殊。不是根据比赛对手算,而是根据比赛总成绩算。有所谓 : 保分只说,就是要比较一年前自己的成绩,保不住就分数下跌。 : 围棋等级分的算法是,每一场比赛都会结算,影响因素是两人的当时的分数和胜负。这 : 个是国际上通用的公式。 : 不知你说的那个回溯算法是从哪里看来的。 : : : 上面已经解释过了,会随着时间而影响衰减。如果你这个月灭谋棋手五盘,而该 : 棋手下
|
l*w 发帖数: 567 | 12 看来这是一个比较新的计分系统。认可并采用它的人不多。
现在占压倒多数的传统的计分系统还是ELO。包括体育界现行的绝大多数等级分系统。
维基上有解释。
https://zh.wikipedia.org/wiki/%E7%AD%89%E7%BA%A7%E5%88%86
那个是不回溯的。原理简单易懂。
【在 D*******r 的大作中提到】 : gratings网站注得很清楚,他们用的是WHR (Whole History Rating) algorithm. : http://www.remi-coulom.fr/WHR/ : 这个页面有WHR paper的链接,读读吧,它解释了一般static rating和decayed : history rating的弊端。
|
D*******r 发帖数: 2323 | 13 别的比赛不知道,但是就围棋比赛来讲,WHR的研究者以kgs上23万局的比赛记录来测试
,elo rating的预测准确率是55.121%,而WHR的预测准确率是55.793%。
从统计学上讲,如果algorithm A比algorithm B 的预测准确率高0.091%,就有95%的把
握说A比B预测得更准确。
【在 l*w 的大作中提到】 : 看来这是一个比较新的计分系统。认可并采用它的人不多。 : 现在占压倒多数的传统的计分系统还是ELO。包括体育界现行的绝大多数等级分系统。 : 维基上有解释。 : https://zh.wikipedia.org/wiki/%E7%AD%89%E7%BA%A7%E5%88%86 : 那个是不回溯的。原理简单易懂。
|
p******e 发帖数: 528 | 14 我有个关于这个准确率的问题。我猜测这个准确率应该是在某种cross validation的方
法下算出来的
对于一定的sample的平均。那么既然是对于sample的评价,就应该有一个distribution
。换句话说。
这个准确率是有error bar的。那么如果这个error bar的size远大于他们中心值的
difference,而且
这2种方法给出的error不是显著correlated,那么在这种情况下是否还能说一种方法的
预言一定好于
另一种方法呢?换言之,这时候这个个统计量的差值是否有统计的significance?
【在 D*******r 的大作中提到】 : 别的比赛不知道,但是就围棋比赛来讲,WHR的研究者以kgs上23万局的比赛记录来测试 : ,elo rating的预测准确率是55.121%,而WHR的预测准确率是55.793%。 : 从统计学上讲,如果algorithm A比algorithm B 的预测准确率高0.091%,就有95%的把 : 握说A比B预测得更准确。
|
D*******r 发帖数: 2323 | 15 这个predication准确率是说,某一算法预测它算出来等级分高的那方取胜,预测的正
确率占所有sample的比例。
因为sample都是同段位(级位)的分先对局,所以大部分对局棋手的等级分比较接近。
至于你说的“中心值difference",不知道是指等级分相差范围多少以内的sample的结
果,还是说低段和高段的sample,不同算法算出来的difference有区别。
如果只是为了评价两种算法的优劣,可以专门对所有两种算法算出的对弈棋手的等级分
高低刚好相反的所有对局来统计,看看哪种算法得到的等级分高的一方最终赢棋的比率。
distribution
【在 p******e 的大作中提到】 : 我有个关于这个准确率的问题。我猜测这个准确率应该是在某种cross validation的方 : 法下算出来的 : 对于一定的sample的平均。那么既然是对于sample的评价,就应该有一个distribution : 。换句话说。 : 这个准确率是有error bar的。那么如果这个error bar的size远大于他们中心值的 : difference,而且 : 这2种方法给出的error不是显著correlated,那么在这种情况下是否还能说一种方法的 : 预言一定好于 : 另一种方法呢?换言之,这时候这个个统计量的差值是否有统计的significance?
|
p******e 发帖数: 528 | 16 我的意思是这样的。
比方在同一段位总共有1000名棋手,我先取250名棋手,让他们对局,然后同两种不同
的rating系统
去预言胜率,再计算这两种系统预测的差值。然后再取250名棋手,如此反复。最有我
得到的是一个
关于这两种rating方法的预测准确率的difference的sample。这个sample应该是具有一
个distribution。
但是这个这个difference的distribution有可能是zero consistent的。换言之,任何
一个rating系统所
得到注册率的值不是一个值,而是一个分布。我觉得你举的那个例子中一次就用了所有
的1000名棋手,
所以原则上只是的到了一个对于预测准确率的difference的平均值,而无法知道这个
mean的分布的
宽度。
率。
【在 D*******r 的大作中提到】 : 这个predication准确率是说,某一算法预测它算出来等级分高的那方取胜,预测的正 : 确率占所有sample的比例。 : 因为sample都是同段位(级位)的分先对局,所以大部分对局棋手的等级分比较接近。 : 至于你说的“中心值difference",不知道是指等级分相差范围多少以内的sample的结 : 果,还是说低段和高段的sample,不同算法算出来的difference有区别。 : 如果只是为了评价两种算法的优劣,可以专门对所有两种算法算出的对弈棋手的等级分 : 高低刚好相反的所有对局来统计,看看哪种算法得到的等级分高的一方最终赢棋的比率。 : : distribution
|