s********k 发帖数: 6180 | 1 【 以下文字转载自 EE 讨论区 】
发信人: silverhawk (silverhawk), 信区: EE
标 题: 请教有没有可以实时计算时间学列correlation的近似算法?
发信站: BBS 未名空间站 (Wed May 19 20:42:59 2010, 美东)
假设我有两个时间序列x(i),y(i),i=1:n. 一般的correlation计算要等到全部n个采样
完成之后再计算。我现在想用一种online的方法来实时计算,从i=2开始就开始计算两
个序列的相关性,每次时间序列有一个新的采样correlation更新一次,当然由于采样
不完全,所以允许correlation的误差存在,但是希望大体走势应该是越来越趋近最后
的准确值,不知道有没有这样的实时算法存在。谢谢 |
b********y 发帖数: 5829 | 2 kalman filter 也可以update correlation吧? |
b*******e 发帖数: 6389 | 3 用来炒股?
【在 s********k 的大作中提到】 : 【 以下文字转载自 EE 讨论区 】 : 发信人: silverhawk (silverhawk), 信区: EE : 标 题: 请教有没有可以实时计算时间学列correlation的近似算法? : 发信站: BBS 未名空间站 (Wed May 19 20:42:59 2010, 美东) : 假设我有两个时间序列x(i),y(i),i=1:n. 一般的correlation计算要等到全部n个采样 : 完成之后再计算。我现在想用一种online的方法来实时计算,从i=2开始就开始计算两 : 个序列的相关性,每次时间序列有一个新的采样correlation更新一次,当然由于采样 : 不完全,所以允许correlation的误差存在,但是希望大体走势应该是越来越趋近最后 : 的准确值,不知道有没有这样的实时算法存在。谢谢
|
s********k 发帖数: 6180 | 4 能详细的说说吗?另外希望算法不要太复杂了
【在 b********y 的大作中提到】 : kalman filter 也可以update correlation吧?
|
s********k 发帖数: 6180 | 5 no, for research. but should work in stock market
【在 b*******e 的大作中提到】 : 用来炒股?
|
l*******r 发帖数: 3799 | 6 Just find an algorithm to fill the missing values. Really depends on the
characteristic of your data. |
s********k 发帖数: 6180 | 7 不知道你提到的missing data指的是什么?难道是后面的未知数据?
【在 l*******r 的大作中提到】 : Just find an algorithm to fill the missing values. Really depends on the : characteristic of your data.
|
l*******r 发帖数: 3799 | 8 你不是说采样不完全嘛,我的理解是有些时间点你没有采集到。
【在 s********k 的大作中提到】 : 不知道你提到的missing data指的是什么?难道是后面的未知数据?
|
s********k 发帖数: 6180 | 9 采样不完全的意思是本来我这个时间序列需要采样比如10000个点,但是我现在想开始
采样第10个点的
时候就计算correlation,然后每次再采样一组数据update一次,就是相当于一个实时的
correlation计算,而不是等到所有数据点都采样之后再计算。
【在 l*******r 的大作中提到】 : 你不是说采样不完全嘛,我的理解是有些时间点你没有采集到。
|
b********y 发帖数: 5829 | 10 查一下hidden Markov model,应该就是对附这种问题的,不过我己经基本全忘了
【在 s********k 的大作中提到】 : 采样不完全的意思是本来我这个时间序列需要采样比如10000个点,但是我现在想开始 : 采样第10个点的 : 时候就计算correlation,然后每次再采样一组数据update一次,就是相当于一个实时的 : correlation计算,而不是等到所有数据点都采样之后再计算。
|
|
|
g*****u 发帖数: 14294 | |
r****d 发帖数: 239 | 12 不知道你的online算法是什么意思,不然如果你能每一时刻把数据传到EXCEL里用
CORREL不就能算correlation了么? |
s**********6 发帖数: 873 | 13 不太明白你的意思。每一次多算一个不就得了?如果对程序效率要求不高的话。 |
s**********6 发帖数: 873 | 14 你除非是在Stationary的序列的假定下,否则你想预测下面的?不一定Converge的。 |
h*******u 发帖数: 15326 | 15 kf 需要model ,hmm也需要model
【在 b********y 的大作中提到】 : 查一下hidden Markov model,应该就是对附这种问题的,不过我己经基本全忘了
|
w********s 发帖数: 59 | 16 You wanted to compute the cross-correlation sequence between two time series
? Or normalized cross-correlation sequence? This should be easily done but
you'd better show exactly how you compute the correlation originally ...
【在 s********k 的大作中提到】 : 采样不完全的意思是本来我这个时间序列需要采样比如10000个点,但是我现在想开始 : 采样第10个点的 : 时候就计算correlation,然后每次再采样一组数据update一次,就是相当于一个实时的 : correlation计算,而不是等到所有数据点都采样之后再计算。
|
s********k 发帖数: 6180 | 17 但是只采集部分数据的correlation会不会和采集完所有时间点的数据之后的
correlation相差很大?或者说时间序列需要满足什么条件,利用部分采集数据的
correlation才能大概代表最后的真实correlation?stationary或者是self similar?
【在 r****d 的大作中提到】 : 不知道你的online算法是什么意思,不然如果你能每一时刻把数据传到EXCEL里用 : CORREL不就能算correlation了么?
|
s********k 发帖数: 6180 | 18 应该是normalized cross-correlation。
series
【在 w********s 的大作中提到】 : You wanted to compute the cross-correlation sequence between two time series : ? Or normalized cross-correlation sequence? This should be easily done but : you'd better show exactly how you compute the correlation originally ...
|
r****d 发帖数: 239 | 19 random data很难有你说的可能性。
举个例子:amazon 的BETA 值。选不同数量的月份得到不同的值。
# of mon Beta
5 1.43
10 1.11
15 0.78
20 0.81
25 0.91
30 1.02
35 1.00
40 1.19
【在 s********k 的大作中提到】 : 但是只采集部分数据的correlation会不会和采集完所有时间点的数据之后的 : correlation相差很大?或者说时间序列需要满足什么条件,利用部分采集数据的 : correlation才能大概代表最后的真实correlation?stationary或者是self similar?
|
t*****t 发帖数: 244 | 20 如果已知这两个时间序列都各自由某个process/model来产生,那correlation理论上也
是知道的,
具体取决于underlying models。
如果你就想通过测量实时的样本数据来动态测量correlation,那只有用expanding
window或者
rolling window去动态测量correlaton。当然怎么测量取决于你的选择,sample corr,
robust corr, 或者要不要考虑time varying volatility,等等。
correlation是一个抽象概念,并不存在一个准确值。当然你可以用forward realized
corr作为
benchmark来衡量你的算法的优略。
【在 s********k 的大作中提到】 : 应该是normalized cross-correlation。 : : series
|