d********t 发帖数: 9628 | 1 可不可以先用全部data搞一次,然后把error比较大的点去掉再搞一次?理论上有什么
问题? |
E**********e 发帖数: 1736 | 2 做个boxplot, 可以删掉2个std外的data point,如果样品size大的话。 也可以
linear regression后算cook distanc是么的。 翻下统计regression基本手册。至于理
论上是么说法吗,就是用来扯的。 只要解决问题, 睡care理论怎么说啊。 outliers
大都就是用来删的。
。
【在 d********t 的大作中提到】 : 可不可以先用全部data搞一次,然后把error比较大的点去掉再搞一次?理论上有什么 : 问题?
|
d********t 发帖数: 9628 | 3 啥叫boxplot?
就是沿着regression的那条线平行两个error的std吗?
谢了!
outliers
【在 E**********e 的大作中提到】 : 做个boxplot, 可以删掉2个std外的data point,如果样品size大的话。 也可以 : linear regression后算cook distanc是么的。 翻下统计regression基本手册。至于理 : 论上是么说法吗,就是用来扯的。 只要解决问题, 睡care理论怎么说啊。 outliers : 大都就是用来删的。 : 。
|
E**********e 发帖数: 1736 | 4 就是R里面的boxplots()啊。 对每个predicator做个boxplot, 然后删掉outliers,
可以用1.5~3 std, 取决于你的samples size。 你需要写个小程序来删掉这些
outliers。 另一方法是regression啦,如果outlier是也就一两个的话,看看统计书。
【在 d********t 的大作中提到】 : 啥叫boxplot? : 就是沿着regression的那条线平行两个error的std吗? : 谢了! : : outliers
|
S******n 发帖数: 90 | 5 Alternatively, try Robust Regression. Be cautious! When you delete the
outlier(s), please consult with the researcher who gave you the dataset ! |
d*********r 发帖数: 297 | 6 risk equivalent or based on Y=f(X), floor or capping.
【在 d********t 的大作中提到】 : 可不可以先用全部data搞一次,然后把error比较大的点去掉再搞一次?理论上有什么 : 问题?
|
n**********0 发帖数: 66 | 7 我个人感觉如果不是分析着玩的,去掉outlier是比较危险的,至少应该分析with and
without outlier 然后看看这两个区别大不大,或者能给你一些信息告诉你是不是值得
去掉outlier |