V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wudikua
V2EX  ›  程序员

请教个数学问题

  •  
  •   wudikua · 2014-06-27 18:45:12 +08:00 · 2605 次点击
    这是一个创建于 3562 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我有两组样本

    1 1 1 10
    E=3.25
    方差=7.79

    10 10 10 100
    E=32.5
    方差77.9

    假如我想按照一个固定的方差数,来过滤出不均匀的数据,这个固定数的选择好像受不同样本基数的影响,怎么能消去这种误差呢。
    4 条回复    2014-06-30 13:54:17 +08:00
    blacktulip
        1
    blacktulip  
       2014-06-27 19:06:54 +08:00
    方差 / E ?
    kokdemo
        2
    kokdemo  
       2014-06-27 19:11:47 +08:00
    ……没懂你这是要消除啥误差
    akfish
        3
    akfish  
       2014-06-27 19:20:48 +08:00   ❤️ 1
    没理解错的话,lz是想要过滤掉数据里的outlier。
    通过固定方差阈值的方法并不可靠,因为方差是一组数据本身固有的统计学性质,对一组数据有效的阈值,可能会过滤掉另一组数据中的有效值。
    鉴别、消除outlier的方法很多,可以自己搜索类似outlier elimination的关键字。
    几个参考:
    http://en.wikipedia.org/wiki/Outlier
    http://en.wikipedia.org/wiki/Peirce's_criterion
    https://www.eol.ucar.edu/system/files/piercescriterion.pdf
    http://www.seas.upenn.edu/~ese302/extra_mtls/REGRESSION_OUTLIERS.pdf
    wudikua
        4
    wudikua  
    OP
       2014-06-30 13:54:17 +08:00
    @akfish 并不是outlier,我说个通俗的例子吧,两个运动员,一个是射击运动员,一个是短跑运动员,给他们10次机会,并记录他们的成绩,然后计算方差来看他们的发挥的是否稳定,稳定的就可以去参加奥运会,但是由于他们的成绩的单位不同,我就没法说方差小于X的才能去参加奥运会。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5361 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 07:31 · PVG 15:31 · LAX 00:31 · JFK 03:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.