基于统计的离群数据挖掘与分析

被引:2
作者
金义富
邓明
机构
[1] 湛江师范学院信息科学与技术学院
关键词
离群数据; 统计模型; 挖掘; 分析;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在数据空间中不可避免地存在着一些严重偏离整体样本集合的其它观测值,这些离群数据对数据挖掘与分析结果具有重要影响.通过对各种基于统计算法的总结与比较。按一元到多元的探索性离群分析思路.设计了一般分布下的 Grubbs 离群检测法和基于似然的混合模型离群点检测方法,并对多维数据的统计检测技术进行了讨论.结果表明,在离群检测与分析中恰当地利用统计方法在低维数据中的有效性进行探索性数据分析是可行的.
引用
收藏
页码:70 / 73
页数:4
相关论文
共 4 条
  • [1] 现代数据分析[M]. 机械工业出版社 , 吴今培,孙德山编著, 2006
  • [2] 线性混合效应模型影响分析[M]. 科学出版社 , 费宇,潘建新著, 2005
  • [3] Outliers Detection in Multivariate Spatial Linear Models. A F Militino,M B Palacios,M D Ugarte. Journal of Statistical Planning and Inference . 2006
  • [4] Efficient biased sampling for approximate clustering and outlier detection in large data sets. Kollios,G,Gunopulos,D,Koudas,N. IEEE Trans Knowledge Data Eng . 2003