一种基于信息熵的异常数据挖掘算法

被引:19
作者
陈玉明 [1 ]
吴克寿 [1 ]
李向军 [1 ,2 ]
机构
[1] 厦门理工学院计算机科学与技术系
[2] 南昌大学计算机科学与技术系
关键词
粗糙集; 粒计算; 异常数据挖掘; 信息熵;
D O I
10.13195/j.cd.2013.06.69.chenym.015
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
信息熵是粒计算理论中度量不确定信息的重要工具之一,已有的异常数据挖掘算法主要针对确定性的异常数据挖掘,采用信息熵度量不确定性数据进行异常数据挖掘的研究报道较少.鉴于此,在引入信息熵概念的基础上,定义基于信息熵的异常度来度量数据之间的异常程度,并提出基于信息熵的异常数据挖掘算法,该算法可有效进行异常数据的挖掘.理论分析与实验结果表明,所提出算法是有效可行的.
引用
收藏
页码:867 / 872
页数:6
相关论文
共 11 条
[1]   基于边界和距离的离群点检测 [J].
江峰 ;
杜军威 ;
眭跃飞 ;
曹存根 .
电子学报, 2010, 38 (03) :700-705
[2]   基于幂图的属性约简搜索式算法 [J].
陈玉明 ;
苗夺谦 .
计算机学报, 2009, 32 (08) :1486-1492
[3]   一个复杂度为max(O(|C||U|),O(|C||U/C|))的快速属性约简算法 [J].
徐章艳 ;
刘作鹏 ;
杨炳儒 ;
宋威 .
计算机学报, 2006, (03) :391-399
[4]   知识的粒度计算及其应用 [J].
苗夺谦 ;
范世栋 .
系统工程理论与实践, 2002, (01) :48-56
[5]   粗糙集理论中概念与运算的信息表示 [J].
苗夺谦 ;
王珏 .
软件学报, 1999, (02) :2-5
[6]  
粒计算[M]. 科学出版社 , 苗夺谦等, 2007
[7]  
Granular computing, rough entropy and object extraction[J] . Sankar K. Pal,B. Uma Shankar,Pabitra Mitra.Pattern Recognition Letters . 2005 (16)
[8]  
Discovering cluster-based local outliers[J] . Zengyou He,Xiaofei Xu,Shengchun Deng.Pattern Recognition Letters . 2003 (9)
[9]  
Distance-based outliers: algorithms and applications[J] . Edwin M. Knorr,Raymond T. Ng,Vladimir Tucakov.The VLDB Journal . 2000 (3-4)
[10]  
Data clustering[J] . A. K. Jain,M. N. Murty,P. J. Flynn.ACM Computing Surveys (CSUR) . 1999 (3)