高维空间中的离群点发现

被引:43
作者
魏藜
宫学庆
钱卫宁
周傲英
机构
[1] 复旦大学计算机科学与工程系
关键词
数据挖掘; 离群点; 超图模型; 聚类;
D O I
10.13328/j.cnki.jos.2002.02.018
中图分类号
TP311.12 [];
学科分类号
摘要
在许多KDD(knowledge discovery in databases)应用中,如电子商务中的欺诈行为监测,例外情况或离群点的发现比常规知识的发现更有意义.现有的离群点发现大多是针对数值属性的,而且这些方法只能发现离群点不能对其含义进行解释.提出了一种基于超图模型的离群点(outlier)定义,这一定义既体现了“局部”的概念能很好地解释离群点的含义.同时给出了HOT(hypergraph-based outlier test)算法,通过计算每个点的支持度、隶属度和规模偏差来检测离群点.该算法既能够处理数值属性,又能够处理类别属性.分析表明,该算法能有效地发现高维空间数据中的离群点.
引用
收藏
页码:280 / 290
页数:11
相关论文
共 1 条
[1]  
Identification of outliers .2 Hawkins,D. London:Chapman and Hall . 1980