一种基于约束的多维数据异常点挖掘方法

被引:12
作者
李翠平
李盛恩
王珊
杜小勇
机构
[1] 中国科学院计算技术研究所
[2] 中国人民大学数据与知识工程研究所
[3] 中国人民大学数据与知识工程研究所 北京
[4] 北京
关键词
联机分析处理; 数据挖掘; 约束; 异常点; 实体化;
D O I
10.13328/j.cnki.jos.2003.09.010
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据中的异常点常常反映了企业经营中潜伏的问题或暗藏的商机,数据分析人员经常需要从大量的数据中找出这些异常点.最近提出的一种从数据中自动发现异常点的方法,将人们从繁重的体力劳动中解放出来.然而,该方法在计算效率和伸缩性方面还存在很多不足.针对这些不足,对该方法进行了优化和改进,提出了一种基于约束的多维数据异常点挖掘方法.通过在数据挖掘过程中引入约束条件,首先将数据立方体限制到一个小的多维空间,然后再从中找出异常点.实验结果表明该方法非常有效.
引用
收藏
页码:1571 / 1577
页数:7
相关论文
共 1 条
[1]  
Optimizing multiple dimensional queries simultaneously in multidimensional databases[J] . Weifa Liang,Maria E. Orlowska,Jeffrey X. Yu.The VLDB Journal . 2000 (3-4)