不平衡类数据挖掘研究综述

被引:35
作者
翟云 [1 ,2 ]
杨炳儒 [1 ]
曲武 [1 ]
机构
[1] 北京科技大学信息工程学院
[2] 聊城大学计算机学院
关键词
机器学习; 不平衡类数据; 重采样; 代价敏感学习;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
综述了近年来国内外对不平衡类数据挖掘的主要研究进展。首先分析了不平衡类数据挖掘的本质。其次,详细探讨了处理不平衡类数据挖掘的各种技术,并根据其本质区别,从数据层次和算法层次分别对目前存在的各种技术方法进行了深入剖析和全面比较。最后,指出当前不平衡类数据挖掘研究的热点以及将来需要重点关注的主要问题。
引用
收藏
页码:27 / 32
页数:6
相关论文
共 14 条
[1]   重采样方法与机器学习 [J].
毕华 ;
梁洪力 ;
王珏 .
计算机学报, 2009, 32 (05) :862-877
[2]   不均衡数据集学习中基于初分类的过抽样算法 [J].
韩慧 ;
王路 ;
温明 ;
王文渊 .
计算机应用, 2006, (08) :1894-1897
[3]   非平衡数据训练方法概述 [J].
张琦 ;
吴斌 ;
王柏 .
计算机科学, 2005, (10) :181-186
[4]  
On strategies for imbalanced text classification using SVM: A comparative study[J] . Aixin Sun,Ee-Peng Lim,Ying Liu.Decision Support Systems . 2009 (1)
[5]  
Feature selection for text categorization on imbalanced data[J] . Zhaohui Zheng,Xiaoyun Wu,Rohini Srihari.ACM SIGKDD Explorations Newsletter . 2004 (1)
[6]   Learning algorithms for keyphrase extraction [J].
Turney P.D. .
Information Retrieval, 2000, 2 (4) :303-336
[7]  
An Empirical Comparison of Voting Classification Algorithms: Bagging, Boosting, and Variants[J] . Eric Bauer,Ron Kohavi.Machine Learning . 1999 (1-2)
[8]  
Machine Learning for the Detection of Oil Spills in Satellite Radar Images[J] . Miroslav Kubat,Robert C. Holte,Stan Matwin.Machine Learning . 1998 (2)
[9]   A decision-theoretic generalization of on-line learning and an application to boosting [J].
Freund, Y ;
Schapire, RE .
JOURNAL OF COMPUTER AND SYSTEM SCIENCES, 1997, 55 (01) :119-139
[10]   BOOSTING A WEAK LEARNING ALGORITHM BY MAJORITY [J].
FREUND, Y .
INFORMATION AND COMPUTATION, 1995, 121 (02) :256-285