数据挖掘与决策树J48算法在文本分类中的应用

被引:7
作者
胡新海
机构
[1] 陇南师范高等专科学校数信学院
关键词
数据挖掘; 文本分类; J48算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP311.13 [];
学科分类号
120506 [数字人文];
摘要
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.
引用
收藏
页码:25 / 29
页数:5
相关论文
共 3 条
[1]
A reference collection for web spam.[J].Carlos Castillo;Debora Donato;Luca Becchetti;Paolo Boldi;Stefano Leonardi;Massimo Santini;Sebastiano Vigna.ACM SIGIR Forum.2006, 2
[2]
文本倾向性分析中的情感词典构建技术研究 [D]. 
杜伟夫 .
哈尔滨工业大学,
2010
[3]
Web数据挖掘.[M].(美) 刘兵; 著.清华大学出版社.2009,