基于文本数据挖掘的硕士论文分类技术

被引:9
作者
曾立梅
机构
[1] 重庆邮电大学计算机学院
关键词
数据挖掘; 文本分类; 支持向量机; 研究方向;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对硕士论文的摘要和关键词等数据进行数据挖掘,实现硕士论文自动分类。为此收集了2000余个相关数据,在对所研究的数据对象特点进行分析的基础上,确定了分类算法,详细分析了支持向量机分类方法;对收集的研究数据进行了仿真实验,并与其他常用分类器进行比较。实验表明,基于支持向量机的分类方法比其他常用分类器具有较高的准确率。对实验结果中得到的知识进行了分析,得出一系列可供科学研究者和管理者参考的结论。
引用
收藏
页码:669 / 672+682 +682
页数:5
相关论文
共 8 条
[1]   基于关联分析的数据挖掘在体检CRM中的应用附视频 [J].
王越 ;
桂袁义 .
重庆理工大学学报(自然科学版), 2010, (03) :36-42
[2]   基于二叉树多类支持向量机的文本分类研究 [J].
龙军 ;
王易 ;
刘高嵩 .
计算机系统应用, 2009, 18 (05) :65-68
[4]   中文文本分类中特征选择方法的比较研究 [J].
刘洋 .
科技信息, 2007, (03) :54-54
[5]   中文文本分类研究 [J].
郝晓燕 ;
常晓明 .
太原理工大学学报, 2006, (06) :710-713
[6]   一种基于粗糙集理论的文本分类方法 [J].
何峰 .
自动化与信息工程, 2006, (03) :1-3
[7]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[8]   一种高性能的两类中文文本分类方法 [J].
樊兴华 ;
孙茂松 .
计算机学报, 2006, (01) :124-131