文本分类中特征预抽取方法研究

被引:5
作者
郑伟 [1 ]
吕建新 [2 ]
张建伟 [3 ]
机构
[1] 河北北方学院理学院
[2] 河北北方学院图书馆
[3] 河北地质职工大学
关键词
文本分类; 特征; 抽取方法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在文本分类中,特征抽取是一项很重要的工作,抽取到的特征项质量的好坏直接影响到分类的效果。在研究了文本分类中常用的文本特征词预抽取方法的基础上,提出了一种基于词性选择的特征预抽取方法,结合IG方法进行特征抽取。在分类实验中实验结果显示,这种基于词性的特征预抽取方法在分类过程中可以在不降低分类精度的同时可以减少特征维数和训练时间。
引用
收藏
页码:86 / 88+92 +92
页数:4
相关论文
共 7 条
[1]   基于本体的文本分类方法 [J].
张颖 ;
王文杰 ;
史忠植 .
计算机仿真, 2009, 26 (05) :103-106+178
[2]   自动文本分类方法研究述评 [J].
蒲筱哥 .
情报科学 , 2008, (03) :469-475
[3]   文本分类中特征提取方法的比较与研究 [J].
郑伟 ;
王锐 .
河北北方学院学报(自然科学版), 2007, (06) :51-54+64
[4]   文本分类中一种改进的特征选择方法 [J].
刘海峰 ;
王元元 ;
张学仁 .
情报科学, 2007, (10) :1534-1537
[5]   基于本体论的文本特征提取 [J].
唐晓文 .
电脑与信息技术, 2005, (01) :36-38+62
[6]   中文文本分类的特征选取评价 [J].
孙国菊 ;
张杰 .
哈尔滨理工大学学报, 2005, (01) :76-78
[7]  
信息检索理论与技术[M]. 科学技术文献出版社 , 苏新宁主编, 2004