中文文本分类中基于词性的特征提取方法研究

被引:28
作者
胡燕
吴虎子
钟珞
机构
[1] 武汉理工大学计算机科学与技术学院
关键词
中文文本分类; 向量空间模型; 特征提取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在介绍常用的文本分类中特征词提取方法的基础上,提出了一种全新的,适用于中文文本分类的特征提取方法———基于词性的特征提取方法,实验结果显示,这种基于词性的特征提取方法在提高特征提取效率和降低特征向量维数方面都有显著改善。
引用
收藏
页码:132 / 135
页数:4
相关论文
共 5 条
[1]  
中文文本自动分类方法的研究和实现.[D].马慧敏.华北电力大学(河北).2005, 03
[2]  
一种基于VSM模型的动态文本分类器的设计.[D].章兰.苏州大学.2004, 01
[3]   中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[4]   运用文本领域的常识改善基于支撑向量机的文本分类器性能 [J].
李辉 ;
史忠植 ;
许卓群 .
中文信息学报, 2002, (02) :7-13
[5]   独立于语种的文本分类方法 [J].
黄萱菁 ;
吴立德 ;
石崎洋之 ;
徐国伟 .
中文信息学报, 2000, (06) :1-7