中文文本分类中一种基于语义的特征降维方法

被引:3
作者
胡涛
刘怀亮
机构
[1] 西安电子科技大学经济管理学院
关键词
文本分类; 特征降维; 互信息; 依存关系; 语义;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
文本提出了一种基于语义的特征降维方法。通过依存关系抽取实现一次降维;通过计算类别和依存关系特征项的语义相似度,结合互信息方法进行特征选择实现二次降维。对中文文本分类的实验结果表明,提出的特征降维方法具有较好的分类效果。
引用
收藏
页码:46 / 50
页数:5
相关论文
共 4 条
[1]
DEPENDENCY STRUCTURES AND TRANSFORMATIONAL RULES [J].
ROBINSON, JJ .
LANGUAGE, 1970, 46 (02) :259-285
[2]
使用KNN算法的文本分类 [J].
张宁 ;
贾自艳 ;
史忠植 .
计算机工程, 2005, (08) :171-172+185
[3]
动词与动词搭配方法的研究 [J].
白妙青 ;
郑家恒 ;
不详 .
计算机工程与应用 , 2004, (27) :70-72
[4]
中文文本分类中的特征选择研究 [J].
周茜 ;
赵明生 ;
扈旻 .
中文信息学报, 2004, (03) :17-23