中文文本分类中利用依存关系的实验研究

被引:15
作者
王鹏
樊兴华
机构
[1] 重庆邮电大学计算机科学与技术研究所
关键词
依存关系; 短文本; 文本分类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了利用依存关系进行短文本分类,研究了利用依存关系进行短文本分类存在的四个关键问题。分别在长文本语料集和两个短文本语料集上,抽取具有依存关系的词对,并利用这些词对作为特征进行分类实验。实验结果表明:依存关系能够作为有效的特征进行文本分类,并能够改善文本分类的性能;单独把依存关系作为特征,不能提高短文本的分类性能;可以利用依存关系作为特征扩充的手段,增加短文本的特征,增强短文本的描述能力,进而进行有效的短文本分类。
引用
收藏
页码:131 / 133+141 +141
页数:4
相关论文
共 1 条
[1]   DEPENDENCY STRUCTURES AND TRANSFORMATIONAL RULES [J].
ROBINSON, JJ .
LANGUAGE, 1970, 46 (02) :259-285