共 1 条
中文文本分类中利用依存关系的实验研究
被引:15
作者:
王鹏
樊兴华
机构:
[1] 重庆邮电大学计算机科学与技术研究所
来源:
关键词:
依存关系;
短文本;
文本分类;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
为了利用依存关系进行短文本分类,研究了利用依存关系进行短文本分类存在的四个关键问题。分别在长文本语料集和两个短文本语料集上,抽取具有依存关系的词对,并利用这些词对作为特征进行分类实验。实验结果表明:依存关系能够作为有效的特征进行文本分类,并能够改善文本分类的性能;单独把依存关系作为特征,不能提高短文本的分类性能;可以利用依存关系作为特征扩充的手段,增加短文本的特征,增强短文本的描述能力,进而进行有效的短文本分类。
引用
收藏
页码:131 / 133+141
+141
页数:4
相关论文