共 7 条
基于同义词词林扩展的短文本分类
被引:8
作者:
王东
[1
,2
]
熊世桓
[1
,2
]
机构:
[1] 贵州师范学院数学与计算机科学学院
[2] 贵州省高校工业物联网工程技术研究中心
来源:
关键词:
短文本分类;
特征扩展;
同义词词林;
搭配词库;
D O I:
10.13295/j.cnki.jlut.2015.04.022
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对短文本特征稀疏导致的信息表示能力不足,提出基于同义词词林扩展的短文本分类方法.该方法首先利用同义词词林确定短文本中主干词的同义关系,引入大规模词语搭配资源实现无指导多义词义项判别,从而确定候选扩展特征,最后计算候选扩展特征与给定上下文的语义关联性,将满足条件的候选特征扩展到特征向量中.实验结果表明,该方法综合考虑的因素较全面,能够有效改善短文本的分类性能.
引用
收藏
页码:104 / 108
页数:5
相关论文