一种多义词词向量计算方法

被引:26
作者
曾琦
周刚
兰明敬
王濛
机构
[1] 信息工程大学网络空间安全学院
[2] 数学工程与先进计算国家重点实验室
关键词
词向量; 多义词; 主题模型; 语义相似度;
D O I
10.20009/j.cnki.21-1106/tp.2016.07.009
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
语义相似度计算在自然语言处理领域有着非常重要的作用,近年来随着深度学习技术的兴起,利用词向量的进行语义相似度计算的技术得到广泛应用.人们提出了许多计算词向量的模型和方法,但这些模型中一个词仅对应一个词向量,而自然语言中存在着大量的多义词,因此这些模型不能很好的表示多义词语义特征.本文提出一种多义词词向量计算方法,引入主题模型对多义词进行语义标注,将标注后的词语视为新词进行词向量计算,可得到一个多义词的多个词向量.在中英文两种语料上进行了实验,实验结果表明,该方法能准确计算出多义词不同含义的词向量,语义相似度计算的准确性明显提高.
引用
收藏
页码:1417 / 1421
页数:5
相关论文
共 1 条
[1]
Multi-class text categorization based on LDA and SVM.[J].Kunlun Li;Jing Xie;Xue Sun;Yinghui Ma;Hui Bai.Procedia Engineering.2011,