一种多义词词向量计算方法

被引：26

作者：

曾琦

周刚

兰明敬

王濛

机构：

[1] 信息工程大学网络空间安全学院

[2] 数学工程与先进计算国家重点实验室

来源：

小型微型计算机系统 | 2016年 / 37卷 / 07期

关键词：

词向量; 多义词; 主题模型; 语义相似度;

D O I：

10.20009/j.cnki.21-1106/tp.2016.07.009

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

语义相似度计算在自然语言处理领域有着非常重要的作用,近年来随着深度学习技术的兴起,利用词向量的进行语义相似度计算的技术得到广泛应用.人们提出了许多计算词向量的模型和方法,但这些模型中一个词仅对应一个词向量,而自然语言中存在着大量的多义词,因此这些模型不能很好的表示多义词语义特征.本文提出一种多义词词向量计算方法,引入主题模型对多义词进行语义标注,将标注后的词语视为新词进行词向量计算,可得到一个多义词的多个词向量.在中英文两种语料上进行了实验,实验结果表明,该方法能准确计算出多义词不同含义的词向量,语义相似度计算的准确性明显提高.

引用

页码：1417 / 1421

页数：5