一种反映词语相关度语义库的构建方法

被引:3
作者
徐南轩
邹恒明
机构
[1] 上海交通大学软件学院
关键词
语义库; 向量空间; 语义相关度; 信息熵; 语料训练;
D O I
10.16183/j.cnki.jsjtu.2008.07.021
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了反映词语间的语义相关程度,提出了一种基于向量空间模型的构建语义库的新方法.在构建语义库时,对大量语料文本进行迭代式学习,在学习过程中引入淘汰算法,并综合考虑了诸如共同出现次数、平均出现距离、信息熵以及单字语义信息等多种对词语间语义关系产生影响的因素.实验证明,用该方法得到的相关语义库能够较好地反映现实世界中词语之间的相关程度.
引用
收藏
页码:1129 / 1132
页数:4
相关论文
共 5 条
[1]   基于知网的语义相关度计算 [J].
许云 ;
樊孝忠 ;
张锋 .
北京理工大学学报, 2005, (05) :411-414
[2]   信息熵、玻尔兹曼熵以及克劳修斯熵之间的关系——兼论玻尔兹曼熵和克劳修斯熵是否等价 [J].
李鹤龄 .
大学物理, 2004, (12) :37-40
[3]   基于语义关系查询扩展的文档重构方法 [J].
张敏 ;
宋睿华 ;
马少平 .
计算机学报, 2004, (10) :1395-1401
[4]   基于词关联语义的文本分类研究 [J].
党齐民 ;
吕冬煜 .
计算机应用, 2004, (04) :62-63+66
[5]  
Information entropy of orthogonal polynomials[J] . M.X. He,P.E. Ricci.Applied Mathematics and Computation . 2002 (2)