基于语义树的中文词语相似度计算与分析

被引：33

作者：

张亮 ^{[1
,2
]}

尹存燕 ^{[1
]}

陈家骏 ^{[1
]}

机构：

[1] 南京大学计算机软件新技术国家重点实验室

[2] 江苏警官学院公安科技系

来源：

中文信息学报 | 2010年 / 06期

关键词：

语义树; 词语相似度; 《知网》2007; 语义距离;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

摘要：

词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方法的改进和完善。该文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类义原框架以及概念特性描述三个方面综合分析词语相似度,并在计算中区分语义特征相似度和句法特征相似度。实验结果理想,与人的直观判断基本一致。

引用

页码：23 / 30

页数：8

共 8 条

[1] 知网的理论发现
董振东
董强
郝长伶
[J]. 中文信息学报, 2007, (04) : 3 - 9
[2] 中文词语语义相似度计算——基于《知网》2000
李峰
李芳
[J]. 中文信息学报, 2007, (03) : 99 - 105
[3] 基于HowNet的词汇语义倾向计算
朱嫣岚
闵锦
周雅倩
黄萱菁
吴立德
[J]. 中文信息学报, 2006, (01) : 14 - 20
[4] 基于本体论和词汇语义相似度的Web服务发现
吴健
吴朝晖
李莹
邓水光
[J]. 计算机学报, 2005, (04) : 595 - 602
[5] 自然语言处理中词相关性知识无导获取和均衡分类器构建[D]. 鲁松.中国科学院研究生院（计算技术研究所） 2001
[6] Similarity-Based Models of Word Cooccurrence Probabilities[J] . Ido Dagan,Lillian Lee,Fernando C. N. Pereira.Machine Learning . 1999 (1)
[7] 知网. 董振东,董强. http://www.keenage.com . 1992
[8] 汉语词义排歧方法研究. 李涓子. 清华大学 . 1999

← 1 →