一种自组织的汉语词义排歧方法

被引:14
作者
李涓子
黄昌宁
杨尔弘
机构
[1] 智能技术与系统国家重点实验室
[2] 清华大学计算机科学与技术系
[3] 山西大学计算机科学系
关键词
自然语言处理,词义排歧,自组织方法,搭配;
D O I
暂无
中图分类号
H08 [应用语言学];
学科分类号
050211 ;
摘要
长期以来,词义排歧一直被认为是自然语言处理的难题之一。本文用机器可读词典《现代汉语辞海》提供的搭配实例作为多义词的初始搭配知识,采用适当的统计和自组织方法自动扩大搭配集;为保证学习质量,在学习过程中逐渐增大上下文窗口的长度;提出使用搭配统计表的多元最大对数似然比词义排歧算法。最后,对本文提出的方法进行了实验,实验表明这种算法具有较高的正确率。
引用
收藏
页码:2 / 9
页数:8
相关论文
共 1 条
[1]  
Computational Linguistics Special Issue on Word Sense Disambiguation. Nancy Ide,Jean Veronis. Computational Linguistics . 1998