从搭配知识获取最优种子的词义消歧方法

被引：46

作者：

全昌勤

何婷婷

姬东鸿

刘辉

机构：

[1] 华中师范大学计算机科学与技术系

[2] 新加坡国家科技局信息科学研究院

[3] 华中师范大学生命科学学院湖北武汉

[4] 湖北武汉

[5] 新加坡

来源：

中文信息学报 | 2005年 / 01期

关键词：

人工智能; 自然语言处理; 自然语言处理; 词义消歧; 搭配; 种子优选;

D O I：

暂无

中图分类号：

TP391.2 [翻译机];

学科分类号：

080201 [机械制造及其自动化];

摘要：

基于统计的词义消歧模型的一个关键问题是如何自动从语料库中获取指示词 ,虽然通过学习初始搭配实例能够在语料库中获取更多的搭配知识 ,但人工获取质量较好的初始搭配是比较困难的 ,并且无法保证有效的扩大搭配知识。针对该问题 ,提出了通过机器学习初始搭配实例获取最优种子 ,再由最优种子扩增更多指示词 ,最后利用这些指示词实现具有多个义项的多义词消歧。采用该方法对 8个多义词进行消歧的测试实验中取得了 87 7%的平均正确率。

引用

页码：30 / 35

页数：6