基于最大熵原理的汉语词义消歧

被引：7

作者：

陈笑蓉

秦进

机构：

[1] 贵州大学信息与计算机科学学院

来源：

计算机科学 | 2005年 / 05期

关键词：

词义消歧; 最大熵模型; 有监督机器学习;

D O I：

暂无

中图分类号：

H087 [数理语言学];

学科分类号：

摘要：

词义消歧是自然语言处理中亟待解决的一个关键问题,本文提出一种基于最大熵模型的有监督的机器学习方法,用于汉语词义消歧。该方法综合了词标记、词性、主题等上下文特征,并用一种统一的表示方法规范化特征形式,解决了多种不同特征之间的融合和特征的知识表示。实验对20个汉语高频多义词进行了测试,平均正确率为87％,验证了该方法的有效性。

引用

页码：174 / 176

页数：3