基于最大熵原理的汉语词义消歧

被引:7
作者
陈笑蓉
秦进
机构
[1] 贵州大学信息与计算机科学学院
关键词
词义消歧; 最大熵模型; 有监督机器学习;
D O I
暂无
中图分类号
H087 [数理语言学];
学科分类号
摘要
词义消歧是自然语言处理中亟待解决的一个关键问题,本文提出一种基于最大熵模型的有监督的机器学习方法,用于汉语词义消歧。该方法综合了词标记、词性、主题等上下文特征,并用一种统一的表示方法规范化特征形式,解决了多种不同特征之间的融合和特征的知识表示。实验对20个汉语高频多义词进行了测试,平均正确率为87%,验证了该方法的有效性。
引用
收藏
页码:174 / 176
页数:3
相关论文
共 3 条
[1]   基于特征的汉语词性标注模型 [J].
屈刚 ;
陆汝占 .
计算机研究与发展, 2003, (04) :556-561
[2]   一种自组织的汉语词义排歧方法 [J].
李涓子 ;
黄昌宁 ;
杨尔弘 .
中文信息学报, 1999, (03) :2-9
[3]   语言模型中一种改进的最大熵方法及其应用 [J].
李涓子 ;
黄昌宁 .
软件学报, 1999, (03) :34-40