集成多种背景语义知识的共指消解

被引:28
作者
郎君
忻舟
秦兵
刘挺
李生
机构
[1] 哈尔滨工业大学信息检索研究室
关键词
计算机应用; 中文信息处理; 共指消解; 背景语义知识; WordNet; 维基百科;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
共指消解是信息抽取中一个重要子任务。近年来,许多学者尝试利用统计机器学习的方法来进行共指消解并取得了一定的进展。背景知识作为新的研究热点已经被越来越多地利用在自然语言处理的各个领域。该文集成多种背景语义知识作为基于二元分类的共指消解框架的特征,分别在WordNet、维基百科上提取背景知识,同时利用句子中的浅层语义关系、常见文本模式以及待消解词上下文文本特征。并利用特征选择算法自动选择最优的特征组合,同时对比同样的特征下最大熵模型与支持向量机模型的表现。在ACE数据集上实验结果表明,通过集成各种经过特征选择后的背景语义知识,共指消解的结果有进一步提高。
引用
收藏
页码:3 / 9+109 +109
页数:8
相关论文
共 3 条
[1]
自然语言处理的计算模型 [J].
张钹 .
中文信息学报, 2007, (03) :3-7
[2]
A Machine Learning Approach to Coreference Resolution of Noun Phrases[J] Wee Meng Soon;Hwee Tou Ng;Daniel Chung Yong Lim Computational Linguistics 2001,
[3]
Wrappers for feature subset selection[J] Ron Kohavi;George H. John Artificial Intelligence 1997,