基于多步聚类的汉语命名实体识别和歧义消解

被引:17
作者
李广一 [1 ]
王厚峰 [2 ]
机构
[1] 不详
[2] 北京大学计算语言学教育部重点实验室
[3] 不详
[4] 北京大学计算语言学研究所
[5] 不详
关键词
命名实体识别; 命名实体消歧; 聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
命名实体识别和歧义消解是自然语言理解的重要研究内容。针对提供实体知识库情况下的命名实体识别和歧义消解任务,该文提出了一种基于多步聚类的方法。首先通过两轮聚类将命名实体与知识库实体定义链接,然后通过层次聚合式聚类对知识库中未出现的实体进行聚类,最后进行普通词的识别和基于K-Means聚类的结果调整。在CLP-2012的汉语命名实体识别和歧义消解评测数据上的实验表明,该文的方法表现出良好的性能,在测试集上的F值高出评测参赛队伍最好水平6.46%,达到86.68%。
引用
收藏
页码:29 / 34+42 +42
页数:7
相关论文
共 3 条
[1]   面向人名消歧任务的人名识别系统 [J].
时迎超 ;
王会珍 ;
肖桐 ;
胡明涵 .
中文信息学报, 2011, (03) :17-22
[2]   命名实体识别、排歧和跨语言关联 [J].
赵军 .
中文信息学报, 2009, (02) :3-17
[3]  
Chinese Name Disambiguation Basedon Adaptive Clustering with the Attribute Features. Tian W,Pan X,Yu Z,et al. Proceed-ings of the 2nd CIPS-SIGHAN Joint Conference on Chinese Lan-guage Processing . 2012