共 6 条
《知网》在命名实体识别中的应用研究
被引:10
作者:
郑逢强
林磊
刘秉权
孙承杰
机构:
[1] 哈尔滨工业大学智能技术与自然语言处理实验室计算机科学与技术学院
来源:
基金:
黑龙江省自然科学基金;
关键词:
计算机应用;
中文信息处理;
名实体识别;
概念相似度;
《知网》;
最大熵模型;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
命名实体识别是自然语言处理领域的一项基础研究,它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别,提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到最大熵模型中;第二种策略是利用《知网》来计算最大熵模型中词特征之间的概念相似度。在北京大学《人民日报》语料上的实验结果表明第一种策略可以有效地提高名实体识别的性能,第二种策略的改进效果不明显。
引用
收藏
页码:97 / 101
页数:5
相关论文