《知网》在命名实体识别中的应用研究

被引:10
作者
郑逢强
林磊
刘秉权
孙承杰
机构
[1] 哈尔滨工业大学智能技术与自然语言处理实验室计算机科学与技术学院
基金
黑龙江省自然科学基金;
关键词
计算机应用; 中文信息处理; 名实体识别; 概念相似度; 《知网》; 最大熵模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
命名实体识别是自然语言处理领域的一项基础研究,它对于语言的深层处理有重要意义。该文以最大熵模型为基础来进行名实体识别,提出了基于《知网》的两种改进策略来增强模型的泛化性能。第一种策略是将《知网》中词的义原作为特征加入到最大熵模型中;第二种策略是利用《知网》来计算最大熵模型中词特征之间的概念相似度。在北京大学《人民日报》语料上的实验结果表明第一种策略可以有效地提高名实体识别的性能,第二种策略的改进效果不明显。
引用
收藏
页码:97 / 101
页数:5
相关论文
共 6 条
  • [1] 中文词语语义相似度计算——基于《知网》2000
    李峰
    李芳
    [J]. 中文信息学报, 2007, (03) : 99 - 105
  • [2] 基于知网的中文问题自动分类
    孙景广
    蔡东风
    吕德新
    董燕举
    [J]. 中文信息学报, 2007, (01) : 90 - 95
  • [3] 基于HowNet的词汇语义倾向计算
    朱嫣岚
    闵锦
    周雅倩
    黄萱菁
    吴立德
    [J]. 中文信息学报, 2006, (01) : 14 - 20
  • [4] 基于变换的中国地名自动识别研究(英文)
    谭红叶
    郑家恒
    刘开瑛
    [J]. 软件学报, 2001, (11) : 1608 - 1613
  • [5] 基于统计方法的中文姓名识别
    黄德根
    杨元生
    王省
    张艳丽
    钟万勰
    [J]. 中文信息学报, 2001, (02) : 31 - 37+44
  • [6] 中文人名自动识别的一种有效方法
    李建华
    王晓龙
    [J]. 高技术通讯, 2000, (02) : 49 - 52