基于层叠条件随机场的旅游领域命名实体识别

被引:37
作者
郭剑毅 [1 ,2 ]
薛征山 [1 ]
余正涛 [1 ,2 ]
张志坤 [1 ]
张宜浩 [1 ]
姚贤明 [1 ]
机构
[1] 昆明理工大学信息工程与自动化学院
[2] 云南省计算机技术应用重点实验室智能信息处理研究所
关键词
计算机应用; 中文信息处理; 旅游领域; 命名实体识别; 层叠条件随机场; 特征模板;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 9 条
  • [1] 基于单字提示特征的中文命名实体识别快速算法
    冯元勇
    孙乐
    李文波
    张大鲲
    [J]. 中文信息学报, 2008, (01) : 104 - 110
  • [2] 基于HMM的生物医学命名实体的识别与分类
    陈锦
    常致全
    许军
    [J]. 计算机时代, 2006, (10) : 40 - 42
  • [3] 边界模板和局部统计相结合的中国人名识别
    李中国
    刘颖
    [J]. 中文信息学报, 2006, (05) : 44 - 50
  • [4] 基于层叠条件随机场模型的中文机构名自动识别
    周俊生
    戴新宇
    尹存燕
    陈家骏
    [J]. 电子学报, 2006, (05) : 804 - 809
  • [5] 基于层叠隐马尔可夫模型的中文命名实体识别
    俞鸿魁
    张华平
    刘群
    吕学强
    施水才
    [J]. 通信学报 , 2006, (02) : 87 - 94
  • [6] 面向商务信息抽取的产品命名实体识别研究
    刘非凡
    赵军
    吕碧波
    徐波
    于浩
    夏迎炬
    [J]. 中文信息学报, 2006, (01) : 7 - 13
  • [7] 中文机构名称的识别与分析
    张小衡
    王玲玲
    [J]. 中文信息学报, 1997, (04) : 22 - 33
  • [8] HMM与自动规则提取相结合的中文命名实体识别[A]. 廖先桃,于海滨,秦兵,刘挺.第二届全国学生计算语言学研讨会论文集[C]. 2004
  • [9] MARKOV-FIELDS AND LOG-LINEAR INTERACTION MODELS FOR CONTINGENCY-TABLES
    DARROCH, JN
    LAURITZEN, SL
    SPEED, TP
    [J]. ANNALS OF STATISTICS, 1980, 8 (03) : 522 - 539