学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于层叠条件随机场的旅游领域命名实体识别
被引:37
作者
:
论文数:
引用数:
h-index:
机构:
郭剑毅
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
薛征山
[
1
]
论文数:
引用数:
h-index:
机构:
余正涛
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
张志坤
[
1
]
论文数:
引用数:
h-index:
机构:
张宜浩
[
1
]
论文数:
引用数:
h-index:
机构:
姚贤明
[
1
]
机构
:
[1]
昆明理工大学信息工程与自动化学院
[2]
云南省计算机技术应用重点实验室智能信息处理研究所
来源
:
中文信息学报
|
2009年
/ 05期
关键词
:
计算机应用;
中文信息处理;
旅游领域;
命名实体识别;
层叠条件随机场;
特征模板;
D O I
:
暂无
中图分类号
:
TP391.41 [];
学科分类号
:
080203 ;
摘要
:
针对旅游领域,提出了一种基于层叠条件随机场模型的旅游领域命名实体识别方法。该方法在低层条件随机场中以字为切分粒度,结合旅游景点常用字表、景点常用后缀表、地名常用字表等特征词典,实现简单旅游命名实体的识别;其识别结果传递到高层模型,以词为切分粒度,结合复杂特征,实现嵌套景点、特产风味、地点的识别。最后进行了两组相关实验,结果表明,在开放测试中,层叠条件随机场模型相比于单层模型,F值提高了8个百分点;相比于HMM模型,正确率提高了8个百分点,召回率提高了22个百分点,F值提高了15个百分点。
引用
收藏
页码:47 / 52
页数:6
相关论文
共 9 条
[1]
基于单字提示特征的中文命名实体识别快速算法
冯元勇
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
冯元勇
孙乐
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
孙乐
李文波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
李文波
张大鲲
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
张大鲲
[J].
中文信息学报,
2008,
(01)
: 104
-
110
[2]
基于HMM的生物医学命名实体的识别与分类
论文数:
引用数:
h-index:
机构:
陈锦
论文数:
引用数:
h-index:
机构:
常致全
许军
论文数:
0
引用数:
0
h-index:
0
机构:
四川财经职业学院
四川大学计算机学院
许军
[J].
计算机时代,
2006,
(10)
: 40
-
42
[3]
边界模板和局部统计相结合的中国人名识别
李中国
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学中文系计算语言学研究室
李中国
刘颖
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学中文系计算语言学研究室
刘颖
[J].
中文信息学报,
2006,
(05)
: 44
-
50
[4]
基于层叠条件随机场模型的中文机构名自动识别
论文数:
引用数:
h-index:
机构:
周俊生
戴新宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
戴新宇
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
电子学报,
2006,
(05)
: 804
-
809
[5]
基于层叠隐马尔可夫模型的中文命名实体识别
论文数:
引用数:
h-index:
机构:
俞鸿魁
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
张华平
论文数:
引用数:
h-index:
机构:
刘群
论文数:
引用数:
h-index:
机构:
吕学强
论文数:
引用数:
h-index:
机构:
施水才
[J].
通信学报 ,
2006,
(02)
: 87
-
94
[6]
面向商务信息抽取的产品命名实体识别研究
论文数:
引用数:
h-index:
机构:
刘非凡
论文数:
引用数:
h-index:
机构:
赵军
论文数:
引用数:
h-index:
机构:
吕碧波
徐波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化研究所模式识别国家重点实验室
中国科学院自动化研究所模式识别国家重点实验室
徐波
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
于浩
夏迎炬
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
夏迎炬
[J].
中文信息学报,
2006,
(01)
: 7
-
13
[7]
中文机构名称的识别与分析
张小衡
论文数:
0
引用数:
0
h-index:
0
机构:
香港理工大学中文及双语学系
张小衡
王玲玲
论文数:
0
引用数:
0
h-index:
0
机构:
香港理工大学中文及双语学系
王玲玲
[J].
中文信息学报,
1997,
(04)
: 22
-
33
[8]
HMM与自动规则提取相结合的中文命名实体识别[A]. 廖先桃,于海滨,秦兵,刘挺.第二届全国学生计算语言学研讨会论文集[C]. 2004
[9]
MARKOV-FIELDS AND LOG-LINEAR INTERACTION MODELS FOR CONTINGENCY-TABLES
DARROCH, JN
论文数:
0
引用数:
0
h-index:
0
机构:
UNIV WESTERN AUSTRALIA,DEPT MATH,NEDLANDS,WA 6009,AUSTRALIA
DARROCH, JN
LAURITZEN, SL
论文数:
0
引用数:
0
h-index:
0
机构:
UNIV WESTERN AUSTRALIA,DEPT MATH,NEDLANDS,WA 6009,AUSTRALIA
LAURITZEN, SL
SPEED, TP
论文数:
0
引用数:
0
h-index:
0
机构:
UNIV WESTERN AUSTRALIA,DEPT MATH,NEDLANDS,WA 6009,AUSTRALIA
SPEED, TP
[J].
ANNALS OF STATISTICS,
1980,
8
(03)
: 522
-
539
←
1
→
共 9 条
[1]
基于单字提示特征的中文命名实体识别快速算法
冯元勇
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
冯元勇
孙乐
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
孙乐
李文波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
李文波
张大鲲
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院软件研究所中文信息处理中心
张大鲲
[J].
中文信息学报,
2008,
(01)
: 104
-
110
[2]
基于HMM的生物医学命名实体的识别与分类
论文数:
引用数:
h-index:
机构:
陈锦
论文数:
引用数:
h-index:
机构:
常致全
许军
论文数:
0
引用数:
0
h-index:
0
机构:
四川财经职业学院
四川大学计算机学院
许军
[J].
计算机时代,
2006,
(10)
: 40
-
42
[3]
边界模板和局部统计相结合的中国人名识别
李中国
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学中文系计算语言学研究室
李中国
刘颖
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学中文系计算语言学研究室
刘颖
[J].
中文信息学报,
2006,
(05)
: 44
-
50
[4]
基于层叠条件随机场模型的中文机构名自动识别
论文数:
引用数:
h-index:
机构:
周俊生
戴新宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
戴新宇
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
电子学报,
2006,
(05)
: 804
-
809
[5]
基于层叠隐马尔可夫模型的中文命名实体识别
论文数:
引用数:
h-index:
机构:
俞鸿魁
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
张华平
论文数:
引用数:
h-index:
机构:
刘群
论文数:
引用数:
h-index:
机构:
吕学强
论文数:
引用数:
h-index:
机构:
施水才
[J].
通信学报 ,
2006,
(02)
: 87
-
94
[6]
面向商务信息抽取的产品命名实体识别研究
论文数:
引用数:
h-index:
机构:
刘非凡
论文数:
引用数:
h-index:
机构:
赵军
论文数:
引用数:
h-index:
机构:
吕碧波
徐波
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化研究所模式识别国家重点实验室
中国科学院自动化研究所模式识别国家重点实验室
徐波
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
于浩
夏迎炬
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
夏迎炬
[J].
中文信息学报,
2006,
(01)
: 7
-
13
[7]
中文机构名称的识别与分析
张小衡
论文数:
0
引用数:
0
h-index:
0
机构:
香港理工大学中文及双语学系
张小衡
王玲玲
论文数:
0
引用数:
0
h-index:
0
机构:
香港理工大学中文及双语学系
王玲玲
[J].
中文信息学报,
1997,
(04)
: 22
-
33
[8]
HMM与自动规则提取相结合的中文命名实体识别[A]. 廖先桃,于海滨,秦兵,刘挺.第二届全国学生计算语言学研讨会论文集[C]. 2004
[9]
MARKOV-FIELDS AND LOG-LINEAR INTERACTION MODELS FOR CONTINGENCY-TABLES
DARROCH, JN
论文数:
0
引用数:
0
h-index:
0
机构:
UNIV WESTERN AUSTRALIA,DEPT MATH,NEDLANDS,WA 6009,AUSTRALIA
DARROCH, JN
LAURITZEN, SL
论文数:
0
引用数:
0
h-index:
0
机构:
UNIV WESTERN AUSTRALIA,DEPT MATH,NEDLANDS,WA 6009,AUSTRALIA
LAURITZEN, SL
SPEED, TP
论文数:
0
引用数:
0
h-index:
0
机构:
UNIV WESTERN AUSTRALIA,DEPT MATH,NEDLANDS,WA 6009,AUSTRALIA
SPEED, TP
[J].
ANNALS OF STATISTICS,
1980,
8
(03)
: 522
-
539
←
1
→