学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于条件随机场的中文人名识别研究
被引:3
作者
:
邱莎
论文数:
0
引用数:
0
h-index:
0
机构:
昆明学院信息技术学院
复旦大学计算机科学技术学院
昆明学院信息技术学院
邱莎
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
段玻
[
1
]
论文数:
引用数:
h-index:
机构:
申浩如
[
1
]
论文数:
引用数:
h-index:
机构:
丁海燕
[
3
]
机构
:
[1]
昆明学院信息技术学院
[2]
复旦大学计算机科学技术学院
[3]
云南大学信息学院
来源
:
昆明学院学报
|
2011年
/ 33卷
/ 06期
关键词
:
命名实体识别;
中文人名识别;
条件随机场;
条件概率;
特征模板;
序列标注;
D O I
:
10.14091/j.cnki.kmxyxb.2011.06.030
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
利用条件随机场能够任意添加特征的优点,基于条件随机场模型在字粒度一级进行中文人名识别的研究.根据中文人名在文本中出现的基本特征和上下文特征,结合模型的综合性能,合理构造条件随机场的特征模板,在大规模标注语料上进行训练,统计中文人名在文本中的条件概率分布,获得模型参数,并采用序列标注的方式完成中文人名识别任务.多次闭合测试和开放测试结果表明,F值基本都高于90%.
引用
收藏
页码:64 / 66
页数:3
相关论文
共 5 条
[1]
基于小规模尾字特征的中文命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
张大鲲
;
论文数:
引用数:
h-index:
机构:
李文波
.
电子学报,
2008,
(09)
:1833
-1838
[2]
基于混合模型的中国人名自动识别
[J].
毛婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
毛婷婷
;
论文数:
引用数:
h-index:
机构:
李丽双
;
论文数:
引用数:
h-index:
机构:
黄德根
.
中文信息学报,
2007,
(02)
:22
-28
[3]
基于统计方法的中文姓名识别研究
[J].
贾品贵
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化所综合信息中心
贾品贵
;
杨一平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化所综合信息中心
杨一平
;
卢朋
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化所综合信息中心
卢朋
.
计算机工程与应用,
2006,
(31)
:168
-170
[4]
基于层叠隐马尔可夫模型的中文命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
俞鸿魁
;
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
刘群
;
论文数:
引用数:
h-index:
机构:
吕学强
;
论文数:
引用数:
h-index:
机构:
施水才
.
通信学报 ,
2006,
(02)
:87
-94
[5]
基于条件随机域的中文命名实体识别.[A].史树敏;王志强;周浪;冯冲;黄河燕;.第三届学生计算语言学研讨会.2006,
←
1
→
共 5 条
[1]
基于小规模尾字特征的中文命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
张大鲲
;
论文数:
引用数:
h-index:
机构:
李文波
.
电子学报,
2008,
(09)
:1833
-1838
[2]
基于混合模型的中国人名自动识别
[J].
毛婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
毛婷婷
;
论文数:
引用数:
h-index:
机构:
李丽双
;
论文数:
引用数:
h-index:
机构:
黄德根
.
中文信息学报,
2007,
(02)
:22
-28
[3]
基于统计方法的中文姓名识别研究
[J].
贾品贵
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化所综合信息中心
贾品贵
;
杨一平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化所综合信息中心
杨一平
;
卢朋
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院自动化所综合信息中心
卢朋
.
计算机工程与应用,
2006,
(31)
:168
-170
[4]
基于层叠隐马尔可夫模型的中文命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
俞鸿魁
;
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
张华平
;
刘群
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
刘群
;
论文数:
引用数:
h-index:
机构:
吕学强
;
论文数:
引用数:
h-index:
机构:
施水才
.
通信学报 ,
2006,
(02)
:87
-94
[5]
基于条件随机域的中文命名实体识别.[A].史树敏;王志强;周浪;冯冲;黄河燕;.第三届学生计算语言学研讨会.2006,
←
1
→