学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于统计的中文地名自动识别研究
被引:13
作者
:
论文数:
引用数:
h-index:
机构:
邱莎
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
阿圆
[
1
]
论文数:
引用数:
h-index:
机构:
王付艳
[
1
]
论文数:
引用数:
h-index:
机构:
丁海燕
[
3
]
机构
:
[1]
昆明学院信息技术学院
[2]
复旦大学计算机科学技术学院
[3]
云南大学信息学院
来源
:
计算机技术与发展
|
2011年
/ 21卷
/ 11期
关键词
:
中文地名识别;
条件随机场;
特征模板;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
中文地名的自动识别是命名实体识别任务中难度较大的任务之一,目的是从中文文本中自动准确提取地理专用名词。文中使用统计模型中的条件随机场对中文地名的自动识别在字一级粒度进行了研究。在研究中利用条件随机场能任意添加特征的优点,合理引用了丰富的特征组合,在大规模语料上进行训练,统计获得标注序列基于特征集的条件概率分布,并采用序列标注的方式,实现中文地名的自动识别。多次闭合测试和开放测试结果F1值为90%左右,识别效果良好。
引用
收藏
页码:35 / 38
页数:4
相关论文
共 9 条
[1]
CRF与规则相结合的地理空间命名实体识别
论文数:
引用数:
h-index:
机构:
鞠久朋
张伟伟
论文数:
0
引用数:
0
h-index:
0
机构:
海量信息技术有限公司
苏州大学计算机科学与技术学院
张伟伟
宁建军
论文数:
0
引用数:
0
h-index:
0
机构:
新民网
苏州大学计算机科学与技术学院
宁建军
周国栋
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
苏州大学计算机科学与技术学院
周国栋
[J].
计算机工程,
2011,
37
(07)
: 210
-
212+215
[2]
HMM在自然语言处理领域中的应用研究
韩普
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学教育科学学院
韩普
论文数:
引用数:
h-index:
机构:
姜杰
[J].
计算机技术与发展,
2010,
20
(02)
: 245
-
248+252
[3]
基于条件随机场的中文地名识别
王凡秀
论文数:
0
引用数:
0
h-index:
0
机构:
河南工业大学
王凡秀
[J].
中国西部科技,
2008,
(28)
: 8+3
-
8
[4]
基于小规模尾字特征的中文命名实体识别研究
论文数:
引用数:
h-index:
机构:
冯元勇
论文数:
引用数:
h-index:
机构:
孙乐
论文数:
引用数:
h-index:
机构:
张大鲲
论文数:
引用数:
h-index:
机构:
李文波
[J].
电子学报,
2008,
(09)
: 1833
-
1838
[5]
基于层叠条件随机场模型的中文机构名自动识别
论文数:
引用数:
h-index:
机构:
周俊生
戴新宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
戴新宇
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
电子学报,
2006,
(05)
: 804
-
809
[6]
基于层叠隐马尔可夫模型的中文命名实体识别
论文数:
引用数:
h-index:
机构:
俞鸿魁
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
张华平
论文数:
引用数:
h-index:
机构:
刘群
论文数:
引用数:
h-index:
机构:
吕学强
论文数:
引用数:
h-index:
机构:
施水才
[J].
通信学报 ,
2006,
(02)
: 87
-
94
[7]
用支持向量机进行中文地名识别的研究
论文数:
引用数:
h-index:
机构:
李丽双
论文数:
引用数:
h-index:
机构:
黄德根
陈春荣
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
陈春荣
杨元生
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
杨元生
[J].
小型微型计算机系统,
2005,
(08)
: 1416
-
1419
[8]
基于统计的中文地名识别
论文数:
引用数:
h-index:
机构:
黄德根
岳广玲
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
岳广玲
杨元生
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
杨元生
[J].
中文信息学报,
2003,
(02)
: 36
-
41
[9]
基于条件随机域的中文命名实体识别.[A].史树敏;王志强;周浪;冯冲;黄河燕;.第三届学生计算语言学研讨会.2006,
←
1
→
共 9 条
[1]
CRF与规则相结合的地理空间命名实体识别
论文数:
引用数:
h-index:
机构:
鞠久朋
张伟伟
论文数:
0
引用数:
0
h-index:
0
机构:
海量信息技术有限公司
苏州大学计算机科学与技术学院
张伟伟
宁建军
论文数:
0
引用数:
0
h-index:
0
机构:
新民网
苏州大学计算机科学与技术学院
宁建军
周国栋
论文数:
0
引用数:
0
h-index:
0
机构:
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
苏州大学计算机科学与技术学院
周国栋
[J].
计算机工程,
2011,
37
(07)
: 210
-
212+215
[2]
HMM在自然语言处理领域中的应用研究
韩普
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学教育科学学院
韩普
论文数:
引用数:
h-index:
机构:
姜杰
[J].
计算机技术与发展,
2010,
20
(02)
: 245
-
248+252
[3]
基于条件随机场的中文地名识别
王凡秀
论文数:
0
引用数:
0
h-index:
0
机构:
河南工业大学
王凡秀
[J].
中国西部科技,
2008,
(28)
: 8+3
-
8
[4]
基于小规模尾字特征的中文命名实体识别研究
论文数:
引用数:
h-index:
机构:
冯元勇
论文数:
引用数:
h-index:
机构:
孙乐
论文数:
引用数:
h-index:
机构:
张大鲲
论文数:
引用数:
h-index:
机构:
李文波
[J].
电子学报,
2008,
(09)
: 1833
-
1838
[5]
基于层叠条件随机场模型的中文机构名自动识别
论文数:
引用数:
h-index:
机构:
周俊生
戴新宇
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
戴新宇
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
电子学报,
2006,
(05)
: 804
-
809
[6]
基于层叠隐马尔可夫模型的中文命名实体识别
论文数:
引用数:
h-index:
机构:
俞鸿魁
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
中国科学院计算技术研究所
张华平
论文数:
引用数:
h-index:
机构:
刘群
论文数:
引用数:
h-index:
机构:
吕学强
论文数:
引用数:
h-index:
机构:
施水才
[J].
通信学报 ,
2006,
(02)
: 87
-
94
[7]
用支持向量机进行中文地名识别的研究
论文数:
引用数:
h-index:
机构:
李丽双
论文数:
引用数:
h-index:
机构:
黄德根
陈春荣
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
陈春荣
杨元生
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
杨元生
[J].
小型微型计算机系统,
2005,
(08)
: 1416
-
1419
[8]
基于统计的中文地名识别
论文数:
引用数:
h-index:
机构:
黄德根
岳广玲
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
岳广玲
杨元生
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
杨元生
[J].
中文信息学报,
2003,
(02)
: 36
-
41
[9]
基于条件随机域的中文命名实体识别.[A].史树敏;王志强;周浪;冯冲;黄河燕;.第三届学生计算语言学研讨会.2006,
←
1
→