学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于统计的中文姓名识别方法研究
被引:23
作者
:
张锋
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学工程系
张锋
樊孝忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学工程系
樊孝忠
许云
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学工程系
许云
不详
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机科学工程系
不详
机构
:
[1]
北京理工大学计算机科学工程系
[2]
北京理工大学计算机科学工程系 北京
[3]
北京
[4]
北京
来源
:
计算机工程与应用
|
2004年
/ 10期
关键词
:
自动分词;
未登录词;
中文姓名识别;
D O I
:
暂无
中图分类号
:
TP391.4 [模式识别与装置];
学科分类号
:
0811 ;
081101 ;
081104 ;
1405 ;
摘要
:
该文在大规模标注语料的基础上统计分析了中文姓名前置词频率、中文姓氏用字频率、中文名字用字频率、中文姓名后置词频率。利用这些统计数据在词语粗分的基础上实现了中文姓名的自动识别,实验测试结果:准确率93.82%、召回率89.37%。
引用
收藏
页码:53 / 54+77 +77
页数:3
相关论文
共 3 条
[1]
基于统计方法的中文姓名识别
论文数:
引用数:
h-index:
机构:
刘秉伟
黄萱菁
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
黄萱菁
论文数:
引用数:
h-index:
机构:
郭以昆
论文数:
引用数:
h-index:
机构:
吴立德
[J].
中文信息学报,
2000,
(03)
: 16
-
24+36
[2]
基于语料库的中文姓名识别方法研究
郑家恒
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系!太原
郑家恒
论文数:
引用数:
h-index:
机构:
李鑫
谭红叶
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系!太原
谭红叶
[J].
中文信息学报,
2000,
(01)
: 7
-
12
[3]
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
←
1
→
共 3 条
[1]
基于统计方法的中文姓名识别
论文数:
引用数:
h-index:
机构:
刘秉伟
黄萱菁
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
黄萱菁
论文数:
引用数:
h-index:
机构:
郭以昆
论文数:
引用数:
h-index:
机构:
吴立德
[J].
中文信息学报,
2000,
(03)
: 16
-
24+36
[2]
基于语料库的中文姓名识别方法研究
郑家恒
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系!太原
郑家恒
论文数:
引用数:
h-index:
机构:
李鑫
谭红叶
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系!太原
谭红叶
[J].
中文信息学报,
2000,
(01)
: 7
-
12
[3]
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
←
1
→