学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于统计和规则的中文姓名自动辨识
被引:11
作者
:
论文数:
引用数:
h-index:
机构:
季姮
罗振声
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学中文系计算语言研究室北京!
罗振声
机构
:
[1]
清华大学中文系计算语言研究室北京!
来源
:
语言文字应用
|
2001年
/ 01期
关键词
:
概率分布;
规则筛选;
兼类姓;
专有人名;
特殊候选姓名对;
D O I
:
10.16499/j.cnki.1003-5397.2001.01.002
中图分类号
:
H085.6 [];
学科分类号
:
摘要
:
中文姓名的辨识是自动分词、自动文摘的基础。独立于自动分词 ,我们运用姓名用字概率和规则 ,设计并实现了一个中文姓名辨识系统。对 2 0 775 7字语料进行了测试 ,召回率达到 92 .5 7% ,精确率达到 80 .35 % ,且速度较快。
引用
收藏
页码:14 / 18
页数:5
相关论文
共 5 条
[1]
中文姓名的自动辨识
孙茂松,黄昌宁,高海燕,方捷
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学系,烟台大学计算机应用系
孙茂松,黄昌宁,高海燕,方捷
[J].
中文信息学报,
1995,
(02)
: 16
-
27
[2]
多语料库作法之中文姓名辨识
张俊盛
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
张俊盛
陈舜德
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
陈舜德
郑萦
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
郑萦
刘显仲
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
刘显仲
柯淑津
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
柯淑津
[J].
中文信息学报,
1992,
(03)
: 7
-
15
[3]
姓氏人名用字分析统计[M]. 语文出版社 , 中国社会科学院语言文字应用研究所汉字整理研究室编, 1991
[4]
计算语言学文集. 王省,黄德根,杨元生. 清华大学出版社 . 1999
[5]
计算语言研究与应用. 宋柔,朱宏,潘维佳,尹振海. 北京语言学院出版社 . 1993
←
1
→
共 5 条
[1]
中文姓名的自动辨识
孙茂松,黄昌宁,高海燕,方捷
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学系,烟台大学计算机应用系
孙茂松,黄昌宁,高海燕,方捷
[J].
中文信息学报,
1995,
(02)
: 16
-
27
[2]
多语料库作法之中文姓名辨识
张俊盛
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
张俊盛
陈舜德
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
陈舜德
郑萦
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
郑萦
刘显仲
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
刘显仲
柯淑津
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
柯淑津
[J].
中文信息学报,
1992,
(03)
: 7
-
15
[3]
姓氏人名用字分析统计[M]. 语文出版社 , 中国社会科学院语言文字应用研究所汉字整理研究室编, 1991
[4]
计算语言学文集. 王省,黄德根,杨元生. 清华大学出版社 . 1999
[5]
计算语言研究与应用. 宋柔,朱宏,潘维佳,尹振海. 北京语言学院出版社 . 1993
←
1
→