学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于姓氏驱动的中国姓名自动识别方法
被引:8
作者
:
论文数:
引用数:
h-index:
机构:
张仰森
论文数:
引用数:
h-index:
机构:
徐波
曹元大
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机系
曹元大
宗成庆
论文数:
0
引用数:
0
h-index:
0
机构:
北京理工大学计算机系
宗成庆
机构
:
[1]
北京理工大学计算机系
[2]
中国科学院自动化所模式识别国家重点实验室
来源
:
计算机工程与应用
|
2003年
/ 04期
关键词
:
中国姓名识别;
分级加权模型;
姓氏驱动;
潜在人名;
D O I
:
暂无
中图分类号
:
TP391.4 [模式识别与装置];
学科分类号
:
0811 ;
081101 ;
081104 ;
1405 ;
摘要
:
文章基于姓氏驱动和上下文信息,利用从真实姓名样本库和文本语料库中得到的大量统计数据,提出了一种中国姓名识别的分级加权筛选模型,利用基于这一模型的识别算法和冲突解决策略,实现中国人名的自动识别。通过从《人民日报》随机抽取的500个含有人名的句子进行测试,表明:中国姓名召回率达89.2%,精确率达93.15%。
引用
收藏
页码:62 / 65
页数:4
相关论文
共 4 条
[1]
基于统计方法的中文姓名识别
论文数:
引用数:
h-index:
机构:
刘秉伟
黄萱菁
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
黄萱菁
论文数:
引用数:
h-index:
机构:
郭以昆
论文数:
引用数:
h-index:
机构:
吴立德
[J].
中文信息学报,
2000,
(03)
: 16
-
24+36
[2]
中文姓名的自动辨识
孙茂松,黄昌宁,高海燕,方捷
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学系,烟台大学计算机应用系
孙茂松,黄昌宁,高海燕,方捷
[J].
中文信息学报,
1995,
(02)
: 16
-
27
[3]
多语料库作法之中文姓名辨识
张俊盛
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
张俊盛
陈舜德
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
陈舜德
郑萦
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
郑萦
刘显仲
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
刘显仲
柯淑津
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
柯淑津
[J].
中文信息学报,
1992,
(03)
: 7
-
15
[4]
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
←
1
→
共 4 条
[1]
基于统计方法的中文姓名识别
论文数:
引用数:
h-index:
机构:
刘秉伟
黄萱菁
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机科学系!上海
黄萱菁
论文数:
引用数:
h-index:
机构:
郭以昆
论文数:
引用数:
h-index:
机构:
吴立德
[J].
中文信息学报,
2000,
(03)
: 16
-
24+36
[2]
中文姓名的自动辨识
孙茂松,黄昌宁,高海燕,方捷
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学系,烟台大学计算机应用系
孙茂松,黄昌宁,高海燕,方捷
[J].
中文信息学报,
1995,
(02)
: 16
-
27
[3]
多语料库作法之中文姓名辨识
张俊盛
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
张俊盛
陈舜德
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
陈舜德
郑萦
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
郑萦
刘显仲
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
刘显仲
柯淑津
论文数:
0
引用数:
0
h-index:
0
机构:
台湾清华大学资讯系及语言研究所
柯淑津
[J].
中文信息学报,
1992,
(03)
: 7
-
15
[4]
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
←
1
→