先秦人名识别初探

被引:8
作者
汪青青
机构
[1] 南京师范大学文学院
关键词
先秦人名; 特征; 识别; crf模型;
D O I
暂无
中图分类号
K820.9 [氏族谱系]; K221 [三代(公元前21世纪~公元前770年)];
学科分类号
060207 ; 0603 ; 0602 ;
摘要
先秦人名和现代人名的构成方式和上下文语境有很大不同。本文以先秦文献《春秋左传》为突破口,对书中的人名进行了统计分析,挖掘其内部特征及分布特征,并且利用CRF模型对先秦人名的识别进行了初步的尝试。在开放测试中,该方法取得了92.48%的准确率。
引用
收藏
页码:202 / 204
页数:3
相关论文
共 6 条
[1]   中文姓名的自动辨识 [J].
孙茂松,黄昌宁,高海燕,方捷 .
中文信息学报, 1995, (02) :16-27
[2]   《左传》姓氏相关问题的探索 [J].
严军 .
浙江学刊, 1994, (04) :89-92+57
[3]  
中文文本自动分词和标注[M]. 商务印书馆 , 刘开瑛著, 2000
[4]  
春秋左传注[M]. 中华书局 , 杨伯峻 注, 1981
[5]  
春秋左传集解[M]. 上海人民出版社 , (春秋)左丘明传 著, 1977
[6]  
先秦文献的信息处理刍议. 陈小荷. 中文信息学会会议上的发言 . 2008