先秦古汉语典籍中的人名自动识别研究

被引:14
作者
汤亚芬
机构
[1] 南京农业大学信息科学技术学院
关键词
条件随机场; 古汉语人名; 特征模板; 先秦语料库;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
以数字人文的文本挖掘和分析这一研究内容为切入点,通过条件随机场这一机器学习模型,在先秦语料库的基础上自动识别古汉语人名。在规模为187 901个词汇的先秦语料上,把调和平均值为91.52%的交叉验证语料所训练的模型确定为古汉语人名自动识别的最优模型,并进行实验验证。本研究不仅有助于先秦古文献命名实体的抽取,而且也有益于其他人文学科对先秦人物关系和背景的探究。
引用
收藏
页码:63 / 68
页数:6
相关论文
共 11 条