学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
先秦古汉语典籍中的人名自动识别研究
被引:14
作者
:
论文数:
引用数:
h-index:
机构:
汤亚芬
机构
:
[1]
南京农业大学信息科学技术学院
来源
:
现代图书情报技术
|
2013年
/ Z1期
关键词
:
条件随机场;
古汉语人名;
特征模板;
先秦语料库;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
以数字人文的文本挖掘和分析这一研究内容为切入点,通过条件随机场这一机器学习模型,在先秦语料库的基础上自动识别古汉语人名。在规模为187 901个词汇的先秦语料上,把调和平均值为91.52%的交叉验证语料所训练的模型确定为古汉语人名自动识别的最优模型,并进行实验验证。本研究不仅有助于先秦古文献命名实体的抽取,而且也有益于其他人文学科对先秦人物关系和背景的探究。
引用
收藏
页码:63 / 68
页数:6
相关论文
共 11 条
[1]
基于XML的《论语》与其注疏文献对齐语料库的知识表示
论文数:
引用数:
h-index:
机构:
马创新
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
陈小荷
[J].
图书情报知识,
2013,
(01)
: 107
-
113
[2]
基于知网的贝叶斯中文人名识别
论文数:
引用数:
h-index:
机构:
蒋才智
王浩
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
王浩
姚宏亮
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
姚宏亮
[J].
南京大学学报(自然科学版),
2012,
48
(02)
: 147
-
153
[3]
一种利用注疏的《左传》分词新方法
论文数:
引用数:
h-index:
机构:
徐润华
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学语言信息科技研究中心
陈小荷
[J].
中文信息学报,
2012,
(02)
: 13
-
17+45
[4]
利用CRF实现中文人名性别的自动识别
论文数:
引用数:
h-index:
机构:
赵晓凡
论文数:
引用数:
h-index:
机构:
赵丹
刘永革
论文数:
0
引用数:
0
h-index:
0
机构:
安阳师范学院计算机与信息工程学院
安阳师范学院计算机与信息工程学院
刘永革
[J].
微电子学与计算机,
2011,
28
(10)
: 122
-
124+128
[5]
基于层次聚类算法的中文人名消歧
章顺瑞
论文数:
0
引用数:
0
h-index:
0
机构:
中国国防科技信息中心
章顺瑞
游宏梁
论文数:
0
引用数:
0
h-index:
0
机构:
中国国防科技信息中心
游宏梁
[J].
现代图书情报技术,
2010,
(11)
: 64
-
68
[6]
基于CRF的先秦汉语分词标注一体化研究
论文数:
引用数:
h-index:
机构:
石民
论文数:
引用数:
h-index:
机构:
李斌
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
陈小荷
[J].
中文信息学报,
2010,
24
(02)
: 39
-
45
[7]
基于混合模型的中国人名自动识别
毛婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
毛婷婷
论文数:
引用数:
h-index:
机构:
李丽双
论文数:
引用数:
h-index:
机构:
黄德根
[J].
中文信息学报,
2007,
(02)
: 22
-
28
[8]
基于角色标注的中国人名自动识别研究
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张华平
论文数:
引用数:
h-index:
机构:
刘群
[J].
计算机学报,
2004,
(01)
: 85
-
91
[9]
Prepositional phrase attachment without oracles
Atterer, Michaela
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Atterer, Michaela
Schuetze, Hinrich
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Schuetze, Hinrich
[J].
COMPUTATIONAL LINGUISTICS,
2007,
33
(04)
: 469
-
476
[10]
The annals of humanities computing: The index Thomisticus[J] . R. Busa.Computers and the Humanities . 1980 (2)
←
1
2
→
共 11 条
[1]
基于XML的《论语》与其注疏文献对齐语料库的知识表示
论文数:
引用数:
h-index:
机构:
马创新
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
陈小荷
[J].
图书情报知识,
2013,
(01)
: 107
-
113
[2]
基于知网的贝叶斯中文人名识别
论文数:
引用数:
h-index:
机构:
蒋才智
王浩
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
王浩
姚宏亮
论文数:
0
引用数:
0
h-index:
0
机构:
合肥工业大学计算机与信息学院
姚宏亮
[J].
南京大学学报(自然科学版),
2012,
48
(02)
: 147
-
153
[3]
一种利用注疏的《左传》分词新方法
论文数:
引用数:
h-index:
机构:
徐润华
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学语言信息科技研究中心
陈小荷
[J].
中文信息学报,
2012,
(02)
: 13
-
17+45
[4]
利用CRF实现中文人名性别的自动识别
论文数:
引用数:
h-index:
机构:
赵晓凡
论文数:
引用数:
h-index:
机构:
赵丹
刘永革
论文数:
0
引用数:
0
h-index:
0
机构:
安阳师范学院计算机与信息工程学院
安阳师范学院计算机与信息工程学院
刘永革
[J].
微电子学与计算机,
2011,
28
(10)
: 122
-
124+128
[5]
基于层次聚类算法的中文人名消歧
章顺瑞
论文数:
0
引用数:
0
h-index:
0
机构:
中国国防科技信息中心
章顺瑞
游宏梁
论文数:
0
引用数:
0
h-index:
0
机构:
中国国防科技信息中心
游宏梁
[J].
现代图书情报技术,
2010,
(11)
: 64
-
68
[6]
基于CRF的先秦汉语分词标注一体化研究
论文数:
引用数:
h-index:
机构:
石民
论文数:
引用数:
h-index:
机构:
李斌
陈小荷
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
陈小荷
[J].
中文信息学报,
2010,
24
(02)
: 39
-
45
[7]
基于混合模型的中国人名自动识别
毛婷婷
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机科学与工程系
毛婷婷
论文数:
引用数:
h-index:
机构:
李丽双
论文数:
引用数:
h-index:
机构:
黄德根
[J].
中文信息学报,
2007,
(02)
: 22
-
28
[8]
基于角色标注的中国人名自动识别研究
张华平
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
张华平
论文数:
引用数:
h-index:
机构:
刘群
[J].
计算机学报,
2004,
(01)
: 85
-
91
[9]
Prepositional phrase attachment without oracles
Atterer, Michaela
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Atterer, Michaela
Schuetze, Hinrich
论文数:
0
引用数:
0
h-index:
0
机构:
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Univ Stuttgart, Inst Nat Language Proc, D-70714 Stuttgart, Germany
Schuetze, Hinrich
[J].
COMPUTATIONAL LINGUISTICS,
2007,
33
(04)
: 469
-
476
[10]
The annals of humanities computing: The index Thomisticus[J] . R. Busa.Computers and the Humanities . 1980 (2)
←
1
2
→