共 12 条
基于先秦语料库的古汉语地名自动识别模型构建研究
被引:41
作者:

黄水清
论文数: 0 引用数: 0
h-index: 0
机构: 南京农业大学信息科学技术学院

王东波
论文数: 0 引用数: 0
h-index: 0
机构: 南京农业大学信息科学技术学院

论文数: 引用数:
h-index:
机构:
机构:
[1] 南京农业大学信息科学技术学院
来源:
关键词:
古汉语地名;
条件随机场;
词汇特征;
先秦语料库;
D O I:
10.13266/j.issn.0252-3116.2015.12.020
中图分类号:
G254 [文献标引与编目];
学科分类号:
摘要:
[目的/意义]在数字人文研究这一大趋势下,基于先秦古汉语语料库和条件随机场模型,构建古汉语地名自动识别模型。[方法/过程]对《春秋左氏传》中的地名的内部和外部特征进行统计分析,构建模型的特征模板。在规模为187 901个词汇的训练和测试语料上,对比条件随机场模型和最大熵模型的地名识别效果,把调和平均数为90.94%的条件随机场训练模型确定为最佳,作为本文所要构建的模型,并在《国语》语料上进行验证。[结果/结论]在古汉语地名自动识别中,条件随机场模型优于最大熵模型,基于人工标注过的语料构建条件随机场自动识别模型能取得较好的识别效果。
引用
收藏
页码:135 / 140
页数:6
相关论文
共 12 条
- [1] 基于CRF和规则相结合的地理命名实体识别方法[J]. 计算机应用与软件, 2015, 32 (01) : 179 - 185+202论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [2] 双层CRF与规则相结合的中文地名识别方法研究[J]. 计算机应用与软件, 2014, 31 (11) : 175 - 177+182孙虹论文数: 0 引用数: 0 h-index: 0机构: 太原理工大学科学与技术学院陈俊杰论文数: 0 引用数: 0 h-index: 0机构: 太原理工大学科学与技术学院
- [3] 句类分析准则在作战文书地名识别中的应用[J]. 计算机工程与设计, 2013, 34 (08) : 2903 - 2907李颖论文数: 0 引用数: 0 h-index: 0机构: 装甲兵工程学院科研部 装甲兵工程学院科研部王青海论文数: 0 引用数: 0 h-index: 0机构: 装甲兵工程学院科研部 装甲兵工程学院科研部池毓焕论文数: 0 引用数: 0 h-index: 0机构: 中国科学院声学研究所 装甲兵工程学院科研部
- [4] 方志类古籍地名识别及分析研究——以《方志物产》(广东分卷)为例[J]. 图书馆论坛, 2012, 32 (04) : 171 - 176论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [5] CRF与规则相结合的中文地名识别[J]. 大连理工大学学报, 2012, 52 (02) : 285 - 289李丽双论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学管理科学与工程学院 大连理工大学计算机科学与技术学院 大连理工大学管理科学与工程学院党延忠论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学管理科学与工程学院 大连理工大学管理科学与工程学院论文数: 引用数: h-index:机构:黄德根论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机科学与技术学院 大连理工大学管理科学与工程学院张颖论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机科学与技术学院 大连理工大学管理科学与工程学院
- [6] 基于统计的中文地名自动识别研究[J]. 计算机技术与发展, 2011, 21 (11) : 35 - 38论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [7] 方志类古籍地名识别及系统构建[J]. 中国图书馆学报, 2011, 37 (03) : 118 - 124朱锁玲论文数: 0 引用数: 0 h-index: 0机构: 南京农业大学人文社会科学学院 南京农业大学人文社会科学学院论文数: 引用数: h-index:机构:
- [8] 基于篇章的中文地名识别研究[J]. 中文信息学报, 2010, (02) : 24 - 32论文数: 引用数: h-index:机构:陈小荷论文数: 0 引用数: 0 h-index: 0机构: 南京师范大学文学院论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [9] 中文基本地名识别[J]. 语言文字应用, 2009, (03) : 129 - 135论文数: 引用数: h-index:机构:侯敏论文数: 0 引用数: 0 h-index: 0机构: 中国传媒大学
- [10] 基于统计的中文地名识别[J]. 中文信息学报, 2003, (02) : 36 - 41论文数: 引用数: h-index:机构:岳广玲论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机科学与工程系杨元生论文数: 0 引用数: 0 h-index: 0机构: 大连理工大学计算机科学与工程系