面向先秦典籍的知识本体构建技术研究

被引:40
作者
何琳
陈雅玲
孙珂迪
机构
[1] 南京农业大学信息管理系
关键词
先秦典籍; 左传; 本体构建; 条件随机场; 规则匹配;
D O I
暂无
中图分类号
G254 [文献标引与编目];
学科分类号
050302 [传播学];
摘要
[目的/意义]构建面向典籍文本的语义本体,能够促进典籍文本的挖掘与分析。然而由于典籍文本与现代文本在语法上存在较大差异,给面向典籍的语义本体构建带来了困难。[方法/过程]本文运用自然语言处理技术探讨针对先秦典籍的本体构建方法。以国际上文化遗产领域通用的CIDOC CRM为框架,设计先秦典籍本体模型。针对典籍文本内容的特点及句法特征,将规则抽取与条件随机场方法相结合,提出一套本体实例自动获取技术,并以《左传》为实验语料进行测试。[结果/结论]实验表明,本文所提出的本体实例抽取技术能够较好地提高面向典籍文本的本体构建效率。基于规则的本体实例抽取实验F值在93%左右,基于条件随机场的本体实例抽取最佳特征模板的F值为82.51%。在本体实例获取中,词性信息和位置信息具有重要作用。
引用
收藏
页码:13 / 19
页数:7
相关论文
共 16 条
[1]
非物质文化遗产信息资源组织与检索研究路径——基于本体方法的考察与设计 [J].
周耀林 ;
赵跃 ;
孙晶琼 .
情报杂志, 2017, (08) :166-174
[2]
从文本中构建领域本体技术综述 [J].
任飞亮 ;
沈继坤 ;
孙宾宾 ;
朱靖波 .
计算机学报, 2019, 42 (03) :654-676
[3]
关联数据在家谱数字人文服务中的应用 [J].
夏翠娟 ;
张磊 .
图书馆杂志, 2016, (10) :26-34
[4]
面向数字人文研究的大规模古籍文本可视化分析与挖掘 [J].
欧阳剑 .
中国图书馆学报, 2016, 42 (02) :66-80
[5]
ISO技术规范“中医药学语言系统语义网络框架”的应用研究 [J].
于彤 ;
崔蒙 ;
李海燕 ;
刘静 ;
杨硕 ;
贾李蓉 .
中国医药导报, 2016, 13 (04) :89-92
[6]
国史知识的语义揭示与组织方法研究 [J].
王颖 ;
张智雄 ;
孙辉 ;
雷枫 .
中国图书馆学报, 2015, 41 (04) :55-64
[7]
基于语义系统的中华史籍分析研究 [J].
董慧 ;
徐雷 ;
王菲 ;
俞思伟 .
图书馆理论与实践, 2015, (04) :1-5+46
[8]
条件随机场图模型在《明史》词性标注研究中的应用效果探索 [J].
朱晓 ;
金力 .
复旦学报(自然科学版), 2014, 53 (03) :297-304
[9]
基于BootStrapping的集成分类器的中文观点句识别方法 [J].
吕云云 ;
李旸 ;
王素格 .
中文信息学报, 2013, (05) :84-92
[10]
先秦词汇的时代特征自动获取及文献时代的自动判定 [J].
刘浏 ;
李斌 ;
曲维光 ;
陈小荷 .
中文信息学报, 2013, 27 (05) :107-113