古诗词图谱的构建及分析研究

被引:33
作者
刘昱彤
吴斌
白婷
机构
[1] 北京市智能通信软件与多媒体重点实验室(北京邮电大学)
[2] 北京邮电大学计算机学院
基金
国家重点研发计划;
关键词
数字人文; 古诗词; 知识图谱; 数据分析; 推理分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; I207.2 [诗歌、韵文];
学科分类号
050101 [文艺学]; 120506 [数字人文];
摘要
古诗词是中国宝贵的文化遗产.利用计算机对诗词进行辅助研究,对语言、文学、传承普及中华文化,具有重要意义.然而,关于诗词的知识是高度碎片化的,原因是互联网上的诗词知识,不仅存在于诗词本身,还分布于诗词的各种解读资料,比如诗词的注释、译文、赏析等.若以知识图谱的方式,捕捉古诗词中词语之间潜在的语义联系并将它们以知识的方式关联起来,能够将诗词碎片化的知识有条理地整合在一起,从而更好地对古诗词知识进行推理和分析.基于此,提出了一种古诗词知识图谱的构建方法.构建图谱的节点时,首先利用改进的Apriori算法产生诗词中的候选词,然后检验候选词是否出现在诗词注释和中文词典中,从而判断其是否构成图谱节点.构建图谱的边时,首先利用注释信息在词语之间建立语义联系,然后用人工构建的诗词分类体系在抽象的语义之间建立联系.最终得到一个内容覆盖全面且包含多层词语语义联系的古诗词图谱.古诗词图谱可用于对诗词各种不同维度的分析研究,相比于基于字的数据分析,利用古诗词图谱能够从语义的角度更加深入具体地辅助文学研究.以唐诗为例,说明了古诗词图谱在诗词分析中的必要性.此外,古诗词图谱还适用于各种关于诗词的推理和分析任务,以判定诗词题材和分析诗词情感这2个任务为例,证明了古诗词图谱的有效性和应用价值.
引用
收藏
页码:1252 / 1268
页数:17
相关论文
共 10 条
[1]
唐诗知识图谱的构建及其智能知识服务设计 [J].
周莉娜 ;
洪亮 ;
高子阳 .
图书情报工作, 2019, 63 (02) :24-33
[2]
基于古汉语语料的新词发现方法 [J].
刘昱彤 ;
吴斌 ;
谢韬 ;
王柏 .
中文信息学报, 2019, 33 (01) :46-55
[3]
知识图谱构建技术综述 [J].
刘峤 ;
李杨 ;
段宏 ;
刘瑶 ;
秦志光 .
计算机研究与发展, 2016, 53 (03) :582-600
[4]
唐诗题材自动分类研究 [J].
胡韧奋 ;
诸雨辰 .
北京大学学报(自然科学版), 2015, 51 (02) :262-268
[5]
基于弱监督学习的海量网络数据关系抽取 [J].
陈立玮 ;
冯岩松 ;
赵东岩 .
计算机研究与发展, 2013, 50 (09) :1825-1835
[6]
领域本体概念实例、属性和属性值的抽取及关系预测 [J].
郭剑毅 ;
李真 ;
余正涛 ;
张志坤 .
南京大学学报(自然科学版), 2012, 48 (04) :383-389
[7]
基于扩展领域模型的有名属性抽取 [J].
王宇 ;
谭松波 ;
廖祥文 ;
曾依灵 .
计算机研究与发展, 2010, 47 (09) :1567-1573
[8]
唐宋诗中词汇语义相似度的统计分析及应用 [J].
胡俊峰 ;
俞士汶 .
中文信息学报, 2002, (04) :39-44
[9]
A Similarity Measure for Indefinite Rankings [J].
Webber, William ;
Moffat, Alistair ;
Zobel, Justin .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2010, 28 (04)
[10]
中国文学叙事传统论稿.[M].董乃斌.东方出版中心.2017,