中文专利术语层次关系解析研究

被引:10
作者
吴志祥 [1 ,2 ]
王昊 [1 ,2 ]
王密平 [1 ,2 ]
机构
[1] 南京大学信息管理学院
[2] 南京大学江苏省数据工程与知识服务重点实验室
关键词
中文专利术语; 位置加权; PCA降维; 类目标签抽取; 术语层次关系; 本体学习;
D O I
暂无
中图分类号
G254 [文献标引与编目]; TP391.1 [文字信息处理];
学科分类号
050302 [传播学]; 120506 [数字人文];
摘要
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体。着重研究了基于位置加权的术语语义空间构建方法,基于主成分分析降维技术进行术语分布可视化以辅助聚类类目的确定方法以及术语层次关系结构中非重复性类目标签的抽取方法。本文工作尽可能实现了较大规模中文专利术语层次关系解析的自动化进行,为术语非层次关系解析以及基于术语语义关系解析的深入应用打下基础。
引用
收藏
页码:401 / 410
页数:10
相关论文
共 21 条
[1]
我国图书情报学科知识结构的建立及其演化分析 [J].
王昊 ;
邓三鸿 ;
苏新宁 .
情报学报, 2015, 34 (02) :115-128
[2]
本体概念间上下位关系抽取研究 [J].
汤青 ;
吕学强 ;
李卓 .
微电子学与计算机, 2014, 31 (06) :68-71
[3]
中文专利本体半自动构建系统设计 [J].
谷俊 .
图书情报工作, 2013, 57 (03) :105-111+146
[4]
基于有效专利的我国专利现状分析及对策 [J].
吴红 ;
常飞 .
图书情报工作, 2012, (04) :85-89+51
[5]
基于聚类算法的本体层次关系获取研究 [J].
谷俊 ;
朱紫阳 .
现代图书情报技术, 2011, (12) :46-51
[6]
面向领域中文文本信息处理的术语语义层次获取研究 [J].
季培培 ;
鄢小燕 ;
岑咏华 ;
王凌燕 .
现代图书情报技术, 2010, (09) :37-41
[7]
基于领域本体的专利信息检索系统研究与实现 [J].
吴红 ;
李玉平 ;
胡泽文 .
现代图书情报技术, 2010, (06) :71-77
[8]
专利领域本体的构建方法研究 [J].
支丽平 ;
王恒山 ;
张楠 .
图书情报工作, 2010, (08) :116-119
[9]
基于本体的专利摘要知识抽取 [J].
姜彩红 ;
乔晓东 ;
朱礼军 .
现代图书情报技术, 2009, (02) :23-28
[10]
基于MAS和本体技术的专利分析系统设计 [J].
翟东升 ;
黄焱 ;
王明吉 .
情报杂志, 2006, (06) :17-19