共 19 条
一种基于Subject-Action-Object三元组的知识基因提取方法
被引:15
作者:
许琦
[1
,2
]
顾新建
[1
]
机构:
[1] 浙江大学机械工程学系工业工程中心
[2] 台州职业技术学院机电一体化技术实验室
来源:
关键词:
知识基因;
subject-action-object三元组;
专利引证网络;
知识进化;
语义相似度;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
以专利引证网络为载体,从知识基因稳定性、遗传性以及变异性等基本特征出发,提出一种基于subject-action-object三元组的知识基因提取方法.应用连接度算法分析专利引证关系,挖掘引证专利和被引专利之间继承和发展的知识流,建立知识进化轨迹;利用文本语法分析技术,从专利权利要求书中提取subject-action-object三元组;基于语义词库WordNet进行语义加工,计算语义相似度,合并同义的subject-action-object三元组,绘制知识基因图谱.从美国专利数据库中采集了5 073项1975—1999年授权的数据挖掘领域的相关专利,分析了专利的地区分布情况和年度分布情况.从NBER(National Bureau of Economic Research)的专利数据集中查询得到专利引证关系,利用网络分析软件Pajek构建专利引证网络,作为实验数据样本,对所提出的知识基因提取方法进行验证.实验结果表明:所提取的subject-action-object三元组具备了知识基因稳定性、遗传性和变异性等特征,可以作为知识基因的一种表现形式.
引用
收藏
页码:385 / 399
页数:15
相关论文