专利技术主题分析:基于SAO结构的LDA主题模型方法

被引:38
作者
杨超 [1 ]
朱东华 [1 ]
汪雪锋 [1 ]
朱福进 [1 ,2 ]
衡晓帆 [1 ]
机构
[1] 北京理工大学管理与经济学院
[2] 悉尼科技大学量子计算与智能系统研究中心
关键词
SAO结构; 技术主题分析; LDA模型; P&S模式; 石墨烯;
D O I
10.13266/j.issn.0252-3116.2017.03.012
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的"问题"与相应"解决方案"等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别"问题和解决方案"(P&S)模式,基于"bagofP&S"假设,构建基于"主语-行为-宾语"(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。
引用
收藏
页码:86 / 96
页数:11
相关论文
共 37 条
[1]   基于专利引用网络度分布研究技术跨领域应用 [J].
吴菲菲 ;
张辉 ;
黄鲁成 ;
乔铮 .
科学学研究, 2015, 33 (10) :1456-1463
[2]   个性化语义TRIZ构建研究 [J].
胡正银 ;
方曙 ;
张娴 ;
文奕 ;
梁田 .
图书情报工作, 2015, 59 (07) :123-131
[3]   基于LDA主题模型的专利内容分析方法 [J].
王博 ;
刘盛博 ;
丁堃 ;
刘则渊 .
科研管理, 2015, 36 (03) :111-117
[4]   面向TRIZ的专利自动分类研究 [J].
胡正银 ;
方曙 ;
文奕 ;
张娴 ;
梁田 .
现代图书情报技术, 2015, (01) :66-74
[5]   利用LDA的领域新兴主题探测技术综述 [J].
范云满 ;
马建霞 .
现代图书情报技术, 2012, (12) :58-65
[6]  
基于概率主题模型的文献知识挖掘[J]. 王萍.情报学报. 2011 (06)
[7]  
Topic analysis and forecasting for science, technology and innovation: Methodology with a case study focusing on big data research[J] . Yi Zhang,Guangquan Zhang,Hongshu Chen,Alan L. Porter,Donghua Zhu,Jie Lu.Technological Forecasting & Social Change . 2016
[8]   Coherence analysis of research and education using topic modeling [J].
Lee, Hoyeop ;
Kwak, Jueun ;
Song, Min ;
Kim, Chang Ouk .
SCIENTOMETRICS, 2015, 102 (02) :1119-1137
[9]  
Mapping the intellectual structure of scientometrics: a co-word analysis of the journal Scientometrics (2005–2010)[J] . S. Ravikumar,Ashutosh Agrahari,S. N. Singh.Scientometrics . 2015 (1)
[10]  
How to combine term clumping and technology roadmapping for newly emerging science & technology competitive intelligence: “problem & solution” pattern based semantic TRIZ tool and case study[J] . Yi Zhang,Xiao Zhou,Alan L. Porter,Jose M. Vicente Gomila.Scientometrics . 2014 (2)