基于BERT-LDA的关键技术识别方法及其实证研究——以农业机器人为例

被引:55
作者
王秀红 [1 ,2 ]
高敏 [1 ]
机构
[1] 江苏大学科技信息研究所
[2] 江苏大学图书馆
基金
国家重点研发计划;
关键词
关键技术识别; 农业机器人; BERT-LDA模型; 德温特专利;
D O I
10.13266/j.issn.0252-3116.2021.22.012
中图分类号
S22 [农业机械及农具]; G353.1 [情报资料的分析和研究];
学科分类号
摘要
[目的/意义]好的关键技术识别方法能够更好地为各层各级的关键技术识别、预测和研发提供支撑。[方法/过程]提出基于BERT-LDA模型的关键技术识别方法,通过将BERT与LDA相结合,以弥补单一使用LDA主题模型缺乏上下文语义信息的缺陷,并以农业机器人为例进行实证研究。具体包括以下过程:(1)基于python构建BERT语义特征向量和LDA主题特征向量,将其在高维空间进行向量拼接,利用自编码器学习连接向量的低维潜在空间表示;(2)在潜在空间表示上使用K-means算法实现语义关联聚类,得到二维聚类效果图及关键技术主题词云图;(3)进行关键技术判定;(4)在农业机器人技术领域,与基于德温特TI专利软件的专利分析结果和《中国制造2025》重点领域技术路线图中农业装备关键共性技术清单对比,实证本方法的有效性。[结果/结论]研究表明:BERT-LDA模型提高了主题聚类的连贯性及细粒度划分的精准度;具有很好的关键技术识别精准率和召回率;对识别的不同数据库和出版类型的文献数据集具有较好的包容性与兼容性,适应性强;可广泛应用于各类关键技术的识别。
引用
收藏
页码:114 / 125
页数:12
相关论文
共 24 条