基于关键词重要性和近邻传播聚类的主题分析研究

被引:34
作者
李海林 [1 ,2 ]
万校基 [1 ]
林春培 [1 ]
机构
[1] 华侨大学工商管理学院
[2] 华侨大学现代应用统计与大数据研究中心
关键词
主题分析; 关键词重要性; 近邻传播聚类; 核心主题;
D O I
暂无
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
120502 [情报学];
摘要
鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺序提供论文关键词,计算关键词在每个文献中的重要程度,构建主要关键词之间的相似性矩阵,结合能够反馈最优簇成员代表性结果的近邻传播聚类实现核心主题的提取与分析。本研究对图书情报类某刊物2012-2016年期间的文献关键词进行数据挖掘,使用新方法实现了基于重要性度量的主要关键词聚类,分析和研究了主要关键词和核心主题的演化趋势。提出的方法不仅能够考虑关键词重要性和自动识别核心主题,还可以为文献主题分析提供新的数据挖掘方法,也能有效提高期刊和学科等相关领域的主题识别效果。
引用
收藏
页码:533 / 542
页数:10
相关论文
共 15 条
[1]
学科知识结构主题演化模式研究——以图书情报学领域“计量学”主题为例 [J].
郑晓月 ;
牟冬梅 ;
琚沅红 ;
李茵 ;
黄丽丽 .
图书情报工作, 2017, 61 (12) :32-41
[2]
基于知识图谱的PPP研究热点主题分析 [J].
王沙沙 ;
丰景春 ;
薛松 ;
张可 .
科技管理研究, 2017, 37 (17) :167-173
[3]
学术文本的结构功能识别——在关键词自动抽取中的应用 [J].
方龙 ;
李信 ;
黄永 ;
陆伟 .
情报学报, 2017, 36 (06) :599-605
[4]
自动关键词抽取研究综述 [J].
赵京胜 ;
朱巧明 ;
周国栋 ;
张丽 .
软件学报, 2017, 28 (09) :2431-2449
[5]
国际文本挖掘研究主题群识别与演化趋势分析 [J].
张敏 ;
罗梅芬 ;
张艳 .
图书馆学研究, 2017, (02) :15-21
[6]
多维度视角下学科主题演化可视化分析方法研究——以我国图书情报领域大数据研究为例 [J].
刘自强 ;
王效岳 ;
白如江 .
中国图书馆学报, 2016, 42 (06) :67-84
[7]
近十年国内知识图谱研究脉络及主题分析 [J].
李明鑫 ;
王松 .
图书情报知识 , 2016, (04) :93-101
[8]
共现分析中的关键词选择与语义度量方法研究 [J].
巴志超 ;
李纲 ;
朱世伟 .
情报学报, 2016, 35 (02) :197-207
[9]
基于共词分析法的学科主题演化研究进展与分析 [J].
唐果媛 ;
张薇 .
图书情报工作, 2015, 59 (05) :128-136
[10]
自然语言语义分析研究进展 [J].
秦春秀 ;
祝婷 ;
赵捧未 ;
张毅 .
图书情报工作, 2014, 58 (22) :130-137