基于LDA主题模型的科学文献主题识别:全局和学科两个视角的对比分析

被引:19
作者
王曰芬
傅柱
陈必坤
机构
[1] 不详
[2] 南京理工大学经济管理学院
[3] 不详
关键词
LDA模型; 科学文献; 主题识别; 知识流;
D O I
10.16353/j.cnki.1000-7490.2016.07.022
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
摘要
[目的]利用LDA主题模型来探究全局主题和学科主题之间存在的差异。[方法]基于LDA主题模型,以国内知识流研究领域为例,在主题抽取的基础上,比较与分析全局主题和学科主题所存在的差异。[结果]全局主题和学科主题在可描述性、内容相关性、内容质量、学科分布4个方面具有显著的差异。[局限]采用经验判断选取了用于实验分析的全局热点主题和学科热点主题。
引用
收藏
页码:121 / 126+101 +101
页数:7
相关论文
共 5 条
[1]   基于LDA主题模型和生命周期理论的科学文献主题挖掘 [J].
关鹏 ;
王曰芬 .
情报学报, 2015, (03) :286-299
[2]   基于共词分析的学科主题演化方法改进研究 [J].
叶春蕾 ;
冷伏海 .
情报理论与实践, 2012, (03) :79-82
[3]   基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627
[4]   共现分析在文本知识挖掘中的应用研究 [J].
王曰芬 ;
宋爽 ;
卢宁 ;
朱烨 .
中国图书馆学报, 2007, (02) :59-64
[5]   A co-word analysis of library and information science in China [J].
Hu, Chang-Ping ;
Hu, Ji-Ming ;
Deng, Sheng-Li ;
Liu, Yong .
SCIENTOMETRICS, 2013, 97 (02) :369-382