基于LDA挖掘计算机科学文献的研究主题

被引:17
作者
杨海霞
高宝俊
孙含林
机构
[1] 不详
[2] 武汉大学经济与管理学院
[3] 不详
关键词
计算机科学; LDA; 主题提取; 主题强度; 文档聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
【目的】运用文本挖掘技术自动从海量科技文献中提取研究主题并探测其研究趋势。【方法】以《中文核心期刊要目总览(2014年版))—"TP自动化技术、计算机技术"栏目前10种期刊刊载的计算机科学类(Computer Science)文献为研究对象,借助LDA主题模型,考虑科技文献的发表时间信息,挖掘出典型话题,并根据主题强度分析主题的演化趋势。【结果】18个研究话题中有7个主题强度上升的主题和6个主题强度下降的主题。【局限】仅分析了国内计算机领域的前10种期刊,期刊范围不够大,也未考虑国外计算机领域的期刊文献。【结论】该方法能够深入挖掘计算机领域期刊文献的话题,帮助从事该领域研究的学者了解主题的演化趋势并寻找新兴研究主题。
引用
收藏
页码:20 / 26
页数:7
相关论文
共 17 条
[1]   采用LDA主题模型的国内知识流研究结构探讨:以学科分类主题抽取为视角 [J].
王曰芬 ;
傅柱 ;
陈必坤 .
现代图书情报技术 , 2016, (04) :8-19
[2]   不同语料下基于LDA主题模型的科学文献主题抽取效果分析 [J].
关鹏 ;
王曰芬 ;
傅柱 .
图书情报工作, 2016, 60 (02) :112-121
[3]   一种融合外部特征的改进主题模型 [J].
杨如意 ;
刘东苏 ;
李慧 .
现代图书情报技术, 2016, (01) :48-54
[4]   基于LDA主题关联过滤的领域主题演化研究 [J].
秦晓慧 ;
乐小虬 .
现代图书情报技术 , 2015, (03) :18-25
[6]   基于LDA模型的科技期刊主题演化研究 [J].
李湘东 ;
张娇 ;
袁满 .
情报杂志 , 2014, (07) :115-121
[7]   LDA模型下书目信息分类系统的研究与实现 [J].
李湘东 ;
廖香鹏 ;
黄莉 .
现代图书情报技术, 2014, (05) :18-25
[8]   基于引文—主题概率模型的科技文献主题识别方法研究 [J].
叶春蕾 ;
冷伏海 .
情报理论与实践, 2013, 36 (09) :100-103
[9]   科技文献话题演化研究 [J].
贺亮 ;
李芳 .
现代图书情报技术, 2012, (04) :61-67
[10]   并行计算的一体化研究现状与发展趋势 [J].
陈国良 ;
孙广中 ;
徐云 ;
龙柏 .
科学通报 , 2009, (08) :1043-1049