基于主题过滤与主题关联的学科主题演化分析

被引:23
作者
曲佳彬 [1 ,2 ]
欧石燕 [1 ]
机构
[1] 不详
[2] 南京大学信息管理学院
[3] 不详
[4] 烟台大学图书馆
[5] 不详
关键词
学科主题演化; 主题过滤; LDA主题模型; 演化分析;
D O I
暂无
中图分类号
G254 [文献标引与编目];
学科分类号
摘要
【目的】针对采用LDA模型识别出的主题中往往含有一些无意义的主题,严重影响演化分析的精确性问题,本文提出采用主题过滤和主题关联的方式,构建学科主题在时间序列上的演化路径,并分析主题在内容上的演化情况。【方法】计算主题在所有文献中出现的概率,识别并过滤边缘主题;根据主题中词汇分布的倾向性,识别并过滤无意义的噪音主题。将过滤后的主题作为主题演化分析的主题,通过计算相邻时间段中主题间的JS散度识别相关主题,从而根据主题间的相关关系构建主题演化路径。【结果】以"机器学习"领域的文献为例,构建学科主题演化路径,展示主题间的新生、消亡、继承、分裂和合并5种演化方式,并以微观的"图像识别"为例,验证了方法的有效性。【局限】在构建主题演化路径时,采用人工判断方法设置阈值,具有一定的主观性。【结论】本文方法避免了不重要的边缘主题和无意义的噪音主题对相邻时间段中相关主题识别造成的干扰,提高了所构建的主题演化路径的准确性,能够更为准确地展示学科主题的演化规律。
引用
收藏
页码:64 / 75
页数:12
相关论文
共 18 条
[1]   基于LDA挖掘计算机科学文献的研究主题 [J].
杨海霞 ;
高宝俊 ;
孙含林 .
现代图书情报技术 , 2016, (11) :20-26
[2]   科技情报分析中LDA主题模型最优主题数确定方法研究 [J].
关鹏 ;
王曰芬 .
现代图书情报技术 , 2016, (09) :42-50
[3]   基于DTM的国内外情报学研究主题热度演化对比研究 [J].
齐亚双 ;
祝娜 ;
翟羽佳 .
图书情报工作, 2016, (16) :99-109
[4]   基于主题关联的知识演化路径识别研究——以3D打印领域为例 [J].
祝娜 ;
王芳 .
图书情报工作, 2016, (05) :101-109
[6]   基于LDA主题关联过滤的领域主题演化研究 [J].
秦晓慧 ;
乐小虬 .
现代图书情报技术 , 2015, (03) :18-25
[7]   基于共词分析法的学科主题演化研究进展与分析 [J].
唐果媛 ;
张薇 .
图书情报工作, 2015, 59 (05) :128-136
[8]   基于LDA模型的科技期刊主题演化研究 [J].
李湘东 ;
张娇 ;
袁满 .
情报杂志 , 2014, (07) :115-121
[9]  
一种话题演化建模与分析方法[J]. 胡艳丽,白亮,张维明.自动化学报. 2012(10)
[10]   基于LDA模型的研究领域热点及趋势分析 [J].
杨星 ;
李保利 ;
金明举 .
计算机技术与发展, 2012, 22 (10) :66-69+74