作者标签主题模型在科技文献中的应用

被引:7
作者
陈永恒 [1 ]
左万利 [2 ]
林耀进 [1 ]
机构
[1] 闽南师范大学计算机学院
[2] 吉林大学计算机科学与技术学院
关键词
文字信息处理; 隐藏狄利克雷分配; 文本分析; 主题模型; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
作者主题模型被广泛应用于科技文献中作者的兴趣发现。针对作者主题模型不能利用文献的类别标签属性与主题之间的相关性进行主题发现的问题,在对作者主题模型分析的基础上,将科技文献之间固有的类别标签信息引入到作者主题模型中,提出了作者标签主题(LAT)模型。LAT模型通过实现文献的标签信息与主题之间的映射关系,实现文本的多标签判定,提升文档的聚类效果。与传统的潜在狄利克雷分配(LDA)和作者主题(AT)模型的对比实验结果表明,LAT模型能够显著提高模型的泛化能力,提升模型的运行性能。
引用
收藏
页码:1001 / 1005
页数:5
相关论文
共 10 条
[1]
基于统计主题模型的学术网络对象建模与应用 [D]. 
王建文 .
华中师范大学,
2013
[2]
科技文献中作者研究兴趣动态发现 [J].
史庆伟 ;
李艳妮 ;
郭朋亮 .
计算机应用, 2013, 33 (11) :3080-3083
[3]
基于LDA话题演化研究方法综述 [J].
单斌 ;
李芳 .
中文信息学报, 2010, 24 (06) :43-49+68
[4]
基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627
[5]
领域术语自动抽取及其在文本分类中的应用 [J].
刘桃 ;
刘秉权 ;
徐志明 ;
王晓龙 .
电子学报, 2007, (02) :328-332
[6]
专利技术术语的抽取方法.[J].韩红旗;朱东华;汪雪锋;.情报学报.2011, 12
[7]
Latent topic model for audio retrieval.[J].Pengfei Hu;Wenju Liu;Wei Jiang;Zhanlei Yang.Pattern Recognition.2013,
[8]
LDA-based online topic detection using tensor factorization [J].
Guo, Xin ;
Xiang, Yang ;
Chen, Qian ;
Huang, Zhenhua ;
Hao, Yongtao .
JOURNAL OF INFORMATION SCIENCE, 2013, 39 (04) :459-469
[9]
Probabilistic Topic Models [J].
Blei, David M. .
COMMUNICATIONS OF THE ACM, 2012, 55 (04) :77-84
[10]
Learning Author-Topic Models from Text Corpora [J].
Rosen-Zvi, Michal ;
Chemudugunta, Chaitanya ;
Griffiths, Thomas ;
Smyth, Padhraic ;
Steyvers, Mark .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2010, 28 (01)