基于引文—主题概率模型的科技文献主题识别方法研究

被引:16
作者
叶春蕾 [1 ,2 ]
冷伏海 [2 ]
机构
[1] 北京城市学院信息学部
[2] 中国科学院国家科学图书馆
关键词
科技文献; 主题识别; 引文—主题模型; 方法研究;
D O I
10.16353/j.cnki.1000-7490.2013.09.017
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
海量的科技文献中蕴含着大量揭示学科内容的主题信息。文章提出了一种新的概率模型:引文—主题概率模型,该模型对文献中的关键词和引文进行联合建模以完成科技文献中的主题内容识别,在获得主题中关键词分布的同时也获得相关主题间的引文分布。实验表明,基于引文—主题模型识别的主题信息能为进一步的主题演化分析提供一定的分析基础。
引用
收藏
页码:100 / 103
页数:4
相关论文
共 5 条
  • [1] 自然语言处理技术基础.[M].王小捷;常宝宝编著;.北京邮电大学出版社.2002,
  • [2] 科技文献全文主题识别方法实证研究
    叶春蕾
    冷伏海
    [J]. 现代图书情报技术, 2012, (01) : 53 - 57
  • [3] 基于LDA模型的主题词抽取方法
    石晶
    李万龙
    [J]. 计算机工程, 2010, 36 (19) : 81 - 83
  • [4] 基于概率图模型的科研文献主题演化研究.[J].王金龙;徐从富;耿雪玉;.情报学报.2009, 03
  • [5] 基于概率主题模型的文献知识挖掘.[J].王萍;.情报学报.2011, 06