基于引文内容分析的高被引论文主题识别研究

被引:99
作者
祝清松
冷伏海
机构
[1] 中国科学院国家科学图书馆
关键词
引文内容分析; 主题识别; 高被引论文; 引用动机;
D O I
10.13530/j.cnki.jlis.2014.01.009
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
摘要
基于被引次数的引文分析无法直接揭示论文的研究内容,利用关键词或从标题、摘要和全文中抽取的主题词很难客观反映论文的被引原因。本文以碳纳米管纤维研究领域的高被引论文为研究对象进行引文内容抽取和主题识别,经人工判读验证:基于引文内容分析的高被引论文识别的核心主题能够较好地揭示高被引论文的被引原因(引用动机),而且与论文的研究内容相符合;与基于全文、基于标题和摘要的主题识别相比,在引文内容分析基础上识别的主题具有更好的主题代表性,能够有效揭示被引文献的研究内容,是对原文相关信息的重要补充。本文的实验表明基于引文内容分析的高被引论文主题识别是可行而且有效的。
引用
收藏
页码:39 / 49
页数:11
相关论文
共 13 条
  • [1] 基于引文分布和引文网络的学术期刊评价指标研究
    许海云
    方曙
    [J]. 情报科学, 2013, (02) : 130 - 134+139
  • [2] 基于PrestigeRank算法与同行评议的科技论文评价研究[J]. 苏成,潘云涛,马峥,袁军鹏,俞征鹿,郭红.情报学报. 2012 (02)
  • [3] 应用引文共引聚类—内容词分析法对学科发展的研究[J]. 侯跃芳,崔雷,吴迪.情报学报. 2007 (02)
  • [4] 基于C-value与TF-IDF的文献簇主题识别研究[J]. 陈仕吉,王小梅.情报学报. 2009 (06)
  • [5] 基于LDA的主题演化研究与实现[D]. 崔凯.国防科学技术大学. 2010
  • [6] Full‐text citation analysis: A new method to enhance scholarly networks[J] . Xiaozhong Liu,Jinsong Zhang,Chun Guo.J Am Soc Inf Sci Tec . 2013 (9)
  • [7] Improving MeSH classification of biomedical articles using citation contexts
    Aljaber, Bader
    Martinez, David
    Stokes, Nicola
    Bailey, James
    [J]. JOURNAL OF BIOMEDICAL INFORMATICS, 2011, 44 (05) : 881 - 896
  • [8] Document clustering of scientific texts using citation contexts
    Aljaber, Bader
    Stokes, Nicola
    Bailey, James
    Pei, Jian
    [J]. INFORMATION RETRIEVAL, 2010, 13 (02): : 101 - 131
  • [9] Blind men and elephants: What do citation summaries tell us about a research article?[J] . J. Am. Soc. Inf. Sci. . 2007 (1)
  • [10] CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J] . ChaomeiChen.J. Am. Soc. Inf. Sci. . 2006 (3)