基于引文的科技文献主题抽取研究

被引:7
作者
张思凤
梁梦丽
曹高辉
机构
[1] 华中师范大学信息管理学院
关键词
科技文献; 引文; 主题抽取; 关键词;
D O I
10.16353/j.cnki.1000-7490.2017.06.023
中图分类号
G353.1 [情报资料的分析和研究];
学科分类号
摘要
[目的/意义]主题抽取的效果对于信息检索、自动标引、自然语言处理具有重要的价值,提高主题抽取的效果,既能改善检索系统主题检索准确性,又能够帮助学者更加高效地了解文献的主要思想。文章研究并探讨了从引用内容中抽取文献主题的有效性。[方法/过程]选取自然语言处理领域文献为研究对象,利用文献之间的引用与被引用关系抽取引用内容,进行分词并计算权重;将引用内容、全文抽取的候选词进行专家打分评价效果并将其与关键词对比,使用F值评价两种语料库抽取候选词的优劣。[结果/结论]通过专家打分及计算F值,发现引用内容在抽取候选词方面具有明显优势。
引用
收藏
页码:122 / 127
页数:6
相关论文
共 13 条
[1]   基于引用背景信息的关键词自动抽取方法研究 [J].
宋宇 ;
罗准辰 ;
真溱 .
情报理论与实践, 2016, 39 (11) :121-125
[2]   基于LDA主题模型的科学文献主题识别:全局和学科两个视角的对比分析 [J].
王曰芬 ;
傅柱 ;
陈必坤 .
情报理论与实践 , 2016, (07) :121-126+101
[3]   基于突现文献和SAO相似度的新兴主题识别研究 [J].
黄鲁成 ;
张璐 ;
吴菲菲 ;
唐月强 .
科学学研究, 2016, 34 (06) :814-821
[4]   不同语料下基于LDA主题模型的科学文献主题抽取效果分析 [J].
关鹏 ;
王曰芬 ;
傅柱 .
图书情报工作, 2016, 60 (02) :112-121
[5]   基于LDA主题模型和生命周期理论的科学文献主题挖掘 [J].
关鹏 ;
王曰芬 .
情报学报, 2015, (03) :286-299
[6]  
Mining multilingual topics from Wikipedia. Ni X,Sun J T,Hu J,Chen Z. International Conference on World Wide Web . 2009
[7]  
Extracting key terms from noisy and multithemedocuments. M Grineva,M Grinev,D Lizorkin. The18th International Conference on World Wide Web . 2009
[8]  
Mapping the dynamics of science and technology: sociology of science in the real world. Callon M,Law J,Rip A. . 1986
[9]   科技文献全文主题识别方法实证研究 [J].
叶春蕾 ;
冷伏海 .
现代图书情报技术, 2012, (01) :53-57
[10]   基于引文内容分析的高被引论文主题识别研究 [J].
祝清松 ;
冷伏海 .
中国图书馆学报, 2014, 40 (01) :39-49