面向领域的学术文献检索框架

被引:6
作者
邱江涛 [1 ]
唐常杰 [2 ]
李庆 [1 ]
机构
[1] 西南财经大学经济信息工程学院
[2] 四川大学计算机学院
关键词
非负矩阵分解; 随机游走; 文献检索; 引用网络; 链接分析;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
在学术文献检索中,如果检索系统根据用户提交的查询返回相关领域的文献,并将文献按重要程度进行排序,可以帮助用户快速了解相关学术领域.提出一个面向领域的学术文献检索框架,结合引用网络分析和内容分析来发现并排序相关领域重要文献.该框架设计了一个评分函数进行检索,包含两个方面:(1)论文在所查询领域的重要性;(2)论文与该领域的相关性.首先研究了一个"社区核"发现算法,从引用网络上发现和查询领域相关的一个文献子集,并对论文计算重要性评分.设计了一种有监督非负矩阵分解算法,该算法使用确定的领域相关文献为先验知识对其他论文进行分类并给出一个评分,以确定论文和查询学术领域的相关性.在真实数据集和合成数据集上的实验,证实了方法的有效性.
引用
收藏
页码:798 / 809
页数:12
相关论文
共 12 条
[1]
一种基于拓扑势的网络社区发现方法 [J].
淦文燕 ;
赫南 ;
李德毅 ;
王建民 .
软件学报, 2009, 20 (08) :2241-2254
[2]
基于信息瓶颈的社区发现 [J].
沈华伟 ;
程学旗 ;
陈海强 ;
刘悦 .
计算机学报, 2008, (04) :677-686
[3]
一种从马尔可夫聚类簇发现潜在WEB社区特征的方法 [J].
杨楠 ;
林松祥 ;
高强 ;
孟小峰 .
计算机学报, 2007, (07) :1086-1093
[4]
Mining and modeling linkage information from citation context for improving biomedical literature retrieval.[J].Xiaoshi Yin;Jimmy Xiangji Huang;Zhoujun Li.Information Processing and Management.2010, 1
[5]
Popular and/or prestigious? Measures of scholarly esteem.[J].Ying Ding;Blaise Cronin.Information Processing and Management.2010, 1
[6]
Discovering author impact: A PageRank perspective.[J].Erjia Yan;Ying Ding.Information Processing and Management.2010, 1
[7]
Non-negative matrix factorization for semi-supervised data clustering [J].
Chen, Yanhua ;
Rege, Manjeet ;
Dong, Ming ;
Hua, Jing .
KNOWLEDGE AND INFORMATION SYSTEMS, 2008, 17 (03) :355-379
[8]
Large-scale structure of time evolving citation networks [J].
Leicht, E. A. ;
Clarkson, G. ;
Shedden, K. ;
Newman, M. E. J. .
EUROPEAN PHYSICAL JOURNAL B, 2007, 59 (01) :75-83
[9]
Projected gradient methods for nonnegative matrix factorization [J].
Lin, Chih-Jen .
NEURAL COMPUTATION, 2007, 19 (10) :2756-2779
[10]
Finding scientific gems with Google's PageRank algorithm [J].
Chen, P. ;
Xie, H. ;
Maslov, S. ;
Redner, S. .
JOURNAL OF INFORMETRICS, 2007, 1 (01) :8-15