基于内容相似性的科技论文网络的构建及其属性的初步分析

被引:6
作者
潘现伟 [1 ]
杨颖 [2 ]
崔雷 [1 ]
机构
[1] 中国医科大学医学信息学系
[2] 中国医科大学图书馆
关键词
内容相似性; 科技论文; 复杂网络; 权重; 网络构建;
D O I
10.16353/j.cnki.1000-7490.2014.03.006
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
构建基于内容相似性的科技论文网络,并对其属性进行初步分析。在Pubmed数据库中检索数据挖掘主题的文献记录,利用在线概念抽取软件Metamap对文献集进行概念抽取,统计各个概念出现的频次,采用TF-IDF算法计算每个词的权重,形成论文—概念权重矩阵,计算每两篇论文所有概念的内积最终构建出论文相似性矩阵,并对相似矩阵的有效性进行了人工初步评判。利用社会网络分析软件Ucinet可视化表达论文相似性矩阵,并对论文网络的属性进行了初步分析。通过这种方法构建出了基于内容相似性的科技论文可视化网络,该网络是一个松散型网络,具有复杂网络的"小世界"特性,并具有鲁棒性和脆弱性。本研究表明,根据内容的相似性构建论文网络是可行的,这为今后进行学科结构分析和论文评价提供了可靠的方法学基础。
引用
收藏
页码:129 / 133
页数:5
相关论文
共 8 条
[1]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[2]   从统计物理学看复杂网络研究 [J].
吴金闪 ;
狄增如 .
物理学进展, 2004, (01) :18-46
[3]   复杂网络理论及其应用研究概述 [J].
刘涛 ;
陈忠 ;
陈晓荣 .
系统工程, 2005, (06) :1-7
[4]  
Network biology: understanding the cell’s functional organization. Barabasi AL,Oltvai ZN. Nature Reviews Genetics . 2004
[5]   细胞信号转导的复杂网络分析 [J].
潘义 ;
冯子男 ;
刁元波 ;
向杰 ;
文志宁 ;
李梦龙 .
计算机与应用化学, 2007, (01) :56-60
[6]   TFIDF算法研究综述 [J].
施聪莺 ;
徐朝军 ;
杨晓江 .
计算机应用, 2009, 29(S1) (S1) :167-170+180
[7]  
科学学引文网络的结构研究[D]. 尹丽春.大连理工大学 2006
[8]  
复杂网络理论及其应用[M]. 清华大学出版社 , 汪小帆,李翔,陈关荣编著, 2006