文献跨库检索中去重方法研究与应用

被引:10
作者
郝丹 [1 ]
周津慧 [1 ,2 ]
关贝 [2 ]
王衍喜 [2 ]
韩继欣 [3 ]
机构
[1] 西安电子科技大学经济管理学院
[2] 中国科学院软件研究所
[3] 华北电力物资总公司
关键词
跨库检索; 去重策略; 文献信息;
D O I
暂无
中图分类号
G250.74 [数据库建设];
学科分类号
1205 ; 120501 ;
摘要
以作者和单位发文的统计需求为背景,分析作者和单位发文在跨库检索中产生数据冗余的特殊成因,在借鉴网页去重的基础上,设计中文跨库ID、英文跨库ID、DOI以及"标题+类型"4种文献跨库去重方法,解决中文库之间、英文库之间以及中英文库之间的冗余问题,并有效应用于专家发文和单位发文信息获取与统计工作中。
引用
收藏
页码:116 / 120
页数:5
相关论文
共 8 条
[1]   基于领域专家学科知识链的文献资源组织与导航 [J].
周津慧 ;
王衍喜 ;
王永吉 ;
关贝 ;
郝丹 .
科研信息化技术与应用, 2011, 2 (01) :33-42
[2]   一种基于科技文献的学科团队识别方法研究 [J].
王衍喜 ;
周津慧 ;
王永吉 ;
肖永红 ;
郝丹 .
图书情报工作, 2011, 55 (02) :55-58+98
[3]   Google Scholar的数据整合研究 [J].
洪道广 .
现代情报 , 2010, (07) :39-41+45
[4]   基于拼音首字母查询的去重优化设计 [J].
王东 ;
熊世桓 .
贵州师范学院学报, 2010, 26 (06) :37-39
[5]   分布式网络爬虫URL去重策略的改进 [J].
吴小惠 .
平顶山学院学报, 2009, 24 (05) :116-119
[6]   基于ISI与KNS服务平台的跨库检索比较 [J].
孙君 ;
张苏 .
图书馆学研究 , 2007, (01) :64-66+45
[7]   情报语言漫笔(Ⅰ) [J].
张琪玉 .
图书馆理论与实践, 2003, (03) :37-39
[8]   A systematic study on parameter correlations in large-scale duplicate document detection [J].
Ye, Shaozhi ;
Wen, Ji-Rong ;
Ma, Wei-Ying .
KNOWLEDGE AND INFORMATION SYSTEMS, 2008, 14 (02) :217-232