基于Nutch的开放存取搜索引擎构建研究

被引:5
作者
崔宇红
张奎
机构
[1] 北京理工大学图书馆
关键词
开放存取; 搜索引擎; Nutch; 中文学术资源;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
研究当前主要的开放存取搜索系统的实现机制,选择基于网络爬虫的搜索引擎技术,利用开源软件Nutch构建分布式DSearch实验系统,为开放存取资源出版和信息服务机构提供一种高效、灵活、可定制的检索工具。重点介绍DSearch系统核心技术——分布式集群配置、中文分词模块修改和索引设置,并通过设定的种子列表实验对DSearch系统实现的功能和效果进行评价。
引用
收藏
页码:82 / 86
页数:5
相关论文
共 2 条
[1]   网络环境下学术信息的开放存取 [J].
李春旺 .
中国图书馆学报, 2005, (01) :33-37
[2]  
Finding open access articles using Google, Google Scholar, OAIster and OpenDOAR[J] . Norris, Michael,Oppenheim, Charles,Rowland, Fytton.Online Information Review . 2008 (6)