基于Solr的分布式全文检索系统的研究与实现

被引：24

作者：

李戴维

李宁

机构：

[1] 华北计算技术研究所信息技术与应用系统部

来源：

计算机与现代化 | 2012年 / 11期

关键词：

全文检索; Solr; 分布式; Zookeeper;

D O I：

暂无

中图分类号：

TP391.3 [检索机];

学科分类号：

081203 ; 0835 ;

摘要：

随着当前网络信息资源的急剧膨胀,传统的检索系统已经难以在处理海量数据时提供高效的、可靠的服务。针对该情况,设计并实现一个基于Solr的分布式全文检索系统。系统通过网络爬虫抓取网页信息,将抓取的信息储存为文本文件;然后利用Solr索引处理模块,在多台计算机节点上并行创建索引,有效地提高系统建立索引的速度;系统通过Zoo-keeper管理集群,将搜索模块设计为分布式,有效地提高检索性能;最后设计了友好的用户界面。目前,系统可以在百万数据量的环境下稳定运行,具有较强的实用价值。

引用

页码：171 / 176

页数：6

共 7 条

[1] 计算机中文分词技术的应用 [J].