基于Lucene的搜索引擎设计与实现

被引:26
作者
赵珂
逯鹏
李永强
机构
[1] 郑州大学电气工程学院
关键词
FTP搜索引擎; Lucene框架; 模型-视图-控制器; 有限状态自动机; 倒排索引;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对目前教育网庞大的FTP资源检索困难的问题,提出一种基于EdtFTPJ和Lucene的FTP搜索引擎的设计和实现方案。该方案整体上采用基于Struts1.2框架的模型-视图-控制器设计模式,数据采集模块利用基于正则表达式的有限状态自动机抓取数据,索引模块应用倒排索引方法,系统的分词算法使用基于字典的正向最大匹配中文分词法。实验结果表明,该方案具有较高的资源检索率,同时能够保证检索结果的准确性。
引用
收藏
页码:39 / 41
页数:3
相关论文
共 3 条
[1]   基于Spring的MVC框架设计与实现 [J].
张宇 ;
王映辉 ;
张翔南 .
计算机工程, 2010, 36 (04) :59-62
[2]   高效FTP搜索引擎的设计与实现 [J].
郭立力 ;
赵春江 .
华南理工大学学报(自然科学版), 2009, 37 (01) :135-139
[3]  
Combining text and link analysis for focused crawling—An application for vertical search engines[J] . G. Almpanidis,C. Kotropoulos,I. Pitas.Information Systems . 2006 (6)