基于Lucene的搜索引擎的设计和优化

被引:0
作者
李沛环
机构
[1] 吉林大学
关键词
搜索引擎; 多线程; 并行; JAVA; MvC;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
本文主要研究对企业搜索引擎的架构和内部优化。应用了多线程技术,实现了并行编程,提高了搜索引擎的运行效率。并且提出了一种基于MVC模式的搜索引擎系统架构方案,使软件模块划分的更清晰,具有更高的可扩展性和可重用性。 为了提高搜索引擎爬行器和索引器的工作效率,本文应用了JAVA多线程编程,应用线程池技术对线程进行管理,从而优化了系统的资源的分配,提高了线程的运行效率。将等待下载的uRL,等待解析的文档和等待索引的文档抽象成三个任务队列,使用JAVA技术中的wait()和notify()方法实现线程间的通信。 本文应用Struts框架实现MVC架构模式,设计了一个具有较高的可扩展性和可重用性的搜索引擎系统。从软件架构角度对搜索引擎系统进行了优化。 综上所述,本文应用多线程和并行编程技术,对搜索引擎内部结构和性能进行了优化,提高了搜索引擎爬行和索引的效率;应用MVC架构模式对软件架构进行了优化,提高了系统的可扩展性和可维护性。
引用
收藏
页数:65
共 10 条
[1]
On the design of a learning crawler for topical resource discovery [J].
Aggarwal, CC ;
Al-Garawi, F ;
Yu, PS .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2001, 19 (03) :286-309
[2]
Tomcat与Java Web开发技术详解.[M].孙卫琴;李洪成编著;.电子工业出版社.2004,
[3]
高性能集群计算.[M].(美)RajkumarBuyya编;郑纬民等译;.电子工业出版社.2001,
[4]
浅析搜索引擎的原理和发展趋势 [J].
丁秀锋 .
内江科技, 2005, (02) :39-41
[5]
几类搜索引擎的原理剖析、比较研究及发展趋势探讨 [J].
黄知义 ;
周宁 ;
不详 .
图书馆学研究 , 2005, (03) :61-64+67
[6]
搜索引擎技术发展观 [J].
化柏林 .
中国计算机用户, 2004, (26) :53-54
[7]
搜索引擎技术及研究 [J].
张兴华 .
现代情报 , 2004, (04) :142-145
[8]
Web搜索引擎技术及应用 [J].
陈根栓 ;
寇敏 ;
宋文中 .
山西电子技术, 2000, (06) :19-24
[9]
网上信息搜索技术与搜索引擎 [J].
姚国祥 ;
罗伟其 ;
沈镇林 .
计算机科学, 2000, (07) :35-38
[10]
中英文WWW搜索引擎中数据获取的设计与实现 [J].
荣传湘 ;
张晓辉 ;
常桂然 .
小型微型计算机系统, 1999, (05)