学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于Lucene的搜索引擎的设计和优化
被引:0
作者
:
李沛环
论文数:
0
引用数:
0
h-index:
0
机构:
吉林大学
吉林大学
李沛环
机构
:
[1]
吉林大学
关键词
:
搜索引擎;
多线程;
并行;
JAVA;
MvC;
D O I
:
暂无
年度学位
:
2008
学位类型
:
硕士
导师
:
于哲舟;
摘要
:
本文主要研究对企业搜索引擎的架构和内部优化。应用了多线程技术,实现了并行编程,提高了搜索引擎的运行效率。并且提出了一种基于MVC模式的搜索引擎系统架构方案,使软件模块划分的更清晰,具有更高的可扩展性和可重用性。 为了提高搜索引擎爬行器和索引器的工作效率,本文应用了JAVA多线程编程,应用线程池技术对线程进行管理,从而优化了系统的资源的分配,提高了线程的运行效率。将等待下载的uRL,等待解析的文档和等待索引的文档抽象成三个任务队列,使用JAVA技术中的wait()和notify()方法实现线程间的通信。 本文应用Struts框架实现MVC架构模式,设计了一个具有较高的可扩展性和可重用性的搜索引擎系统。从软件架构角度对搜索引擎系统进行了优化。 综上所述,本文应用多线程和并行编程技术,对搜索引擎内部结构和性能进行了优化,提高了搜索引擎爬行和索引的效率;应用MVC架构模式对软件架构进行了优化,提高了系统的可扩展性和可维护性。
引用
收藏
页数:65
共 10 条
[1]
On the design of a learning crawler for topical resource discovery
[J].
Aggarwal, CC
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Aggarwal, CC
;
Al-Garawi, F
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Al-Garawi, F
;
Yu, PS
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Yu, PS
.
ACM TRANSACTIONS ON INFORMATION SYSTEMS,
2001,
19
(03)
:286
-309
[2]
Tomcat与Java Web开发技术详解.[M].孙卫琴;李洪成编著;.电子工业出版社.2004,
[3]
高性能集群计算.[M].(美)RajkumarBuyya编;郑纬民等译;.电子工业出版社.2001,
[4]
浅析搜索引擎的原理和发展趋势
[J].
丁秀锋
论文数:
0
引用数:
0
h-index:
0
机构:
南京信息职业技术学院计算机系
丁秀锋
.
内江科技,
2005,
(02)
:39
-41
[5]
几类搜索引擎的原理剖析、比较研究及发展趋势探讨
[J].
论文数:
引用数:
h-index:
机构:
黄知义
;
论文数:
引用数:
h-index:
机构:
周宁
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学信息管理学院
不详
.
图书馆学研究 ,
2005,
(03)
:61
-64+67
[6]
搜索引擎技术发展观
[J].
化柏林
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技信息研究所研培中心
化柏林
.
中国计算机用户,
2004,
(26)
:53
-54
[7]
搜索引擎技术及研究
[J].
论文数:
引用数:
h-index:
机构:
张兴华
.
现代情报 ,
2004,
(04)
:142
-145
[8]
Web搜索引擎技术及应用
[J].
陈根栓
论文数:
0
引用数:
0
h-index:
0
机构:
信息产业部电子第三十三研究所
陈根栓
;
寇敏
论文数:
0
引用数:
0
h-index:
0
机构:
信息产业部电子第三十三研究所
寇敏
;
宋文中
论文数:
0
引用数:
0
h-index:
0
机构:
信息产业部电子第三十三研究所
宋文中
.
山西电子技术,
2000,
(06)
:19
-24
[9]
网上信息搜索技术与搜索引擎
[J].
姚国祥
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心广州,广州,广州
姚国祥
;
论文数:
引用数:
h-index:
机构:
罗伟其
;
沈镇林
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心广州,广州,广州
沈镇林
.
计算机科学,
2000,
(07)
:35
-38
[10]
中英文WWW搜索引擎中数据获取的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
荣传湘
;
张晓辉
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
张晓辉
;
论文数:
引用数:
h-index:
机构:
常桂然
.
小型微型计算机系统,
1999,
(05)
←
1
→
共 10 条
[1]
On the design of a learning crawler for topical resource discovery
[J].
Aggarwal, CC
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Aggarwal, CC
;
Al-Garawi, F
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Al-Garawi, F
;
Yu, PS
论文数:
0
引用数:
0
h-index:
0
机构:
IBM Corp, Thomas J Watson Res Ctr, Yorktown Hts, NY 10598 USA
Yu, PS
.
ACM TRANSACTIONS ON INFORMATION SYSTEMS,
2001,
19
(03)
:286
-309
[2]
Tomcat与Java Web开发技术详解.[M].孙卫琴;李洪成编著;.电子工业出版社.2004,
[3]
高性能集群计算.[M].(美)RajkumarBuyya编;郑纬民等译;.电子工业出版社.2001,
[4]
浅析搜索引擎的原理和发展趋势
[J].
丁秀锋
论文数:
0
引用数:
0
h-index:
0
机构:
南京信息职业技术学院计算机系
丁秀锋
.
内江科技,
2005,
(02)
:39
-41
[5]
几类搜索引擎的原理剖析、比较研究及发展趋势探讨
[J].
论文数:
引用数:
h-index:
机构:
黄知义
;
论文数:
引用数:
h-index:
机构:
周宁
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学信息管理学院
不详
.
图书馆学研究 ,
2005,
(03)
:61
-64+67
[6]
搜索引擎技术发展观
[J].
化柏林
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技信息研究所研培中心
化柏林
.
中国计算机用户,
2004,
(26)
:53
-54
[7]
搜索引擎技术及研究
[J].
论文数:
引用数:
h-index:
机构:
张兴华
.
现代情报 ,
2004,
(04)
:142
-145
[8]
Web搜索引擎技术及应用
[J].
陈根栓
论文数:
0
引用数:
0
h-index:
0
机构:
信息产业部电子第三十三研究所
陈根栓
;
寇敏
论文数:
0
引用数:
0
h-index:
0
机构:
信息产业部电子第三十三研究所
寇敏
;
宋文中
论文数:
0
引用数:
0
h-index:
0
机构:
信息产业部电子第三十三研究所
宋文中
.
山西电子技术,
2000,
(06)
:19
-24
[9]
网上信息搜索技术与搜索引擎
[J].
姚国祥
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心广州,广州,广州
姚国祥
;
论文数:
引用数:
h-index:
机构:
罗伟其
;
沈镇林
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心,暨南大学信息网络工程研究中心广州,广州,广州
沈镇林
.
计算机科学,
2000,
(07)
:35
-38
[10]
中英文WWW搜索引擎中数据获取的设计与实现
[J].
论文数:
引用数:
h-index:
机构:
荣传湘
;
张晓辉
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学软件中心
张晓辉
;
论文数:
引用数:
h-index:
机构:
常桂然
.
小型微型计算机系统,
1999,
(05)
←
1
→