基于分布式的智能搜索引擎

被引:0
作者
姜鑫维
机构
[1] 武汉理工大学
关键词
搜索引擎; 智能化; 个性化; 页面分类; PageRank;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
随着Internet网上的知识呈几何级数式的增长,搜索引擎作为一个查询用户所需信息的工具,其作用越来越受到人们的重视。目前,一个优秀的搜索引擎能够大大地提高一个网站的点击率,搜索引擎已经成为网站的门户。简单地讲:搜索引擎通过一个称之为“网络蜘蛛”的程序,将网页上的内容按一定的方式存放在自己的数据库里,并昼夜不停地维护、更新该数据库,当用户提交查询时,就从数据库中找出与该关键字相关联的信息,并按照一定的顺序返回给用户。 与其它的技术一样,搜索引擎的发展也离不开对其理论基础的研究。本文在对当前第二代搜索引擎系统进行理论分析的基础上,结合最有代表性的Google公司的搜索引擎系统进行了详细的系统分析,并讨论了其中的关键数据结构和算法,在这个基础上,我结合我当前正在进行开发的PIS个人智能搜索引擎项目,给出了我的基于分布式系统的架构以及相关的算法,并给出了具体的实现。同时也考虑到第二代搜索引擎系统的种种不足,给出了智能搜索引擎系统的理论概述,并结合目前我的项目,进行了个性化搜索的研究,给出了两种创新的个性化搜索方法。 本文具体进行了两个方面的论述: 1、分布式搜索引擎系统的设计与实现。尽管当前的搜索引擎系统已经广泛采用了分布式的系统架构,但是由于受到搜索引擎系统软件的设计和算法的制约,每个公司的实现方式不太一样,本文根据我当前正在开发的PIS智能搜索引擎系统,提出了一个比较适合于基于主题的分布式搜索引擎的架构,对其中的分布式页面抓取系统和分布式等级计算系统进行了详细的论述,并给出了具体模块的设计与实现方法,同时也提出了一种新的基于页面分类的页面等级计算算法——Topic PageRank算法。 2、智能化搜索引擎系统的设计。智能化的搜索引擎系统已经被提出了很多年,但是至今依然发展缓慢,本文中我结合智能搜索引擎的相关理论知识,提出了两种基于智能化搜索系统的个性化搜索方法——基于Blog的个性化方法和基于Ajax的个性化方法,通过与传统的个性化方法进行融合,能够提供出更精确的个性化搜索,针对不同的用户,我们的个性化搜索系统能够提供出更加个性化的返回结果集。
引用
收藏
页数:75
共 32 条
[1]
个性化搜索引擎 [J].
张亮 ;
冯志勇 .
计算机工程, 2006, (18) :202-205
[2]
搜索引擎系统中的Web个性化信息推荐技术 [J].
李树青 ;
崔北亮 .
情报杂志 , 2006, (09) :84-87
[3]
个性化搜索引擎中的用户兴趣提取技术 [J].
胡吉明 .
图书馆学刊, 2006, (04) :118-119
[4]
VSM在中文文本聚类中的应用及实证分析 [J].
马辉民 ;
李卫华 ;
吴良元 .
武汉理工大学学报(信息与管理工程版), 2006, (04) :56-59+81
[5]
个性化服务技术研究 [J].
吴辉娟 ;
袁方 .
计算机技术与发展, 2006, (02) :32-34+37
[6]
搜索引擎系统中个性化机制的研究 [J].
袁薇 ;
高淼 .
微电子学与计算机, 2006, (02) :68-72+75
[7]
个性化Web信息服务技术研究 [J].
余强 ;
张海盛 .
计算机应用研究, 2006, (02) :198-200
[8]
WebSifter:个性化网络搜索辅助系统 [J].
蒋宗礼 ;
肖华 ;
赵钦 .
清华大学学报(自然科学版), 2005, (自然科学版) :1903-1907
[9]
一种使用分布式技术的搜索引擎 [J].
姚树宇 ;
赵少东 .
计算机应用与软件, 2005, (10)
[10]
W eb环境下的个性化信息检索技术 [J].
崔建海 ;
程妮 ;
王军 .
现代图书情报技术, 2005, (09) :45-49