基于Nutch的搜索引擎的研究

被引:17
作者
胡涛
路红英
机构
[1] 北京交通大学计算机与信息技术学院
关键词
Nutch; Lucene; 中文分词; 评分机制;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
Nutch是一个开放源代码的Web搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代的商业搜索引擎工作原理一样,即网页搜集、预处理(建立索引)和查询服务。由于不夹杂商业利益,它对搜索结果的排序算法较为透明公平。我们可以利用Nutch并结合中文分词技术来构建自己的中文搜索引擎。
引用
收藏
页码:57 / 59
页数:3
相关论文
共 1 条
  • [1] 征服Ajax+Lucene构建搜索引擎.[M].李刚;宋伟;邱哲编著;.人民邮电出版社.2006,