基于Lucene.net网络爬虫的设计与实现

被引:7
作者
刘磊安
符志强
机构
[1] 仲恺农业工程学院计算机科学与工程学院
关键词
网络爬虫; Lucene.NET; 搜索引擎;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
网络爬虫采集互联网信息并提供搜索服务。该设计基于Lucene.NET平台开发网络爬虫,可以对特定的网页进行抓取和分析,提取网页中有用信息,并对抓取的数据进行索引,存储到服务器硬盘,同时过滤掉无用信息。系统界面友好,准确高效。
引用
收藏
页码:1870 / 1871+1878 +1878
页数:3
相关论文
共 3 条
[1]   一种基于Lucene检索引擎的全文数据库的研究与实现 [J].
张校乾 ;
金玉玲 ;
侯丽波 .
现代图书情报技术, 2005, (02) :40-43+48
[2]   基于LUCENEAPI的中文全文数据库设计与实现 [J].
赵汀 ;
孟祥武 .
计算机工程与应用, 2003, (20) :179-181+197
[3]  
搜索引擎.[M].李晓明;闫宏飞;王继民著;.科学出版社.2005,