高效FTP搜索引擎的设计与实现

被引:6
作者
郭立力 [1 ]
赵春江 [2 ]
机构
[1] 中国农业大学工学院
[2] 国家农业信息化工程技术研究中心
关键词
文件传输协议; 搜索引擎; 倒排索引; 自动分类; 自动纠错;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,在对FTP用户查询日志进行统计分析的基础上,采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎.双字节倒排是对文件名中每两个字节建立倒排索引表,自动分类是对检索结果按主题划分为层次结构,查询自动纠错是以用户查询日志中的高频查询词为数据源构建拼写错误词典.试验结果表明,该方案能够有效地提高FTP搜索引擎的文件检索效率与质量.
引用
收藏
页码:135 / 139
页数:5
相关论文
共 6 条
[1]   大规模搜索引擎检索系统框架与实现要点 [J].
彭波 .
计算机工程与科学, 2006, (03) :1-4
[2]   天网千帆——一种新型文件搜索引擎 [J].
谢欣 ;
刘菲菲 ;
李晓明 .
华南理工大学学报(自然科学版), 2004, (S1) :58-62
[3]   互联网上FTP文件的分布特征及启示 [J].
陈华 ;
王继民 ;
韩近强 ;
谢欣 ;
不详 .
计算机工程与应用 , 2004, (01) :129-133+178
[4]   智能元搜索引擎的研究 [J].
皮鹏 ;
张国印 .
应用科技, 2001, (08) :24-26
[5]   基于Web的百万级FTP搜索引擎的设计与实现 [J].
陈华 ;
罗昶 ;
王建勇 ;
段晖 ;
薛明 .
计算机应用, 2000, (09) :68-70
[6]  
Combining text and link analysis for focused crawling—An application for vertical search engines[J] . G. Almpanidis,C. Kotropoulos,I. Pitas.Information Systems . 2006 (6)