基于Map/Reduce的索引数据云存储模型研究

被引:8
作者
陆小丽 [1 ,2 ]
何加铭 [1 ,2 ]
机构
[1] 宁波大学通信技术研究所
[2] 浙江省移动网应用技术重点实验室
关键词
搜索引擎; 权重; Map/Reduce; 索引;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的模糊粒度.通过实验验证基于该存储模型的算法不仅可以提高海量数据索引库的数据处理效率,而且在一定程度上降低了检索系统查询延迟,提高了搜索效率.
引用
收藏
页码:29 / 33
页数:5
相关论文
共 5 条
[1]  
基于云计算的语义搜索引擎研究.[D].张建梁.复旦大学.2009, 02
[2]  
网络文件存储和共享系统的资源搜索研究和实现.[D].马云涛.东南大学.2004, 02
[3]   基于云计算的资源调度策略 [J].
孙瑞锋 ;
赵政文 .
航空计算技术, 2010, 40 (03) :103-105
[4]   基于Map/Reduce的分布式搜索引擎研究 [J].
吴宝贵 ;
丁振国 .
现代图书情报技术, 2007, (08) :52-55
[5]   主要分布式搜索引擎技术的研究 [J].
蒋建洪 .
科学技术与工程, 2007, (10) :2418-2424