基于聚类分解的高维度量空间索引B+-Tree

被引:22
作者
张军旗
周向东
王梅
施伯乐
机构
[1] 复旦大学计算机与信息技术系
基金
上海市自然科学基金; 中国博士后科学基金;
关键词
高维空间; 索引结构; 查询代价模型; 聚类分割;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了提高索引性能,高维度量空间索引通常采用K-Means等聚类技术来获取数据的分布信息.但是,已知的工作需要根据经验来确定聚类参数,缺乏对聚类与查询性能之间关系的理论分析.提出了一种基于聚类分解的高维度量空间B+-tree索引,通过聚类分解,对数据进行更细致的划分来减少查询的数据访问.对聚类与查询代价的关系进行了讨论,通过查询代价模型,给出了最小查询代价条件下的聚类分解数目等理论的计算方法.实验显示,提出的索引方法明显优于iDistance等度量空间索引,最优聚类分解数的估计接近实际最优查询时所需的聚类参数.
引用
收藏
页码:1401 / 1412
页数:12
相关论文
共 4 条
[1]   基于关键维的高维空间划分策略 [J].
周项敏 ;
王国仁 .
软件学报, 2004, (09) :1361-1374
[2]   一种支持快速相似检索的多维索引结构 [J].
冯玉才 ;
曹奎 ;
曹忠升 .
软件学报, 2002, (08) :1678-1685
[3]   多维向量动态索引结构研究 [J].
周学海 ;
李曦 ;
龚育昌 ;
赵振西 ;
徐海燕 .
软件学报, 2002, (04) :768-773
[4]  
A cost model for similarity queries in metric spaces .2 Ciaccia P,Patella M,Zezula P. Proc.of the 17th ACM Conf.on Principles on Database Systems . 1998