数据流上的预测聚集查询处理算法

被引:23
作者
李建中
郭龙江
张冬冬
王伟平
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 哈尔滨工业大学计算机科学与技术学院 黑龙江哈尔滨
[3] 黑龙江哈尔滨
基金
黑龙江省自然科学基金;
关键词
数据流; 未来数据窗口; 多元线性回归; 预测聚集查询;
D O I
暂无
中图分类号
TP311.1 [程序设计];
学科分类号
081202 ; 0835 ;
摘要
实时数据流未来趋势的预测具有重要的实际应用意义.例如,在环境监测传感器网络中,通过对感知数据流进行预测聚集查询,观察者可以预测网络覆盖的区域在未来一段时间内的平均温度和湿度,以确定是否会发生异常事件.目前的研究工作多数集中在数据流上当前数据的查询,数据流上预测查询的研究工作还很少.采用多元线性回归方法,给出了数据流上的聚集值预测模型,提出了一种数据流预测聚集查询处理方法.当预测失败的次数大于预先给定的阈值时,给出了一种预测模型自动调整策略,以降低预测误差.还提出了滑动窗口的更新周期、数据流的流速对预测精度影响的数学模型.理论分析与实验结果表明,提出的预测聚集查询处理算法具有较高的性能,并且能够返回满足用户精度要求的预测查询结果.在实验中,采用TPC-H国际标准测试数据和TAO(tropicalatmosphereocean)测量的海洋表面空气温度数据来构造数据流.
引用
收藏
页码:1252 / 1261
页数:10
相关论文
empty
未找到相关数据