时间序列数据的稳健最优分割方法

被引:10
作者
覃征
李爱国
不详
机构
[1] 西安交通大学电子与信息工程学院
[2] 西安
关键词
数据挖掘; 时间序列; 分割; 分段多项式表示; 稳健性;
D O I
暂无
中图分类号
TP311.131 [];
学科分类号
1201 ;
摘要
针对分段多项式回归方法存在计算效率低和对噪声较敏感等缺点 ,提出了具有稳健性的最优分割方法 ,以解决时间序列数据相似搜索及知识发现处理中的长时间序列分割问题 .该方法采用自顶向下策略 ,然后根据自适应定阶算法直接选定一个合适的多项式阶 .对每个候选变化点 ,经过一次判断即可确定多项式的合适阶次 .由于该方法基于对线性模型的数据矩阵作奇异值分解 ,从而可自适应确定子序列合适的模型 ,简化了计算过程 .文中对此给出了理论证明 .通过与Garalnik Srivastava方法进行实验比较 ,证明所提方法不仅计算效率高 ,而且具有良好的稳健性
引用
收藏
页码:338 / 342
页数:5
相关论文
共 4 条
[1]   时间序列数据的相似模式抽取 [J].
李爱国 ;
覃征 ;
贺升平 .
西安交通大学学报, 2002, (12) :1275-1278
[2]  
动态数据的统计分析[M]. 北京理工大学出版社 , 甘仞初编著, 1991
[3]   Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases [J].
Eamonn Keogh ;
Kaushik Chakrabarti ;
Michael Pazzani ;
Sharad Mehrotra .
Knowledge and Information Systems, 2001, 3 (3) :263-286
[4]  
Querying time series data based on similarity. Rafiai D, Mondelzon A O. IEEE Transactions on Knowledge and Data Engineering . 2000