时间序列分类问题的算法比较

被引:43
作者
杨一鸣 [1 ]
潘嵘 [2 ]
潘嘉林 [2 ]
杨强 [1 ]
李磊 [1 ]
机构
[1] 中山大学软件研究所
[2] 香港科技大学计算机科学与工程系
关键词
分类; 时间序列; 基于模型聚类; 马尔可夫模型; 统计学习;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
时间序列分类是时间序列数据分析中的重要任务之一.不同于时间序列分析中常用的算法与问题,时间序列分类是要把整个时间序列当作输入,其目的是要赋予这个序列某个离散标记.它比一般分类问题困难,主要在于要分类的时间序列数据不等长,这使得一般的分类算法不能直接应用.即使是等长的时间序列,由于不同序列在相同位置的数值一般不可直接比较,一般的分类算法依然还是不适合直接应用.为了解决这些难点,通常有两种方法:第一,定义合适的距离度量(这里,最常用的距离度量是DTW距离),使得在此度量意义下相近的序列有相同的分类标签,这类方法属于领域无关的方法;第二,首先对时间序列建模(利用序列中前后数据的依赖关系建立模型),再用模型参数组成等长向量来表示每条序列,最后用一般的分类算法进行训练和分类,这类方法属于领域相关的方法.长期以来,研究者往往只倾向于使用其中一种算法,而这两类算法的比较却比较缺乏.文中深入分析了这两类方法,并且分别在不同的合成数据集和实际数据集上比较了两类方法.作者观测到了两类算法在不同因素影响下的性能表现,从而为今后发展新的算法提供了有力依据.
引用
收藏
页码:1259 / 1266
页数:8
相关论文
共 9 条
[1]  
Nearest Neighbor(NN)Norms:NN Pattern Classification Techniques. Dasarathy Belur V. . 1990
[2]  
Aligning gene expressionti me series with ti me warping algorithms. Aach J,Church G. Bioinformatics . 2001
[3]  
Fundamentals of Statistical Signal Process-ing:Esti mation Theory. Kay Steven M. . 1993
[4]  
C4.5:Programs for Machine Learning. Quinlan J R. . 1993
[5]  
Some methods for classification and analysis of multivariate observations//Proceedings of the5th Berkeley Symposium on Mathematical Statistics and Probability. MacQueen J B. Berkeley . 1967
[6]  
A generative-discri minative hybrid for sequential data classification//Pro-ceedings of the IEEE International Conference on Acoustics and Signal Processing. Abou-Moustafa K T,Cheriet M,Suen C Y. Montreal . 2004
[7]  
The Nature of Statistical Learning Theo-ry. Vapnik Vladi mir. . 1999
[8]  
Haar wavelets for efficient si milarity search of ti me-series:With and without ti me warping. Chan Franky Kin-Pong,Fu Ada Wai-Chee,Yu Clement. IEEE Transactions on Knowledge and Data Engineering . 2003
[9]  
The symmetric ti me warping al-gorithm:Fromcontinuous to discrete//Ti me Warps,String Edits and Macromolecules. Kruskall J B,Liberman M. . 1983