基于时间序列聚类和ARMA模型的检索量预测

被引:24
作者
孙承杰
刘丰
林磊
刘秉权
机构
[1] 哈尔滨工业大学计算机科学与技术学院
基金
中央高校基本科研业务费专项资金资助;
关键词
时间序列; 检索量; ARMA模型; 动态时间弯曲距离; k-medoid算法;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
080201 [机械制造及其自动化];
摘要
为了通过预测分析检索量数据来指导商家调整产品开发及经营策略,将检索量数据组织为时间序列,对其用自回归滑动平均(ARMA)模型进行建模预测.先将时间序列进行聚类,仅对聚类中心序列进行ARMA模型识别,同类序列用该模型进行近似建模预测;经过数据预处理、相似性分析、基于相似度的聚类、时间序列预测等过程,得到检索量数据的预测值,并将其与检索量的实际值做比较.结果表明,用同一个ARMA模型拟合相似时间序列的方法具有可行性,且有较高的预测准确率.从聚类结果还可看出,同品牌产品的检索量数据趋于聚成一类,这为检索词关系的挖掘提供了参考.
引用
收藏
页码:21 / 25
页数:5
相关论文
共 4 条
[1]
数据分析与Eviews应用.[M].易丹辉主编;.中国统计出版社.2002,
[2]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[3]
An examination of indexes for determining the number of clusters in binary data sets [J].
Dimitriadou, E ;
Dolnicar, S ;
Weingessel, A .
PSYCHOMETRIKA, 2002, 67 (01) :137-159
[4]
Predicting a chaotic time series using a fuzzy neural network.[J].L.P. Maguire;B. Roche;T.M. McGinnity;L.J. McDaid.Information Sciences.1998, 1