时间序列相空间重构数据挖掘方法及其在证券市场的应用

被引:0
作者
陈佐
机构
[1] 湖南大学
关键词
相空间重构; 时间序列; 数据挖掘; 小波聚类; EM算法; 异常;
D O I
暂无
年度学位
2007
学位类型
博士
导师
摘要
金融市场是融通资金的场所。金融市场实现了投资需求和筹资需求的对接,能有效的化解资本的供求矛盾。金融投资分析方法一直是金融领域的研究热点。随着金融市场的飞速发展,投资分析方法也得到不断的创新和进步。传统的时间序列模型的应用一方面依赖于某些假设条件,因而应用受到限制;另一方面,由于经济和商业时间序列的结构经常是逐渐变化的,应用结构固定的全局模型来描述并不十分合适。 随着信息技术在金融行业的普及以及人们收集数据能力的大幅提高,在金融市场的飞速发展过程中,积累了海量的包含丰富信息的数据。数据挖掘方法为人们分析金融时间序列提供了新的思路和视野。本文以相空间重构技术为基础,以时间序列作为研究对象,分析面向时间序列数据的数据挖掘方法,并将研究结果应用于实际金融市场,以发现金融时间序列中隐含的规律、模式和知识,为市场分析和投资决策提供新的思路、方法和辅助决策信息。 本文从研究所处的背景出发,详细讨论了数据挖掘技术以及时间序列数据挖掘与金融数据挖掘的相关研究现状,并分析了相空间重构的相关理论和方法。为应用相空间重构进行时间序列数据挖掘的可行性提供了理论基础和技术保障。 通过对比时间序列模式挖掘的不同思路,本文指出时间序列数据挖掘框架TSDM所存在的问题。系统地提出了应用小波聚类进行序列时间模式挖掘的方法。应用小波变换的多分辨率特性和基于网格的划分方法,可以实现任意形状和不同精度的聚类。采用以事件指导的投资策略将方法应用于中国证券市场。结果表明,以时间模式预测事件为指导的投资策略能获得高于持有策略的收益;时间模式挖掘能有效识别事件点;事件序列与非事件序列存在显著差别。 在讨论了嵌入定理和时间序列的可预测性的基础上,本文从现有模糊神经网络存在的问题入手,结合非线性的空间聚类方法EM算法,对原有TS模糊神经网络模型进行改进,提出了基于相空间重构的EM聚类模糊神经网络预测模型。通过对重构空间进行EM模糊聚类,实现数据对象的分类训练以及隶属度的计算,以减少输入规则的条数简化神经网络的结构。同时,将该模型分别应用于深成指数和上证指数。结果表明,该预测模型的预测误差低于传统的BP模型,有效地提高了预测精度。 本文从序列异常的角度提出了时间序列的偏差异常检测方法。应用CC算法同时对嵌入维和嵌入延时进行估计进行重构以构造多维空间,应用偏差异常检测方法抽取异常模式,再通过符号离散化将问题转化为分类问题构建决策树实现异常的分类和预测。以决策树的分类标识为指导构建交易策略,在证券市场上进行了应用。结果表明,尽管在股市大势呈现下降趋势的情况下,应用分类标识为指导的交易策略仍能获得较高的收益。 本文应用相空间重构技术将时间序列分割成长度相同的子序列集合,并将其映射到多维特征空间,从而将有序的时间序列一维数据挖掘问题转换成为多维空间的无序数据集合的挖掘问题。本文的研究不仅为金融时间序列分析提供了新的方法,也为数据挖掘技术提供了新的研究思路。
引用
收藏
页数:117
共 56 条
[1]
中国股市收益率分布特征研究 [J].
卢方元 .
中国管理科学, 2004, (06)
[2]
深圳股市有效性与可预测性并存的实证研究 [J].
许涤龙 .
经济问题, 2003, (07) :37-39
[3]
基于聚类的神经网络及其在预测中的应用 [J].
陈传波 ;
彭炎 ;
陆枫 .
华中科技大学学报(自然科学版), 2003, (06) :84-85+105
[4]
中国股市收益率分布函数研究 [J].
封建强 ;
王福新 .
中国管理科学, 2003, (01)
[5]
中国股票市场收益率分布曲线的实证 [J].
陈启欢 .
数理统计与管理, 2002, (05) :9-11
[6]
沪深股市收益率分布的时变性 [J].
李亚静 ;
朱宏泉 .
数学的实践与认识, 2002, (02) :228-233
[7]
非同步多时间序列中频繁模式的发现算法 [J].
李斌 ;
谭立湘 ;
解光军 ;
李海鹰 ;
庄镇泉 .
软件学报, 2002, (03) :410-416
[8]
上海股市有效性与可预测性并存的实证研究 [J].
许涤龙 ;
王珂英 .
经济问题, 2001, (11) :2-4
[9]
基于嵌入理论和神经网络技术的混沌数据预测及其在股票市场中的应用 [J].
杨一文 ;
刘贵忠 ;
张宗平 .
系统工程理论与实践, 2001, (06) :52-58+78
[10]
中国股市弱式有效吗? [J].
张亦春 ;
周颖刚 .
金融研究, 2001, (03) :34-40