基于互信息网络模型的时间序列数据库知识发现

被引:0
作者
温长洋
机构
[1] 浙江大学
关键词
时间序列数据库; 互信息; voronoi; 特征属性; 模糊逻辑; 知识发现;
D O I
暂无
年度学位
2003
学位类型
硕士
导师
摘要
本文提出了一种新的、完整的时间序列数据厍知识发现方法。该方法是基于Shannon信息理论中的互信息理论、概率统计方法、voronoi图滤波及模糊逻辑等理论上,包含了对时间序列数据库进行知识发现的一般步骤:时间序列数据库构建,清洗和过滤时间序列数据,特征提取,构造互信息网络并提取规则,和模糊方法解决规则冲突并简约规则。知识发现的结果——规则可以用来预测时间序列的未来行为。 论文首先介绍了时间序列数据库与一般数据库的差别及定义,说明时间序列数据库的在用于知识发现的目标:趋势分析,相似性搜索和序列模式挖掘。讨论并分析了专门数据库的不同构建方法,在此基础上,引出如何把现有的数据库重组成时间序列数据库。 接着,文章提出了一种多层次互信息网络,用它来进行知识发现。文章从Shannon信息理论的互信息概念和意义出发,利用事件集的先验熵(独立事件集信息量)和后验熵(条件信息量)之间的差(也就是互信息)来检测输入属性和目标属性之间的关联程度,逐层构造和控制网络的结构,从而推导出输入属性和目标属性之间的关联规则。 在上述基础上,文章叙述了如何利用互信息网络模型对时间序列数据库进行知识发现的系统方法。1)分析用来滤波的移动平滑技术及其缺点,为了克服这些缺点,提出了用voronoi图进行滤波的方法,阐述该方法的进行自适应滤波的优点:2)对于提取特征属性,本文介绍了两种时间序列数据的重要特征属性:趋势段(用于发现事件)和信噪比;3)说明用互信息网络进行时间序列知识发现的详细步骤;4)在结果处理上,用模糊逻辑对互信息网络中提取的规则进行冲突处理和归约,提高结果的可解释性。 我们利用浙江电信时间序列数据进行实验和验证,结果表明基于互信息网络模型的时间序列数据库知识发现是有效的。文章最后指出时间序列知识发现的重要应用意义和进一步发展方向。
引用
收藏
页数:64
共 17 条
[1]
利用反馈的时序模式挖掘算法研究 [J].
郑斌祥 ;
席裕庚 ;
杜秀华 .
控制与决策, 2002, (05) :527-531
[2]
一种基于Rough集的时间序列数据挖掘策略 [J].
马志锋 ;
邢汉承 ;
郑晓妹 .
系统工程理论与实践, 2001, (12) :22-29
[3]
时间序列相似性搜索算法研究 [J].
杨敏 ;
王志坚 ;
尹燕敏 ;
不详 .
山东师大学报(自然科学版) , 2001, (04) :373-377
[4]
时间序列预测与关联规则的维护 [J].
王刚 ;
邱玉辉 ;
程小平 .
计算机科学, 2001, (04) :67-68+73
[5]
基于互信息和测度学习信度网结构 [J].
邢永康 ;
沈一栋 .
重庆大学学报(自然科学版), 2001, (01) :78-83
[6]
基于贝叶斯方法的知识发现 [J].
王玮 ;
陈恩红 ;
王煦法 .
小型微型计算机系统, 2000, (07) :703-705
[7]
面向数据挖掘的时间序列符号化方法研究 [J].
李斌 ;
谭立湘 ;
章劲松 ;
庄镇泉 .
电路与系统学报, 2000, (02) :9-14
[8]
多维时间序列的周期分析 [J].
张吉峰 .
系统工程理论与实践, 1999, (06)
[9]
基于能量关联度的时间序列周期分析 [J].
张吉峰 .
系统工程理论与实践, 1998, (09)
[10]
互信息在时间序列分析中的应用 [J].
赵鸿 ;
柴路 ;
王浩 ;
刘书声 .
应用科学学报, 1996, (01)