学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于可疑金融交易识别的离群模式挖掘研究
被引:0
作者
:
论文数:
引用数:
h-index:
机构:
汤俊
机构
:
[1]
武汉理工大学
关键词
:
数据挖掘;
机器学习;
离群检测;
反洗钱;
混沌时间序列分析;
特征提取;
支持向量机;
D O I
:
暂无
年度学位
:
2007
学位类型
:
博士
导师
:
熊前兴;
摘要
:
本文的选题来源于对可疑金融交易行为的识别与监控理论原型体系研究。主要研究内容是利用机器学习和系统复杂性的理论和方法,从海量和复杂的金融交易数据中学习和识别客户金融交易的行为模式,从而挖掘出那些明显偏离正常行为范式的所谓离群模式,实现对涉嫌洗钱或欺诈的可疑金融交易行为的计算机自动甄别和监管。 金融系统是一个非常复杂的大系统,一直以来对金融系统可疑交易判断的研究采用的大多是线性化和在严格假设条件下的简化模型,这样的确使问题得到了简化,但在实践过程中却导致高漏检率和高误报率。 本文根据金融交易的非线性机制,引入了基于系统复杂性理论的混沌分析方法,对由内在确定动力学机制产生的具有外部随机性特征的金融交易时间序列进行分析和判别,主要研究成果与创新如下: (1)金融交易的混沌属性分析 混沌行为是由确定性系统产生,但其行为却表现为类似随机的,具有短期可预测但长期不可预测的特性。本文利用相空间重构理论实现对金融时间序列的混沌属性分析,采用互信息法计算出最优时延,假近邻法计算最优嵌入维,轨道跟踪法求取最大Lvapunov指数,基于真实数据的实验结果表明,金融交易时间序列存在有限的关联维和一个正的最大Lyapunov指数,证实了对金融交易数据的时间序列进行混沌方法建模的可行性。 (2)基于混沌原理的金融交易行为产生机制识别 本文提出利用对金融交易行为的机制进行识别以获得对离群交易行为的预测。混沌数据所具有的短期可预测性为混沌背景中的细微差别行为检测提供了新思路。本文基于Takens定理重构混沌背景信号相空间,采用RBF神经网络对正常金融交易数据建立预测模型,以此对可疑金融交易数据进行预测,由于正常金融交易与可疑金融交易内在产生机理存在本质差异,因此可疑金融交易必然存在较大的预测误差。通过理想混沌时间序列与实际金融数据的仿真实验表明,基于混沌的误差检测方法对于离群模式能够有效检出。 (3)金融数据的特征提取与相似性度量 特征提取的目的是获得能够被机器识别的数学特征。区别于传统的金融时间序列的相似性度量方法,提出了一种基于RBF神经网络一步预测误差序列特征提取与相似性度量方法。该方法将时间序列之间的相似性度量换化成特征矢量之间的相似性度量,且特征矢量综合考虑了连续的时域功率特征和离散的客户背景特征。实验证明该方法相对于传统的直接距离、傅立叶变换、ARMA模型法具有明显优势。同时为了解决可疑交易数据分类中的异构数据集相似性度量问题,提出采用异构特征向量的距离度量函数HVDM以满足支持向量机自动分类要求。 (4)基于一类支持向量机的离群分类判别 针对金融交易数据量大、无训练集的特点,利用基于统计学习理论的一类支持向量机实现基于无监督的离群分类。最后用基于异构数据集距离度量HVDM的RBF形核函数,训练一类支持向量机,仿真数据以及实际金融数据的离群检测实验证明了该方法的有效性。 通过上述四步前后相互衔接、具有严密逻辑联系的离群模式挖掘工作,构成了一套具备针对复杂金融交易行为内在细微机制差别的离群模式完整挖掘体系,这一体系还可推广应用于信号处理、网络入侵检测、危机预警、健康普查、财务审计、电子商务等众多应用领域。
引用
收藏
页数:115
共 48 条
[41]
基于分段线性动态时间弯曲的时间序列聚类算法研究
[J].
翁颖钧
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
翁颖钧
;
朱仲英
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
朱仲英
.
微型电脑应用,
2003,
(09)
:19
-23+2
[42]
基于数据挖掘技术的银行反洗钱系统
[J].
谭德彬
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民银行模拟银行实验中心
谭德彬
;
论文数:
引用数:
h-index:
机构:
陈藻
.
中国金融电脑,
2003,
(07)
[43]
基于小波变换的时间序列相似模式匹配
[J].
张海勤
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系,中国科学技术大学计算机科学与技术系合肥,合肥
张海勤
;
论文数:
引用数:
h-index:
机构:
蔡庆生
.
计算机学报,
2003,
(03)
:373
-377
[44]
基于傅立叶变换的一种时间序列相似搜索算法
[J].
陈晓航
论文数:
0
引用数:
0
h-index:
0
机构:
华南理工大学计算机工程与科学系,华南理工大学计算机工程与科学系,华南理工大学计算机工程与科学系广州,广州,广州
陈晓航
;
论文数:
引用数:
h-index:
机构:
彭宏
;
论文数:
引用数:
h-index:
机构:
谢运祥
.
计算机工程与应用,
2002,
(18)
:202
-203
[45]
基于局部几何投影法的信号分离技术
[J].
姜可宇
论文数:
0
引用数:
0
h-index:
0
机构:
海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京
姜可宇
;
郑兆宁
论文数:
0
引用数:
0
h-index:
0
机构:
海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京
郑兆宁
;
陈敬军
论文数:
0
引用数:
0
h-index:
0
机构:
海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京
陈敬军
.
声学技术,
2001,
(03)
:125
-128
[46]
我国证券市场混沌的判据
[J].
高红兵
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·
高红兵
;
论文数:
引用数:
h-index:
机构:
潘瑾
;
陈宏民
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·
陈宏民
.
系统工程,
2000,
(06)
:28
-32
[47]
基于规则的分类数据离群挖掘方法研究
[J].
论文数:
引用数:
h-index:
机构:
史东辉
;
论文数:
引用数:
h-index:
机构:
蔡庆生
;
论文数:
引用数:
h-index:
机构:
倪志伟
;
论文数:
引用数:
h-index:
机构:
张春阳
.
计算机研究与发展,
2000,
(09)
:1094
-1100
[48]
混沌理论及其在经济周期理论中的应用
[J].
全林
论文数:
0
引用数:
0
h-index:
0
全林
;
赵俊和
论文数:
0
引用数:
0
h-index:
0
赵俊和
;
张钟俊
论文数:
0
引用数:
0
h-index:
0
张钟俊
.
上海交通大学学报,
1996,
(02)
←
1
2
3
4
5
→
共 48 条
[41]
基于分段线性动态时间弯曲的时间序列聚类算法研究
[J].
翁颖钧
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
翁颖钧
;
朱仲英
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学自动化系
朱仲英
.
微型电脑应用,
2003,
(09)
:19
-23+2
[42]
基于数据挖掘技术的银行反洗钱系统
[J].
谭德彬
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民银行模拟银行实验中心
谭德彬
;
论文数:
引用数:
h-index:
机构:
陈藻
.
中国金融电脑,
2003,
(07)
[43]
基于小波变换的时间序列相似模式匹配
[J].
张海勤
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系,中国科学技术大学计算机科学与技术系合肥,合肥
张海勤
;
论文数:
引用数:
h-index:
机构:
蔡庆生
.
计算机学报,
2003,
(03)
:373
-377
[44]
基于傅立叶变换的一种时间序列相似搜索算法
[J].
陈晓航
论文数:
0
引用数:
0
h-index:
0
机构:
华南理工大学计算机工程与科学系,华南理工大学计算机工程与科学系,华南理工大学计算机工程与科学系广州,广州,广州
陈晓航
;
论文数:
引用数:
h-index:
机构:
彭宏
;
论文数:
引用数:
h-index:
机构:
谢运祥
.
计算机工程与应用,
2002,
(18)
:202
-203
[45]
基于局部几何投影法的信号分离技术
[J].
姜可宇
论文数:
0
引用数:
0
h-index:
0
机构:
海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京
姜可宇
;
郑兆宁
论文数:
0
引用数:
0
h-index:
0
机构:
海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京
郑兆宁
;
陈敬军
论文数:
0
引用数:
0
h-index:
0
机构:
海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京,海军工程大学电子工程学院!南京
陈敬军
.
声学技术,
2001,
(03)
:125
-128
[46]
我国证券市场混沌的判据
[J].
高红兵
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·
高红兵
;
论文数:
引用数:
h-index:
机构:
潘瑾
;
陈宏民
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·,上海交通大学管理工程系!上海·
陈宏民
.
系统工程,
2000,
(06)
:28
-32
[47]
基于规则的分类数据离群挖掘方法研究
[J].
论文数:
引用数:
h-index:
机构:
史东辉
;
论文数:
引用数:
h-index:
机构:
蔡庆生
;
论文数:
引用数:
h-index:
机构:
倪志伟
;
论文数:
引用数:
h-index:
机构:
张春阳
.
计算机研究与发展,
2000,
(09)
:1094
-1100
[48]
混沌理论及其在经济周期理论中的应用
[J].
全林
论文数:
0
引用数:
0
h-index:
0
全林
;
赵俊和
论文数:
0
引用数:
0
h-index:
0
赵俊和
;
张钟俊
论文数:
0
引用数:
0
h-index:
0
张钟俊
.
上海交通大学学报,
1996,
(02)
←
1
2
3
4
5
→