面向工业大数据的多层增量特征提取方法

被引:13
作者
汪星
黄小瑜
刘瑄璞
孔宪光
牛萌
机构
[1] 西安电子科技大学机电工程学院
关键词
工业大数据; 高维小样本; 特征提取; 增量线性判别分析; 增量主成分分析; 熵值法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对工业大数据中高维小样本情况导致增量线性判别分析失效问题,提出了一种面向工业大数据的多层增量特征提取方法,对高维小样本数据进行有效降维,并最大限度保留样本的变异信息和判别信息.首先,利用滑动窗口增量实时更新数据流,检测和过滤离群点,基于增量主成分分析对数据进行初步特征提取,利用Fisher准则函数量化各主元所包含的分类信息;然后,采用熵值法确定各主元贡献率和识别能力的权重,对主元进行筛选,由筛选出的主元构成新的特征空间;最后,将当前窗口的高维数据通过增量线性判别分析投影,完成二次特征提取的同时确定样本类别.实验结果表明,该方法可有效提取实时数据特征,同时很好地保留其判别能力.
引用
收藏
页码:106 / 111
页数:6
相关论文
共 10 条
[1]
复杂生产过程质量控制的智能方法研究 [D]. 
张敏 .
西南交通大学,
2013
[2]
Online feature extraction based on accelerated kernel principal component analysis for data stream [J].
Joseph A.A. ;
Tokumoto T. ;
Ozawa S. .
Evolving Systems, 2016, 7 (01) :15-27
[3]
Incremental partial least squares analysis of big streaming data [J].
Zeng, Xue-Qiang ;
Li, Guo-Zheng .
PATTERN RECOGNITION, 2014, 47 (11) :3726-3735
[4]
Regularized complete linear discriminant analysis.[J].Wuyi Yang;Houyuan Wu.Neurocomputing.2014,
[5]
数据流降维算法研究 [D]. 
单燕 .
南京邮电大学,
2016
[6]
熵值法在涂层老化指标权重确定中的应用附视频 [J].
罗来正 ;
肖勇 ;
王宝瑞 ;
苏艳 ;
朱玉琴 ;
黎小锋 ;
柏遇合 .
装备环境工程, 2017, (07) :70-73
[7]
一种改进的基于反k近邻的流数据离群点检测算法 [J].
呼妮 ;
王勇 .
计算机与现代化, 2016, (08) :32-35
[8]
面向复杂工业大数据的实时特征提取方法 [J].
孔宪光 ;
章雄 ;
马洪波 ;
常建涛 ;
牛萌 .
西安电子科技大学学报, 2016, 43 (05) :70-74+152
[9]
基于粒子群算法的LDA实现方法研究 [J].
钟伟 ;
黄元亮 ;
郝真真 ;
姜甜甜 .
计算机工程与应用 , 2017, (01) :39-43
[10]
张量线性判别分析算法研究 [J].
赵越 ;
徐鑫 ;
乔利强 .
计算机技术与发展, 2014, 24 (01) :73-76