基于新型不纯度度量的代价敏感随机森林分类器

被引:23
作者
师彦文
王宏杰
机构
[1] 西南石油大学计算机科学学院
关键词
代价敏感学习; 随机森林; 不纯度度量; 分类回归树(CART); 不平衡数据;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
140502 [人工智能];
摘要
针对不平衡数据集的有效分类问题,提出一种结合代价敏感学习和随机森林算法的分类器。首先提出了一种新型不纯度度量,该度量不仅考虑了决策树的总代价,还考虑了同一节点对于不同样本的代价差异;其次,执行随机森林算法,对数据集作K次抽样,构建K个基础分类器;然后,基于提出的不纯度度量,通过分类回归树(CART)算法来构建决策树,从而形成决策树森林;最后,随机森林通过投票机制做出数据分类决策。在UCI数据库上进行实验,与传统随机森林和现有的代价敏感随机森林分类器相比,该分类器在分类精度、AUC面积和Kappa系数这3种性能度量上都具有良好的表现。
引用
收藏
页码:98 / 101
页数:4
相关论文
共 10 条
[1]
支持向量数据描述与支持向量机及其应用 [D]. 
黄光鑫 .
电子科技大学,
2011
[2]
一种新的多分类代价敏感算法 [J].
邓少军 ;
冯少荣 ;
林子雨 .
厦门大学学报(自然科学版), 2017, 56 (02) :231-236
[3]
模糊决策粗糙集代价敏感属性约简研究 [J].
刘偲 ;
秦亮曦 .
计算机科学, 2016, 43(S2) (S2) :67-72
[4]
集成随机森林的分类模型 [J].
邓生雄 ;
雒江涛 ;
刘勇 ;
王小平 ;
杨军超 .
计算机应用研究, 2015, 32 (06) :1621-1624+1629
[5]
一种基于NNIA多目标优化的代价敏感决策树构建方法 [J].
赵士伟 ;
卓力 ;
王素玉 ;
沈兰荪 .
电子学报, 2011, 39 (10) :2348-2352+2396
[6]
支持在线学习的增量式极端随机森林分类器 [J].
王爱平 ;
万国伟 ;
程志全 ;
李思昆 .
软件学报, 2011, 22 (09) :2059-2074
[7]
Cost-sensitive feature selection using random forest: Selecting low-cost subsets of informative features.[J].Qifeng Zhou;Hao Zhou;Tao Li.Knowledge-Based Systems.2016,
[8]
Example-dependent cost-sensitive decision trees [J].
Bahnsen, Alejandro Correa ;
Aouada, Djamila ;
Ottersten, Bjoern .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (19) :6609-6619
[9]
Analysis of preprocessing vs. cost-sensitive learning for imbalanced classification. Open problems on intrinsic data characteristics.[J].Victoria López;Alberto Fernández;Jose G. Moreno-Torres;Francisco Herrera.Expert Systems With Applications.2011, 7
[10]
基于决策树的组合分类器的构建和部署 [D]. 
胡记兵 .
浙江工业大学,
2008