VOTCL及其在交叉销售问题上的应用研究

被引:1
作者
周广通
尹义龙
郭心建
董彩玲
机构
[1] 山东大学计算机科学与技术学院
关键词
交叉销售; 类别不平衡; 代价敏感; 最优阈值投票; 支持向量机;
D O I
暂无
中图分类号
F274 [企业供销管理]; TP181 [自动推理、机器学习];
学科分类号
120301 [农业经济管理]; 140502 [人工智能];
摘要
交叉销售已成为企业盈利的重要手段,如何解决其数据中普遍同时存在的类别不平衡和代价敏感问题是准确预测交叉销售客户的关键,也是难点之一.针对上述问题,提出了一种基于最优阈值的投票方法:VOTCL.该方法首先结合过抽样和欠抽样技术获取多个类别平衡的训练数据集,然后在每个平衡数据集上分别训练得到多个底层学习器,最后利用所提出的基于最优阈值的投票集成方法集成底层学习器得到决策模型.在PAKDD2007数据挖掘竞赛的交叉销售数据集上,VOTCL预测的AUC值为0.6037.该集成模型在性能上优于单个学习器,这也在一定程度上表明了所提出的基于最优阈值的投票集成方法的有效性.
引用
收藏
页码:1539 / 1547
页数:9
相关论文
共 6 条
[1]
Data Mining for Inventory Item Selection with Cross-Selling Considerations.[J] Raymond Chi-Wing Wong;Ada Wai-Chee Fu;Ke Wang Data Min. Knowl. Discov. 2005,
[2]
Identifying Innovators for the Cross-Selling of New Products[J] Wagner A. Kamakura;Bruce S. Kossar;Michel Wedel Management Science 2004,
[3]
Machine Learning for the Detection of Oil Spills in Satellite Radar Images[J] Miroslav Kubat;Robert C. Holte;Stan Matwin Machine Learning 1998,
[4]
Adaptive Fraud Detection[J] Tom Fawcett;Foster Provost Data Mining and Knowledge Discovery 1997,
[5]
Bagging predictors[J] Leo Breiman Machine Learning 1996,
[6]
lIBSVM:Alibrary for support vector machines Chang C;Lin C; http://www.csie.ntu.edu.tw/~cjlin/libsvm 2007,