一种测试数据挖掘算法的数据源生成方法

被引:13
作者
杜鷁
李德毅
机构
[1] 中国人民解放军理工大学!南京
[2] 中国电子系统工程研究所!北京
关键词
数据挖掘; 云模型; 云发生器;
D O I
暂无
中图分类号
TP311 [程序设计、软件工程];
学科分类号
摘要
随着数字时代的来临 ,数据挖掘成为知识领域中的研究热点 .但由于保密、数据多样性等问题 ,测试数据源的获取一直困扰着数据挖掘算法的研究 .为此 ,提出一种基于云模型的测试数据源生成方法 ,利用此方法 ,给出了数量型数据的生成算法 ,对范畴型数据的生成进行了讨论 .由于云模型中随机性与模糊性的特点 ,各属性的数据之间除了包含已知的先验知识以外 ,数据的分布、各属性之间的关系也会存在一定的随机和模糊 ,使得构造的数据源中又隐含了许多潜在知识 .利用此方法 ,研究人员可根据自己的实际情况进行不同类型、不同量级数据源的构造 ,加速数据挖掘算法的研究进程
引用
收藏
页码:776 / 782
页数:7
相关论文
共 1 条