学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
构建数据仓库过程中的数据清洗研究
被引:19
作者
:
论文数:
引用数:
h-index:
机构:
刘喜文
[
1
]
论文数:
引用数:
h-index:
机构:
郑昌兴
[
1
,
2
]
王文龙
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理学院
南京大学信息管理学院
王文龙
[
1
]
论文数:
引用数:
h-index:
机构:
汤刚强
[
1
]
机构
:
[1]
南京大学信息管理学院
[2]
南京政治学院基础部
来源
:
图书与情报
|
2013年
/ 05期
关键词
:
数据清洗;
脏数据;
异常数据检测;
重复记录检测;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
文章对构建数据仓库中的数据清洗研究现状进行了论述。介绍了脏数据的类型与出现原因、数据清洗在国内外的研究现状、定义和对象,重点阐述了属性级异常数据和记录级异常数据的检测与处理算法;总结当前数据清洗研究的不足,并对今后数据清洗的研究进行展望。
引用
收藏
页码:22 / 28
页数:7
相关论文
共 33 条
[1]
数据仓库.[M].(美)[W.H.因曼](W.H.Inmon)著;王志海等译;.机械工业出版社.2000,
[2]
一种基于多阅读器数据冗余的高效RFID数据清洗策略
[J].
论文数:
引用数:
h-index:
机构:
马茜
;
论文数:
引用数:
h-index:
机构:
谷峪
;
论文数:
引用数:
h-index:
机构:
张天成
;
论文数:
引用数:
h-index:
机构:
于戈
.
小型微型计算机系统,
2012,
33
(10)
:2158
-2163
[3]
自适应时间阈值的RFID数据清洗算法
[J].
论文数:
引用数:
h-index:
机构:
潘伟杰
;
李少波
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学教育部现代制造技术重点实验室
中国科学院成都计算机应用研究所
贵州大学教育部现代制造技术重点实验室
李少波
;
论文数:
引用数:
h-index:
机构:
许吉斌
.
制造业自动化,
2012,
34
(13)
:24
-27+36
[4]
中文数据清洗研究综述
[J].
论文数:
引用数:
h-index:
机构:
叶鸥
;
论文数:
引用数:
h-index:
机构:
张璟
;
李军怀
论文数:
0
引用数:
0
h-index:
0
机构:
西安理工大学计算机科学与技术学院
李军怀
.
计算机工程与应用 ,
2012,
(14)
:121
-129
[5]
交通流数据清洗规则研究
[J].
王晓原
论文数:
0
引用数:
0
h-index:
0
机构:
山东理工大学交通与车辆工程学院智能交通研究所
王晓原
;
张敬磊
论文数:
0
引用数:
0
h-index:
0
机构:
山东理工大学交通与车辆工程学院智能交通研究所
张敬磊
;
吴芳
论文数:
0
引用数:
0
h-index:
0
机构:
山东理工大学交通与车辆工程学院智能交通研究所
吴芳
.
计算机工程,
2011,
37
(20)
:191
-193
[6]
分流机制下的RFID不确定数据清洗策略
[J].
论文数:
引用数:
h-index:
机构:
夏秀峰
;
论文数:
引用数:
h-index:
机构:
玄丽娟
;
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空航天大学计算机学院
李晓明
.
计算机科学,
2011,
38(S1)
(S1)
:22
-25
[7]
引入卡尔曼滤波的RFID数据清洗方法
[J].
王妍
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁大学信息学院
王妍
;
论文数:
引用数:
h-index:
机构:
宋宝燕
;
论文数:
引用数:
h-index:
机构:
付菡
;
论文数:
引用数:
h-index:
机构:
李晓光
.
小型微型计算机系统,
2011,
32
(09)
:1794
-1799
[8]
聚类反馈学习的数据清洗研究
[J].
论文数:
引用数:
h-index:
机构:
石彦华
;
李蜀瑜
论文数:
0
引用数:
0
h-index:
0
机构:
陕西师范大学计算机科学学院
李蜀瑜
.
计算机工程与应用,
2011,
47
(30)
:127
-131
[9]
一种有效的多数据源RFID冗余数据清洗技术
[J].
论文数:
引用数:
h-index:
机构:
潘巍
;
李战怀
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
李战怀
;
论文数:
引用数:
h-index:
机构:
聂艳明
;
陈群
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
陈群
.
西北工业大学学报 ,
2011,
(03)
:435
-442
[10]
基于推理机的SCI地址字段数据清洗方法设计
[J].
张晋辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院国家科学图书馆武汉分馆
中国科学院研究生院
张晋辉
;
刘清
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院国家科学图书馆武汉分馆
中国科学院研究生院
刘清
.
情报科学 ,
2010,
(05)
:741
-746
←
1
2
3
4
→
共 33 条
[1]
数据仓库.[M].(美)[W.H.因曼](W.H.Inmon)著;王志海等译;.机械工业出版社.2000,
[2]
一种基于多阅读器数据冗余的高效RFID数据清洗策略
[J].
论文数:
引用数:
h-index:
机构:
马茜
;
论文数:
引用数:
h-index:
机构:
谷峪
;
论文数:
引用数:
h-index:
机构:
张天成
;
论文数:
引用数:
h-index:
机构:
于戈
.
小型微型计算机系统,
2012,
33
(10)
:2158
-2163
[3]
自适应时间阈值的RFID数据清洗算法
[J].
论文数:
引用数:
h-index:
机构:
潘伟杰
;
李少波
论文数:
0
引用数:
0
h-index:
0
机构:
贵州大学教育部现代制造技术重点实验室
中国科学院成都计算机应用研究所
贵州大学教育部现代制造技术重点实验室
李少波
;
论文数:
引用数:
h-index:
机构:
许吉斌
.
制造业自动化,
2012,
34
(13)
:24
-27+36
[4]
中文数据清洗研究综述
[J].
论文数:
引用数:
h-index:
机构:
叶鸥
;
论文数:
引用数:
h-index:
机构:
张璟
;
李军怀
论文数:
0
引用数:
0
h-index:
0
机构:
西安理工大学计算机科学与技术学院
李军怀
.
计算机工程与应用 ,
2012,
(14)
:121
-129
[5]
交通流数据清洗规则研究
[J].
王晓原
论文数:
0
引用数:
0
h-index:
0
机构:
山东理工大学交通与车辆工程学院智能交通研究所
王晓原
;
张敬磊
论文数:
0
引用数:
0
h-index:
0
机构:
山东理工大学交通与车辆工程学院智能交通研究所
张敬磊
;
吴芳
论文数:
0
引用数:
0
h-index:
0
机构:
山东理工大学交通与车辆工程学院智能交通研究所
吴芳
.
计算机工程,
2011,
37
(20)
:191
-193
[6]
分流机制下的RFID不确定数据清洗策略
[J].
论文数:
引用数:
h-index:
机构:
夏秀峰
;
论文数:
引用数:
h-index:
机构:
玄丽娟
;
李晓明
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空航天大学计算机学院
李晓明
.
计算机科学,
2011,
38(S1)
(S1)
:22
-25
[7]
引入卡尔曼滤波的RFID数据清洗方法
[J].
王妍
论文数:
0
引用数:
0
h-index:
0
机构:
辽宁大学信息学院
王妍
;
论文数:
引用数:
h-index:
机构:
宋宝燕
;
论文数:
引用数:
h-index:
机构:
付菡
;
论文数:
引用数:
h-index:
机构:
李晓光
.
小型微型计算机系统,
2011,
32
(09)
:1794
-1799
[8]
聚类反馈学习的数据清洗研究
[J].
论文数:
引用数:
h-index:
机构:
石彦华
;
李蜀瑜
论文数:
0
引用数:
0
h-index:
0
机构:
陕西师范大学计算机科学学院
李蜀瑜
.
计算机工程与应用,
2011,
47
(30)
:127
-131
[9]
一种有效的多数据源RFID冗余数据清洗技术
[J].
论文数:
引用数:
h-index:
机构:
潘巍
;
李战怀
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
李战怀
;
论文数:
引用数:
h-index:
机构:
聂艳明
;
陈群
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学计算机学院
陈群
.
西北工业大学学报 ,
2011,
(03)
:435
-442
[10]
基于推理机的SCI地址字段数据清洗方法设计
[J].
张晋辉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院
中国科学院国家科学图书馆武汉分馆
中国科学院研究生院
张晋辉
;
刘清
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院国家科学图书馆武汉分馆
中国科学院研究生院
刘清
.
情报科学 ,
2010,
(05)
:741
-746
←
1
2
3
4
→