数据集成中不一致性数据相似性比较的加权算法

被引:1
作者
张艳秋
徐六通
王柏
机构
[1] 北京邮电大学计算机科学与技术学院
[2] 北京邮电大学计算机科学与技术学院 北京
[3] 北京
关键词
Data integration; Similarity coefficient; Weight integration; Cluster;
D O I
暂无
中图分类号
TP311.1 [程序设计];
学科分类号
081202 ; 0835 ;
摘要
<正> 数据集成是将不同存储平台的数据经过清洁转换等整合过程,以同一形式和内容呈现出来,它解决了多个应用系统或同一系统的不同数据存储共享数据的要求。集成中存在的一个主要困难是数据不一致,即同一数据在各个数据源的表现值不相同。这种不一致性严重影响了集成后目标库的数据质量。如果是数据仓库,还可能进一步影响基于数据仓库之上的OLAP和数据挖掘。因此,消除不一致数据是提高集成质量的关键。
引用
收藏
页码:92+186 / 92 +186
页数:2
相关论文
empty
未找到相关数据