数据集成中不一致性数据相似性比较的加权算法

被引：1

作者：

张艳秋

徐六通

王柏

机构：

[1] 北京邮电大学计算机科学与技术学院

[2] 北京邮电大学计算机科学与技术学院北京

[3] 北京

来源：

计算机科学 | 2003年 / 08期

关键词：

Data integration; Similarity coefficient; Weight integration; Cluster;

D O I：

暂无

中图分类号：

TP311.1 [程序设计];

学科分类号：

081202 ; 0835 ;

摘要：

<正> 数据集成是将不同存储平台的数据经过清洁转换等整合过程,以同一形式和内容呈现出来,它解决了多个应用系统或同一系统的不同数据存储共享数据的要求。集成中存在的一个主要困难是数据不一致,即同一数据在各个数据源的表现值不相同。这种不一致性严重影响了集成后目标库的数据质量。如果是数据仓库,还可能进一步影响基于数据仓库之上的OLAP和数据挖掘。因此,消除不一致数据是提高集成质量的关键。

引用

页码：92+186 / 92 +186

页数：2