基于用户反馈的深网数据源选择

被引:3
作者
邓松 [1 ,2 ]
万常选 [1 ,2 ]
刘喜平 [1 ,2 ]
廖国琼 [1 ,2 ]
机构
[1] 江西财经大学信息管理学院
[2] 江西财经大学数据与知识工程江西省高校重点实验室
关键词
用户反馈; 数据质量; 深网; 数据源选择;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在因特网上,每个主题往往拥有成百上千个相关的深网数据源,从众多的数据源中找到合适的源进行数据集成变得越来越重要.传统的考虑源质量的选择方法是不考虑源主题特性的,而是根据经验选取统一的质量维度,因而在不同主题下选择准确性有较大的差异.基于此,提出基于用户反馈的深网源选择方法,依据用户反馈获取特定主题源的核心质量维度从而建立质量评价模型.选取了三个不同主题下的数据源进行了相关的验证,实验结果表明,针对不同主题下的数据源选取,该方法均具有较高的准确性且计算量较少.
引用
收藏
页码:2367 / 2371
页数:5
相关论文
共 6 条
[1]   基于数据质量的Deep Web数据源排序 [J].
余伟 ;
李石君 ;
文利娟 ;
田建伟 .
小型微型计算机系统, 2010, 31 (04) :641-646
[2]   深网数据源质量估计模型 [J].
胡鹏昱 ;
赵朋朋 ;
方巍 ;
崔志明 .
计算机工程, 2009, 35 (09) :204-207
[3]   一种Deep Web数据源质量评估模型 [J].
鲜学丰 ;
方巍 ;
赵朋朋 ;
崔志明 ;
胡鹏昱 .
微电子学与计算机, 2008, (10) :47-50
[4]  
Structured databases on the web [J] . Kevin Chen-Chuan Chang,Bin He,Chengkai Li,Mitesh Patel,Zhen Zhang.&nbsp&nbspACM SIGMOD Record . 2004 (3)
[5]  
Is CORI Effective for Collection Selection an Exploration of parameters,queries,anddata .2 D’’Souza D,Zobel J,Thom J A. Proceedings of Australian Document Computing Symposium (ADCS2004) . 2004
[6]  
Robust Identification of Fuzzy Duplicates .2 S. Chaudhuri,V. Ganti,R. Motwani. Proceedings of the 21st International Conference on Data Engineering (ICDE) . 2005