Web数据源选择技术

被引:17
作者
万常选 [1 ,2 ]
邓松 [1 ,2 ]
刘喜平 [1 ,2 ]
廖国琼 [1 ,2 ]
刘德喜 [1 ,2 ]
江腾蛟 [1 ,2 ]
机构
[1] 江西财经大学信息管理学院
[2] 数据与知识工程江西省高校重点实验室(江西财经大学)
关键词
数据集成; Web数据源; 文本; 结构化与半结构化; 源摘要;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在Web数据集成的过程中,如何从大量的Web数据源集合中选择合适数量的数据源,使得在满足特定查询需求的前提下尽可能地减少所需访问的数据源数量,同时保持返回数据结果的高质量,成为Web数据集成中的一个热点问题.以近十几年的研究实践为背景,介绍Web数据源选择的研究沿革及现状,并对Web数据源选择方法进行了归类.分别讨论了基于相关性的和基于质量的数据源选择的研究动机、研究方法和研究成果等,并对相关研究的目标、关键技术、优点和缺点进行了对比分析;最后展望了Web数据源选择未来的研究方向.
引用
收藏
页码:781 / 797
页数:17
相关论文
共 14 条
[1]   基于用户反馈的深网数据源选择 [J].
邓松 ;
万常选 ;
刘喜平 ;
廖国琼 .
小型微型计算机系统, 2012, 33 (11) :2367-2371
[2]   XML关键字检索系统的数据源选择 [J].
朱冠胜 ;
黄浩 ;
杨卫东 .
小型微型计算机系统, 2012, 33 (06) :1183-1188
[3]   基于关键词的深度万维网数据库选择 [J].
范举 ;
周立柱 .
计算机学报, 2011, 34 (10) :1797-1804
[4]   基于数据质量的Deep Web数据源排序 [J].
余伟 ;
李石君 ;
文利娟 ;
田建伟 .
小型微型计算机系统, 2010, 31 (04) :641-646
[5]   基于动态学习的Deep Web数据源选择算法 [J].
段青玲 ;
杨仁刚 ;
华松青 .
郑州大学学报(理学版), 2010, 42 (01) :5-8
[6]   Deep Web数据集成研究综述 [J].
刘伟 ;
孟小峰 ;
孟卫一 .
计算机学报, 2007, (09) :1475-1489
[7]   Efficient Selection and Integration of Hidden Web Database [J].
Xian, Xuefeng ;
Zhao, Pengpeng ;
Yang, Yuanfeng ;
Xin, Jie ;
Cui, Zhiming .
JOURNAL OF COMPUTERS, 2010, 5 (04) :500-507
[8]   An investigation of Zipf's Law for fraud detection (DSS#06-10-1826R(2)) [J].
Huang, Shi-Ming ;
Yen, David C. ;
Yang, Luen-Wei ;
Hua, Jing-Shiuan .
DECISION SUPPORT SYSTEMS, 2008, 46 (01) :70-83
[9]   Classification-aware hidden web text database selection [J].
Ipeirotis, Panagiotis G. ;
Gravano, Luis .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2008, 26 (02)
[10]  
QProber[J] . Luis Gravano,Panagiotis G. Ipeirotis,Mehran Sahami.ACM Transactions on Information Systems (TOIS) . 2003 (1)