云环境下科学工作流的溯源数据收集和查询框架研究

被引:7
作者
魏银珍
邓仲华
机构
[1] 武汉大学信息管理学院
关键词
云计算; 溯源; 科学工作流; 数据收集;
D O I
10.16353/j.cnki.1000-7490.2015.07.022
中图分类号
TP311.52 [];
学科分类号
摘要
在大数据时代,科学研究第四范式已经成为一种根本研究范式,云计算可以解决数据密集型科学研究中数据的存储、管理、注解和共享等,但仍然存在一些全新的挑战。文章提出云计算环境下科学工作流的数据溯源基本框架,详细阐述了该框架模型中溯源数据的收集、存储、查询的设计。这个溯源框架对科学工作流本身的性能无显著影响,具有最小入侵性;同时,允许用户指定从3个不同层级收集和查询溯源信息,来保证溯源的保真度,提高数据溯源的灵活性。
引用
收藏
页码:115 / 118+114 +114
页数:5
相关论文
共 4 条
  • [1] Scalable SQL and NoSQL data stores.[J].Rick Cattell.ACM SIGMOD Record.2011, 4
  • [2] Karma2: Provenance management for data-driven workflows
    Simmhan, Yogesh L.
    Plale, Beth
    Gannon, Dennis
    [J]. INTERNATIONAL JOURNAL OF WEB SERVICES RESEARCH, 2008, 5 (02) : 1 - 22
  • [3] Provenance trails in the Wings/Pegasus system.[J].Jihie Kim;Ewa Deelman;Yolanda Gil;Gaurang Mehta;Varun Ratnakar.Concurrency and Computation: Practice and Experience.2008, 5
  • [4] Extracting causal graphs from an open provenance data model
    Miles, Simon
    Groth, Paul
    Munroe, Steve
    Jiang, Sheng
    Assandri, Thibaut
    Moreau, Luc
    [J]. CONCURRENCY AND COMPUTATION-PRACTICE & EXPERIENCE, 2008, 20 (05) : 577 - 586