大数据分区管理模型及其应用研究

被引:11
作者
张文燚 [1 ]
项连志 [2 ]
王小芳 [1 ]
机构
[1] 哈尔滨工程大学电子政务建模仿真国家工程实验室
[2] 哈尔滨工程大学计算机科学与技术学院
关键词
大数据; 形式化数据分区; 本地充足; 痕迹代数; 结构化状态关系代数; 多结构化状态关系代数; 范畴;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对大数据分区管理技术缺乏普遍适用的形式化数据分区模型的问题,引入一个包含痕迹代数系统、结构化状态关系代数系统、多结构化状态关系代数系统的大数据范畴,作为支持大数据分区管理及其相关应用研究的基础理论模型;在此基础上,给出了以满足"本地充足"为目标的,由基于活动场景和实体实例标识的大数据切片规则,以及面向活动场景的切片分配规则构成的,支持大数据分区管理和快速查询响应的形式化数据分区模型TSEI-PS。TSEI-PS已经在住房和城乡建设部的信息资源统一规划和国家住房信息系统建设中得到了应用。
引用
收藏
页码:353 / 360
页数:8
相关论文
共 7 条
[1]  
范畴论[M]. 科学出版社 , 贺伟著, 2006
[2]  
隐秩序[M]. 上海科技教育出版社[美]约翰·H.霍兰(JohnH.Holland)著, 2000
[3]  
MapReduce[J] . Jeffrey Dean,Sanjay Ghemawat.Communications of the ACM . 2008 (1)
[4]  
The Google file system[J] . Sanjay Ghemawat,Howard Gobioff,Shun-Tak Leung.ACM SIGOPS Operating Systems Review . 2003 (5)
[5]  
Distributing a database for parallelism[J] . E. Wong,R. H. Katz.ACM SIGMOD Record . 1983 (4)
[6]   A RELATIONAL MODEL OF DATA FOR LARGE SHARED DATA BANKS [J].
CODD, EF .
COMMUNICATIONS OF THE ACM, 1970, 13 (06) :377-&
[7]  
Database partitioning in a cluster of processors .2 SACCA D,WIEDERHOLD G. VLDB . 1983