基于Hadoop的XML查询

被引:1
作者
鲁春松
机构
[1] 北京锐安科技有限公司
关键词
XML; 大数据; Hadoop MapReduce;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
XML(Extensible Markup Language)可扩展标记语言,指的是用于标记电子文件并且可以使其具有结构性的标记语言,它的主要作用是标记数据和定义数据类型,是一种允许用户对自己的标记语言进行定义的语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML比其他格式数据要占用较多的空间,但XML对于初学者简单并且较易掌握和使用。XML是互联网环境中跨平台的、依赖于文本本身的技术,是当前处理结构化文档信息的有力工具。随着互联网的兴起,海量数据存储与处理是互联网公司必须面对的问题之一。因此,Hadoop受到Yahoo等主流IT公司的青睐。社交网络和Web2.0的兴起使得数据,尤其是非结构化数据呈现指数级增长,云计算和移动互联网的趋势更是加剧了这一增长势头,然而,传统的数据库却基本不太可能处理如此海量的非结构化数据,因此在大数据平台技术中,Hadoop成为处理海量数据的有力工具。
引用
收藏
页码:143 / 144
页数:2
相关论文
共 4 条
[1]  
实战Hadoop.[M].刘鹏; 主编.电子工业出版社.2011,
[2]  
基于MapReduce框架的频繁项集挖掘算法研究.[D].刘士佳.哈尔滨理工大学.2015, 07
[3]  
基于Map/Reduce的分布式智能搜索引擎框架研究.[D].付志超.武汉理工大学.2008, 05
[4]  
面向对象的XML数据管理技术研究.[D].张晓琳.东北大学.2006, 12