HBase MapReduce处理分布式数据

  • 内容
  • 评论
  • 相关

MapReduce 是 Hadoop 框架的重要组成部分,是在可扩展的方式下处理超过 TB 级数据的分布式处理的组件。它遵循分而治之的原则,通过将数据拆分到分布式文件系统中的不同机器上, 让服务器能够尽快直接访问和处理数据,最终合并全局结果。

以下图所示网站点击率排行为例,简单介绍 MapReduce 处理数据的过程。

本文标题:HBase MapReduce处理分布式数据

本文地址:http://www.hosteonscn.com/7426.html

评论

0条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注