• HBase MapReduce处理分布式数据

    MapReduce 是 Hadoop 框架的重要组成部分,是在可扩展的方式下处理超过 TB 级数据的分布式处理的组件。它遵循分而治之的原则,通过将数据拆分到分布式文件系统中的不同机器上, 让服务器能够尽快直接访问和处理数据,最终合并全局结果。

    以下图所示网站点击率排行为例,简单介绍 MapReduce 处理数据的过程。

更多...

加载中...