Spark Streaming简介

  • 内容
  • 评论
  • 相关

Spark Streaming 是 Spark 核心 API 的一个扩展,可以实现高吞吐量的、具备容错机制的实时流数据的处理。

Spark Streaming 支持从多种数据源获取数据,包括 Kafka、Flume、Twitter、ZeroMQ、Kinesis 以及 TCP Sockets。从数据源获取数据之后,可以使用诸如 map、reduce、join 和 window 等高级函数进行复杂算法的处理,最后还可以将处理结果存储到文件系统、数据库和现场仪表盘中。

在 Spark 统一环境的基础上,可以使用 Spark 的其他子框架,如机器学习、图计算等,对流数据进行处理。Spark Streaming 处理的数据流如图 1 所示。

Spark Streaming处理的数据流示意
图 1  Spark Streaming处理的数据流示意

本文标题:Spark Streaming简介

本文地址:https://www.hosteonscn.com/5448.html

评论

0条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注