Spark Streaming编程模型

  • 内容
  • 评论
  • 相关

本节将介绍 Spark Streaming 的编程模型,包括 DStream 的操作流程和使用方法。

DStream 的操作流程

DStream 作为 Spark Streaming 的基础抽象,它代表持续性的数据流。这些数据流既可以通过外部输入源来获取,也可以通过现有的 DStream 的 Transformation 操作来获得。

在内部实现上,DStream 由一组时间序列上连续的 RDD 来表示。如图 1 所示,每个 RDD 都包含了自己特定时间间隔内的数据流。

DStream中在时间轴下生成离散的RDD序列
图 1  DStream中在时间轴下生成离散的RDD序列

本文标题:Spark Streaming编程模型

本文地址:https://www.hosteonscn.com/5453.html

评论

0条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注