Understanding of Spark Structured Streaming Execution via Source Code [通过源码理解Spark的结构化流执行]
Spark 2.0引入了更高级别的新的流处理API,叫做Structured Streaming[结构化流]。本文通过Spark的源代码来理解具体的Structured Streaming的执行过程。本文使用的是Spark 2.4.0的源代码。Structured Streaming相关的源代码存在于sql
文件夹中。