前言
一个 Flink 程序,其实就是对 DataStream 的各种转换。具体来说,代码基本上都由以下几部分构成,如下图所示:
- 获取执行环境(execution environment)
 - 读取数据源(source)
 - 定义基于数据的转换操作(transformations)
 - 定义计算结果的输出位置(sink)
 - 触发程序执行(execute)
 
本篇博客主要用DataStream API开发Flink常见的数据源开发。

 Flink想要处理数据,先得有数据,所以首要任务就是把数据读进来。
Flink 可以从各种来源获取数据,然后构建 DataStream 进行转换处理。一般将数据的输入来源称为数据源(data source),而读取数据的算子就是源算子(source operator)。所以,source就是我们整个处理程序的输入端。
Flink 代码中通用的添加 source 的方式,是调用执行环境的 addSource()方法:
DataStream<String> stream = env.addSource(...);
 
方法传入一个对象参数,需要实现 SourceFunction 接口;返回 DataStreamSource。这里的
 DataStreamSource 类继承自 SingleOutp







![Python入门级 [ 继上篇 进阶版 持续更新中哞哞哞!!! ]例题较多](https://i-blog.csdnimg.cn/direct/05f6336183bf4f2a9f515426d12f2312.png)











