【大数据】NiFi 中的重要术语

【大数据】NiFi 中的重要术语

news2026/5/7 18:50:59

NiFi 中的重要术语

1.Flow Controller
2.Processor
3.Connection
4.Controller Service
5.Process Group
6.FlowFile

那些一个个黑匣子称为 Processor，它们通过称为 Connection 的队列交换名为 FlowFile 的信息块。最后，FlowFile Controller 负责管理这些组件之间的资源。

在这里插入图片描述

1.Flow Controller

在 NIFI 的代码架构设计中有一个模块叫 Extension，这个模块里包含了以下我们说的 Processor、Controller Service 等等可扩展的部分。Flow Controller 是将一切融合在一起的粘合剂。它为处理器分配和管理线程。

在这里插入图片描述

2.Processor

处理器是执行操作的黑匣子。处理器可以访问 FlowFile 的属性和内容来执行所有类型的操作。它们使你能够在数据输入，标准数据转换 / 验证任务中执行许多操作，并将这些数据保存到各种数据接收器。

3.Connection

Connection 是处理器之间的队列。这些队列允许处理器以不同的速率进行交互，就像存在不同尺寸的水管。 Connection 可以具有不同的容量。

如果 FlowFiles 的数量或数据量超过定义的阈值，则将触发背压机制（backpressure）。在队列中没有空间之前，Flow Controller 不会安排 Connection 上游的处理器再次运行。

4.Controller Service

例如数据库连接池或云服务提供商凭据。Controller Service 是守护进程（daemons）。它们在后台运行，并提供配置，资源和参数供处理器执行。

5.Process Group

一堆处理器及其连接可以组成一个 Process Group。你添加了一个 Input Port 和一个 Output Port，以便 Process Group 可以接收和发送数据。

6.FlowFile

在这里插入图片描述
FlowFile 分为两个部分：

Attributes：即键 / 值对。例如，文件名，文件路径和唯一标识符是标准属性。
Content：对字节流的引用构成了 FlowFile 内容。

FlowFile 不包含数据本身，否则会严重限制 pipeline 的吞吐量。相反，FlowFile 保留的是一个指针，该指针引用存储在本地存储中某个位置的数据。这个地方称为 内容存储库（Content Repository）。

当处理器修改 FlowFile 的内容时，将保留先前的数据。NIFI 的 copies-on-write 机制会在将内容复制到新位置时对其进行修改。原始信息保留在内容存储库中。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1175275.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

隐私安全｜隐私安全已从国家法律法规转向商业企业应用，如何理解以及落地建设，相信大家正在经历隐私安全的困扰

隐私安全｜隐私安全已从国家法律法规转向商业企业应用，如何理解以及落地建设，相信大家正在经历隐私安全的困扰

网络空间的隐私安全主要是指网络隐私权不受侵犯，网络隐私权是指自然人在网上享有的，与公共利益无关的个人活动领域与个人信息秘密依法受到保护，不被他人非法侵扰，知悉收集，利用和公开的一种人格权，也包括第…

阅读更多...

基于鹰栖息算法的无人机航迹规划-附代码

基于鹰栖息算法的无人机航迹规划-附代码

基于鹰栖息算法的无人机航迹规划文章目录基于鹰栖息算法的无人机航迹规划1.鹰栖息搜索算法2.无人机飞行环境建模3.无人机航迹规划建模4.实验结果4.1地图创建4.2 航迹规划 5.参考文献6.Matlab代码摘要：本文主要介绍利用鹰栖息算法来优化无人机航迹规划。 1.鹰栖息…

阅读更多...

ActiveMq学习⑧__ActiveMQ的消息持久化机制

ActiveMq学习⑧__ActiveMQ的消息持久化机制

ActiveMQ的消息存储和持久化 MQ的高可用事务持久签收可持久化 （类似于与mq消息的同步机制） 为了避免意外宕机以后丢失信息，需要做到重启后可以恢复消息队列，消息系统一半都会采用持久化机制。 ActiveMQ的消息持久化机制 Act…

阅读更多...

canvas实现刮奖功能

canvas实现刮奖功能

canvas刮奖原理很简单，就是在刮奖区添加两个canvas，第一个canvas用于显示刮开后显示的内容，可以是一张图片或一个字符串，第二个canvas用于显示涂层，可以用一张图片或用纯色填充，第二个canvas覆盖在第一个ca…

阅读更多...

逆向学习记录（5）刷机

逆向学习记录（5）刷机

首要前提：手机刷机必须OEM解锁（BL解锁），否则不能刷机！ 1、根据手机机型下载手机系统包，首次登陆网址需要同意协议。然后在右侧选机型，中间就出来各种适合本机型的系统。下载网址 https://dev…

阅读更多...

47基于matlab的水印提取，将水印和载体进行图像融合

47基于matlab的水印提取，将水印和载体进行图像融合

基于matlab的水印提取，将水印和载体进行图像融合，成为一体，可对合成图像进行加噪处理，剪切处理，小波压缩处理，旋转处理等操作，最后对合成图像实现水印提取，程序已调通，可…

阅读更多...

【AI好好玩02】利用Lama Cleaner本地实现AIGC试玩：擦除对象、替换对象、更换风格等等

【AI好好玩02】利用Lama Cleaner本地实现AIGC试玩：擦除对象、替换对象、更换风格等等

目录一、安装二、擦除功能1. LaMa模型实操实例一：去除路人实操实例二：去水印实操实例三：老照片修复 2. LDM模型3. ZITS模型4. MAT模型5. FcF模型6. Manga模型三、替换对象功能1. sd1.52. sd23. anything44. realisticVision1.45. 四个模型的…

阅读更多...

Tomcat安装配置教程

Tomcat安装配置教程

目录 1、安装tomcat1.1、查看JDK版本1.2、匹配对应的JDK版本1.3、下载Tomcat1.3.1、安装包版（推荐，不用配环境）1.3.2、压缩包版 2、运行Tomcat3、不能运行问题 1、安装tomcat 1.1、查看JDK版本由于不同版本tomcat对于jdk的版本有要求…

阅读更多...

Mac 下安装golang环境

Mac 下安装golang环境

一、下载安装包安装包下载地址下载完成，直接继续----->下一步到结束即可安装成功； 安装成功之后，验证一下； go version二、配置环境变量终端输入vim ~/.zshrc进入配置文件，输入i进行编辑打开的不管是空文本…

阅读更多...

redis教程二 redis客户端Jedis使用

redis教程二 redis客户端Jedis使用

文章目录 Redis的Java客户端-JedisJedis快速入门创建工程：引入依赖：建立连接测试：释放资源Jedis连接池创建Jedis的连接池改造原始代码 Redis的Java客户端-SpringDataRedis快速入门导入pom坐标配置文件测试代码数据序列化器StringRedisTempla…

阅读更多...

“第六十一天”

“第六十一天”

这三个也算一类的，减和加的处理差不多，不过这个题多了限制是被减数大于减数，要是想再完整一点，可以把小于的情况也考虑进去，不过这个我是如果被减数小于减数的话，我就用减数加被减数，然后最后打…

阅读更多...

JVM 各个参数详解

JVM 各个参数详解

在一些规模稍大的应用中，Java虚拟机（JVM）的内存设置尤为重要，想在项目中取得好的效率，GC（垃圾回收）的设置是第一步。 PermGen space：全称是Permanent Generation space.就是说是永久…

阅读更多...

ActiveMq学习⑤__ActiveMq的Broker

ActiveMq学习⑤__ActiveMq的Broker

ActiveMq的Broker 是什么？ 相当于一个ActiveMq的服务器实例 Broker其实就是实现了用代码的形式启动ActiveMQ将MQ嵌入到Java 代码中，以便随时用随时启动，在用的时候再去启动这样节省了资源，也保证了可靠性。按照不同的配置文件…

阅读更多...

线程的创建、等待、退出

线程的创建、等待、退出

多线程开发在Linux平台上已经有成熟的pthread库支持，所以使用pthread库在编译时要加上-pthread。其设计的多线程开发的基本概念主要包含3点：线程、互斥锁、条件。其中线程操作又分线程的创建、退出、等待三种。互斥锁包含4种操作，分别是创建、…

阅读更多...

线程同步——互斥量解锁、解锁

线程同步——互斥量解锁、解锁

类似与进程间通信信号量的加锁解锁。对互斥量进行加锁后，任何其他试图在此对互斥量加锁的线程都会被阻塞，直到当前线程释放该互斥锁。如果释放互斥锁时有多个线程被阻塞，所有在该互斥锁上的阻塞线程都会变成可运行状态，第一个变…

阅读更多...

《算计》

《算计》

第一章：机器的诞生在一个科技高度发达的未来世界，人类社会已经进入了自主机器时代。人们创造出了一种名为“超级自主机器（Super Autonomous Machine，简称SAM）”的全新型机器，它拥有无限的智慧和学习能力&a…

阅读更多...

LeetCode.6 N字形变换

LeetCode.6 N字形变换

一开始想的是真的创建一个数组去按照题目所给的要求填入数据最后输出不为空的数组项但是不仅时间复杂度高而且错误频繁出现最终也没有提交成功查阅题解后发现数组并不重要假设我们忽略掉数组中的那些空白项最终输出的结果就是numRows行的字符串的拼接 string conver…

阅读更多...

基于Matlab的yolo算法行人检测系统

基于Matlab的yolo算法行人检测系统

欢迎大家点赞、收藏、关注、评论啦 ，由于篇幅有限，只展示了部分核心代码。文章目录一项目简介二、功能三、系统四. 总结一项目简介 # 基于Matlab编写的Yolo算法行人检测系统介绍基于Matlab编写的Yolo算法行人检测系统是一种用于自动检测图像或视频…

阅读更多...

SAP中接口与集成

SAP中接口与集成

从进化的角度看SAP中接口和集成的十个概念 - 知乎 SAP比较常用的几个接口方式及比较-SAP技术站 1. 文件接口基于文件交换的接口是从SAP向第三方系统提供数据的最古老的技术之一。将文本或excel文件推送到特定目录或从应用程序服务器中提取；两种方式都有效。在没有…

阅读更多...

[云原生2. ] Kubernetes的简单介绍

[云原生2. ] Kubernetes的简单介绍

文章目录 1. Kubernetes 概述1.1 简介1.2 作用1.3 Kubernetes 的特点1.4 Kubernetes 主要功能 2. Kubernetes 集群架构与组件2.1 Master 组件2.1.1 Kube-apiserver2.1.2 Kube-controller-manager2.1.3 Kube-scheduler 2.2 配置存储中心2.2.1 etcd 2.3. Node 组件2.3.1 Kubelet2…

阅读更多...

推荐文章

最新文章