Spark-Streaming(三)

Spark-Streaming(三)

news2026/3/15 18:49:55

一. kafka和flume的整合

任务需求一:利用flume监控某目录中新生成的文件，将监控到的变更数据发送给kafka，kafka将收到的数据打印到控制台

1. 在flume/conf/目录下添加flume-kafka.conf文件

配置文件如下

2. 启动flume和kafka消费者

3. 传入数据

查看flume和kafka控制台查看结果

任务需求2：Kafka生产者生成的数据利用Flume进行采集，将采集到的数据打印到Flume的控制台上。

1.在flume/conf/目录下配置kafka.flume.conf文件

2. 启动kafka生产者生产数据

启动flume采集kafka生产的数据

可以看到flume已经成功采集kafka生产者的数据

二. DStream转换

DStream 上的操作与 RDD 的类似，分为 Transformations（转换）和 Output Operations（输出）两种，此外转换操作中还有一些比较特殊的原语

无状态转化操作

无状态转化操作就是把简单的 RDD 转化操作应用到每个批次上，也就是转化 DStream 中的每一个 RDD。部分无状态转化操作列在了下表中。

注意，针对键值对的 DStream 转化操作(比如reduceByKey())要添加

import StreamingContext._才能在 Scala 中使用。

Transform

Transform 允许 DStream 上执行任意的 RDD-to-RDD 函数。即使这些函数并没有在 DStream的 API 中暴露出来，通过该函数可以方便的扩展 Spark API。该函数每一批次调度一次。其实也就是对 DStream 中的 RDD 应用转换。

案例演示

1. 编写代码

往9999端口传输数据

2. 运行代码打印9999端口数据

join

两个流之间的 join 需要两个流的批次大小一致，这样才能做到同时触发计算。计算过程就是对当前批次的两个流中各自的 RDD 进行 join，与两个 RDD 的 join 效果相同。

案例演示

1 编写代码运行代码

往9999和8888传输数据

运行结果

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2343489.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

SQLite 是什么？

SQLite 是什么？

📌 一、SQLite 是什么？ SQLite 是一个轻量级、嵌入式数据库，意思是它直接集成在你的 App 内部，不需要单独安装数据库服务端。 ✅ 特点： 特点说明本地使用所有数据保存在手机内部存储文件形式数据以 .db 文件形式存储…

阅读更多...

海之淀攻略

海之淀攻略

家长要做的功课家长可根据孩子情况，需要做好以下功课： 未读小学的家长：了解小学小升初派位初中校额到校在读小学的家长：了解小升初派位初中校额到校在读初中的家长：了解初中校额到校越是高年级的家长，…

阅读更多...

PCIe具体解释分析

PCIe具体解释分析

参考文章 PCIe总线详解_STATEABC-GitCode 开源社区 https://zhuanlan.zhihu.com/p/652808759 PCI总线学习(一)：PCI总线结构-CSDN博客 PCI——第1章——PCI总线的基本知识-CSDN博客计算机中register、cache、memory的区别 - Lines Blog 什么是内存管理单元&#xff…

阅读更多...

Golang | 迭代器模式

Golang | 迭代器模式

迭代器模式（Iterator Pattern）是一种行为型设计模式，它提供了一种顺序访问聚合对象（如列表、树等集合结构）中元素的方法，而无需暴露其底层实现细节。通过将遍历逻辑与集合本身解耦，迭代器模式使…

阅读更多...

使用命令行加密混淆C#程序

使用命令行加密混淆C#程序

C#作为托管语言编译生成的IL中间代码极易被反编译工具还原源码。据统计，超过83%的商业软件曾遭遇过代码逆向风险，导致核心算法泄露、授权被跳过. 因此对于C#语言开发的程序来说, 在发布前进行混淆和加密非常有必要. 本文主要介绍如何使用恒盾C#混淆加密…

阅读更多...

当智驾成标配，车企暗战升级｜2025上海车展

当智驾成标配，车企暗战升级｜2025上海车展

文｜刘俊宏编｜王一粟智能化无处不在的2025年上海车展，回归了卖车的初衷。光锥智能在展会暴走两天，最大的感触是今年的车展少了争奇斗艳，多了些许务实。回顾智能汽车时代的三场重要车展。2023年的上海车展充满了…

阅读更多...

在网上找的资料怎样打印出来？

在网上找的资料怎样打印出来？

在数字化时代，我们经常需要从互联网上获取各种资料，无论是学术论文、工作文档还是学习资料。然而，如何高效地将这些网上的资料打印出来，却是一个值得探讨的问题。本文将为您提供一个全面的解决方案，帮助您轻松完成网上…

阅读更多...

算法训练营 Day1

算法训练营 Day1

努力追上那个曾经被寄予厚望的自己 —— 25.4.25 一、LeetCode_26 删除有序数组中的重复项给你⼀个升序排列的数组 nums ，请你原地删除重复出现的元素，使每个元素只出现⼀次 ，返回删除后数组的新⻓度。元素的相对顺序应该保持⼀致 …

阅读更多...

【linux】Chrony服务器

【linux】Chrony服务器

简介 1.1 时间的重要性由于 IT 系统中，准确的计时非常重要，有很多种原因需要准确计时： 在网络传输中，数据包括和日志需要准确的时间戳各种应用程序中，如订单信息，交易信息等都需要准确的时间戳 1.2 时区…

阅读更多...

技术视界 | 数据的金字塔：从仿真到现实，机器人学习的破局之道

技术视界 | 数据的金字塔：从仿真到现实，机器人学习的破局之道

在人工智能的世界里，有一个共识正逐渐达成——谁掌握了数据，谁就掌握了未来。尤其是在机器人技术迅速演进的今天，“如何让机器人理解世界、学习操作”这一问题的根源，越来越回归到数据本身。正如一座金字塔般，不同层…

阅读更多...

wsl联通外网

wsl联通外网

在C:\Users<你的用户名>下，新建.wslconfig文件添加如下配置（具体配置参考官方文档）： # Settings apply across all Linux distros running on WSL 2 [wsl2]# Limits VM memory to use no more than 4 GB, this can be set …

阅读更多...

shadcn/radix-ui的tooltip高度定制arrow位置

shadcn/radix-ui的tooltip高度定制arrow位置

尝试了半天，后来发现，不支持。。。。。就是不支持那箭头只能居中改side和align都没用，下面有在线实例 https://codesandbox.io/p/sandbox/radix-ui-slider-forked-zgn7hj?file%2Fsrc%2FApp.tsx%3A69%2C21 但是呢， 第一如果…

阅读更多...

【专题刷题】二分查找（二）

【专题刷题】二分查找（二）

📝前言说明： 本专栏主要记录本人的基础算法学习以及LeetCode刷题记录，按专题划分每题主要记录：（1）本人解法本人屎山代码；（2）优质解法优质代码；&#xff…

阅读更多...

C++_数据结构_详解红黑树

C++_数据结构_详解红黑树

✨✨ 欢迎大家来到小伞的大讲堂✨✨ 🎈🎈养成好习惯，先赞后看哦~🎈🎈 所属专栏：C学习小伞的主页：xiaosan_blog 制作不易！点个赞吧！！谢谢喵！&…

阅读更多...

数据结构手撕--【二叉树】

数据结构手撕--【二叉树】

目录定义结构体： 初始化： 手动创建一个二叉树： 前序遍历： 中序遍历： 后序遍历二叉树节点个数： 叶子节点个数： 二叉树第k层节点个数： 二叉树的高度： 查找值为x…

阅读更多...

.NET MAUI 发展历程：从 Xamarin 到现代跨平台应用开发框架

.NET MAUI 发展历程：从 Xamarin 到现代跨平台应用开发框架

文章目录引言Xamarin 起源：MAUI 的前身Xamarin 的创立（2011年）Xamarin Studio 与 Visual Studio 集成（2013年）Xamarin.Forms 的诞生（2014年）微软收购Xamarin（2016年） .N…

阅读更多...

多模态大语言模型arxiv论文略读（四十）

多模态大语言模型arxiv论文略读（四十）

The Wolf Within: Covert Injection of Malice into MLLM Societies via an MLLM Operative ➡️ 论文标题：The Wolf Within: Covert Injection of Malice into MLLM Societies via an MLLM Operative ➡️ 论文作者：Zhen Tan, Chengshuai Zhao, Raha M…

阅读更多...

【蓝桥杯选拔赛真题104】Scratch回文数第十五届蓝桥杯scratch图形化编程少儿编程创意编程选拔赛真题解析

【蓝桥杯选拔赛真题104】Scratch回文数第十五届蓝桥杯scratch图形化编程少儿编程创意编程选拔赛真题解析

目录 scratch回文数一、题目要求 1、准备工作 2、功能实现二、案例分析 1、角色分析 2、背景分析 3、前期准备三、解题思路四、程序编写五、考点分析六、推荐资料 1、scratch资料 2、python资料 3、C++资料 scratch回文数第十五届青少年蓝桥杯scratch编…

阅读更多...

OpenWrt 与 Docker：打造轻量级容器化应用平台技术分享

OpenWrt 与 Docker：打造轻量级容器化应用平台技术分享

文章目录前言一、OpenWrt 与 Docker 的集成前提1.1 硬件与内核要求1.2 软件依赖二、Docker 环境部署与验证2.1 基础服务配置2.2 存储驱动适配三、容器化应用部署实践3.1 资源限制策略3.2 Docker Compose 适配四、性能优化与监控4.1 容器资源监控4.2 镜像精简策略五、典型问…

阅读更多...

C++初阶----模板初阶

C++初阶----模板初阶

引言什么是模板模板是泛型编程的基础，泛型编程是以一种独立于任何特定类型的方式编写代码。模板也是创建泛型类或者函数的蓝图。如：库容器，迭代器和算法，都是泛型编程的例子 1. 泛型编程首先，我们应该了解什么是…

阅读更多...

推荐文章

最新文章