Hadoop基础之《（1）—大数据基本概念》

Hadoop基础之《（1）—大数据基本概念》

news2026/3/22 5:08:30

一、Hadoop
1、Hadoop大数据框架，处理分布式环境下数据存储和计算
2、Hadoop的HDFS处理存储
3、Hadoop的MapReduce处理计算
map让任务数据拆分到每一台去执行
reduce处理后的任务合并
4、Hive作用是在Hadoop上能够让用户来写SQL处理数据
Hive的执行引擎，会把SQL语句翻译成一个MapReduce的任务去执行

二、Spark
1、Spark本身也是一个计算框架，它和Hadoop的MapReduce对比（相当于MapReduce升级版）。不同点是Spark是一个基于内存的计算，MapReduce是基于磁盘的计算，Spark速度会比Hadoop快2-3倍
2、Spark也有Spark SQL的这个模块，让用户在Spark的API上面去写SQL

三、Hadoop的HDFS
1、Hadoop的分布式文件存储系统
2、数据分布在许多计算机中以块的形式存储，但是用户看起来就是一块磁盘

四、Hadoop的MapReduce
MapReduce将数据分成多个部分，并在不同的数据节点上分别处理每个部分，然后将各个结果汇总并输出

五、Hadoop的Yarn
1、资源管理器：分配资源
2、节点管理器：处理节点并监控节点中的资源使用情况
3、应用管理器：管理应用
4、容器：包含物理资源的集合

5、处理创建的MapReduce任务
（1）应用管理器从节点管理器请求容器
（2）节点管理器获得资源后，将它们发送给资源管理器
（3）这样Yarn在Hadoop中就可以处理任务请求并管理集群资源

六、Hadoop其他管理、处理、分析工具
Hive、Pig、Spark、Flume、Scoop等等

七、Flink
用于实时计算，可以与yarn集成

八、Hbase
用于海量存储

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/176749.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

深度学习TensorFlow—GPU2.4.0版环境配置，一文简单易懂详细大全，CUDA11.0、cuDNN8.0

深度学习TensorFlow—GPU2.4.0版环境配置，一文简单易懂详细大全，CUDA11.0、cuDNN8.0

深度学习TensorFlow—GPU2.4.0版环境配置，一文简单易懂详细大全，CUDA11.0、cuDNN8.0 前提：电脑拥有英伟达独立显卡!!!，并且安装了anaconda！！！ 前提：电脑拥有英伟达独立显卡!!!&…

阅读更多...

vue事件车之兄弟组件之间传值

vue事件车之兄弟组件之间传值

目录前言一，全局事件总线介绍1.1 原理介绍1.2 x需要满足的条件二，知识点的复习2.1 vc是什么2.2 vm管理vc如何体现2.3 原型2.4 上述知识的串联三，实现需求3.1 x的编写及讲解3.2 使用x四，标准写法4.1 写法改动4.2 销毁五关键代码后…

阅读更多...

兔年首文迎新春-Cesium橘子洲烟花礼赞

兔年首文迎新春-Cesium橘子洲烟花礼赞

兔年新春今天是兔年大年初二，神州大地，在经历了疫情的三年后迎来开放的一个春节。大家都沉浸在欢乐幸福的春节气氛中。玉兔迎新春，祝福齐送到：白兔祝你身体安康，黑兔祝你薪水高涨，灰兔送你梦想如意&#xf…

阅读更多...

Maven高级

Maven高级

Maven高级 1，分模块开发 1.1 分模块开发设计 (1)按照功能拆分我们现在的项目都是在一个模块中，比如前面的SSM整合开发。虽然这样做功能也都实现了，但是也存在了一些问题，我们拿银行的项目为例来聊聊这个事。网络没有那么发…

阅读更多...

Java多线程03——等待唤醒机制(and阻塞队列实现)

Java多线程03——等待唤醒机制(and阻塞队列实现)

目录1.等待唤醒机制1.ThreadDemo2.Desk3.Cook4.Foodie2.等待唤醒机制（阻塞队列方式实现）1.ThreadDemo022.Cook023.Foodie023.线程的状态1.等待唤醒机制生产者和消费者桌子上有食物，消费者吃，桌子上没有食物，消费者等…

阅读更多...

ElasticSearch 索引模板组件模板组合模板详细使用介绍

ElasticSearch 索引模板组件模板组合模板详细使用介绍

索引模板_template 文章目录索引模板_templateTemplate 介绍索引模板Index Template参数说明创建一个索引模板 Index Template测试不存在的索引直接添加数据创建索引总结组合索引模板 Index Template 7.8版本之后引入创建基于组件模板的索引模板 Index Template创建组件模板模拟…

阅读更多...

LeetCode103_ 103. 二叉树的锯齿形层序遍历

LeetCode103_ 103. 二叉树的锯齿形层序遍历

LeetCode103_ 103. 二叉树的锯齿形层序遍历一、描述给你二叉树的根节点 root ，返回其节点值的锯齿形层序遍历。（即先从左往右，再从右往左进行下一层遍历，以此类推，层与层之间交替进行）。示例 1&…

阅读更多...

【头歌】顺序表的基本操作

【头歌】顺序表的基本操作

第1关：顺序表的插入操作任务描述本关任务：编写顺序表的初始化、插入、遍历三个基本操作函数。相关知识顺序表的存储结构顺序表的存储结构可以借助于高级程序设计语言中的数组来表示，一维数组的下标与元素在线性表中的序号相对应。线性表的顺序…

阅读更多...

YOLOv5/v7 引入 YOLOv8 的 C2f 模块

YOLOv5/v7 引入 YOLOv8 的 C2f 模块

YOLOv8 项目地址：https://github.com/ultralytics/ultralytics YOLOv8 Ultralytics YOLOv8 是由 Ultralytics 开发的一个前沿的 SOTA 模型。它在以前成功的 YOLO 版本基础上，引入了新的功能和改进，进一步提升了其性能和灵活性。YOLOv8 基于快…

阅读更多...

C 指针变量取地址符的用法 *指针变量名的用法

C 指针变量取地址符的用法 *指针变量名的用法

文章目录IntroCode图示Intro C语言中有一类特殊的变量：指针变量(pointer variable)，用于存储某个变量的内存地址的值。要打印指针变量一般用%p格式符，会打印出该指针变量的值，即一个内存值。 Code // Created by wuyujin1997 …

阅读更多...

【Linux】进程概念一

【Linux】进程概念一

进程概念一冯诺依曼体系结构我们常见的计算机，如笔记本。我们不常见的计算机，如服务器，大部分都遵守冯诺依曼体系。截止目前为止， 我们所认识的计算机，都是一个个的硬件组成输入设备：包括键盘&#x…

阅读更多...

如何使用JDBC操作数据库？JDBC API的使用详细解读

如何使用JDBC操作数据库？JDBC API的使用详细解读

文章目录1. DriverManager1.1 注册驱动1.2 获取连接2. Connection2.1 获取执行sql的对象2.2 事务管理3. Statement4. ResultSet5. PreparedStatement5.1 sql注入问题5.2 preparedStatement 原理6. 总结Java编程基础教程系列1. DriverManager DriverManager ，驱动管…

阅读更多...

C++模板不支持分离编译的问题

C++模板不支持分离编译的问题

目录前言分离编译模式普通函数的分离编译(正常)模板函数的分离编译(出错)分析解决方式拓展--extern关键字extern"C"extern变量extern模板--控制实例化前言分离编译模式一个项目如果有多个源文件.c组成，每个源文件单独编译，形成目标文件。最…

阅读更多...

Kubernetes:分享一个可以展示资源视图的 K8s开源 Web/桌面客户端工具 Octant

Kubernetes:分享一个可以展示资源视图的 K8s开源 Web/桌面客户端工具 Octant

写在前面博文内容主要为 Octant 介绍以及桌面/Web 端的安装教程涉及 Linux/Windows 的安装。理解不足小伙伴帮忙指正其实当你什么都经历了，会发现，人生无论你怎么精心策划都抵不过一场命运的安排。 Octant 不是仪表板，Octant 是一个带有仪…

阅读更多...

数据结构最短路径课设（源码+实验报告+视频讲解）（不要钱、用了自取）

数据结构最短路径课设（源码+实验报告+视频讲解）（不要钱、用了自取）

XIAN TECHNOLOGICAL UNIVERSITY 课程设计报告实验课程名称算法与数据结构专业： 班级： 姓名： 学号： 实验学时： 指导…

阅读更多...

Linux Debian11安装QT6开发环境

Linux Debian11安装QT6开发环境

从Qt5.14开始，官方不提供离线安装包，只提供源码包和在线安装器。但是清华为我们提供了快速的在线安装方式。一.下载清华提供的在线安装器在线安装器下载链接二、给在线安装器文件赋予执行权限三、配置镜像地址运行安装器清华源： ./…

阅读更多...

7.Java判断和循环+面试相关力扣算法题详解

7.Java判断和循环+面试相关力扣算法题详解

提示： 文章目录前言一、顺序结构二、分支语句(1)if语句(2)switch语句*default的位置和省略:*case穿透*switch新特性*switch和if的第三种格式各自的使用场景三、循环结构1.分类2.for循环3.while循环4.for和while的对比:5.for和while循环的区别:6.练习:四、面试时的两…

阅读更多...

【安卓】zoo for zotero WebDAV 自动论文同步笔记

【安卓】zoo for zotero WebDAV 自动论文同步笔记

前言前言是我写这篇博客的动机，可以跳过直接从“准备”开始看之前使用mendeley管理文献，它不仅可以同步文件，还跨平台（win、安卓等）。但是后面，mendeley停止了移动平台的支持，导致我不能用我…

阅读更多...

JQUERY案例

JQUERY案例

电梯导航 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevice-width, i…

阅读更多...

一、pyhon准备工作篇(黑马程序猿-python学习记录)

一、pyhon准备工作篇(黑马程序猿-python学习记录)

黑马程序猿的python学习视频：https://www.bilibili.com/video/BV1qW4y1a7fU/ 目录 1. python官网 2. 检查是否安装完毕 3. pycharm官网 5. phcharm更换主题 6. 新建第一个python文件 7. pycharm字体大小设置 8. 设置快捷键设置字体大小 …

阅读更多...

推荐文章

最新文章