171-178-Hadoop-源码

news2025/8/12 1:22:06

171-Hadoop-源码:

以了解有印象,动手debug为主。大致流程和思想。

RPC 通信原理解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7NnsHkgy-1669214287074)(png/1625738077346.png)]

1)需求:

模拟 RPC 的客户端、服务端、通信协议三者如何工作的

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8BEoxUxY-1669214287075)(png/1625738091824.png)]

https://gitee.com/HaoZhouRS/bigdata-study-code/tree/master/big-data-study/Hadoop-HDFS/src/main/java/com/zh/study/grpc

NameNode 启动源码解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KAX2jq9A-1669214287075)(png/1625814980277.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LYkAYVG6-1669214287076)(png/1625814992367.png)]

在 pom.xml 中增加如下依赖

<dependencies>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-client</artifactId>
        <version>3.1.3</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-hdfs</artifactId>
        <version>3.1.3</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-hdfs-client</artifactId>
        <version>3.1.3</version>
        <scope>provided</scope>
    </dependency>
</dependencies>

入口

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Hp3AEssR-1669214287076)(png/1625815227665.png)]

初始化org.apache.hadoop.hdfs.server.namenode.NameNode#initialize

启动 HTTP 服务端(9870) org.apache.hadoop.hdfs.server.namenode.NameNode#startHttpServer

加载镜像和编辑日志org.apache.hadoop.hdfs.server.namenode.NameNode#loadNamesystem

初始化NN的RPC 服务端org.apache.hadoop.hdfs.server.namenode.NameNode#createRpcServer

nn启动资源检察(资源路径,磁盘大小,安全模式等)org.apache.hadoop.hdfs.server.namenode.NameNode#startCommonServices

NN对心跳检测org.apache.hadoop.hdfs.server.blockmanagement.DatanodeManager#activate

org.apache.hadoop.hdfs.server.blockmanagement.HeartbeatManager.Monitor#run

安全模式(块的0.999等)org.apache.hadoop.hdfs.server.namenode.FSNamesystem#startCommonServices

DataNode 启动源码解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-W7o0AZAk-1669214287077)(png/1625818315977.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qa7K2mhU-1669214287077)(png/1625818326516.png)]

入口:org.apache.hadoop.hdfs.server.datanode.DataNode#main

创建datanode:org.apache.hadoop.hdfs.server.datanode.DataNode#createDataNode(java.lang.String[], org.apache.hadoop.conf.Configuration, org.apache.hadoop.hdfs.server.datanode.SecureDataNodeStarter.SecureResources)

org.apache.hadoop.hdfs.server.datanode.DataNode#instantiateDataNode(java.lang.String[], org.apache.hadoop.conf.Configuration, org.apache.hadoop.hdfs.server.datanode.SecureDataNodeStarter.SecureResources)

org.apache.hadoop.hdfs.server.datanode.DataNode#runDatanodeDaemon

startdatenode:org.apache.hadoop.hdfs.server.datanode.DataNode#startDataNode

更多自己debug了解流程吧。

HDFS 上传源码解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Uvq6l6Qr-1669214287077)(png/1625818769061.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d5WxGzoA-1669214287078)(png/1625818780417.png)]

Yarn 源码解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-s4XvXDnN-1669214287078)(png/1625818852970.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PuqKOFnn-1669214287078)(png/1625818862075.png)]

Job提交流程源码解析

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4Q7lXFuf-1669214287079)(png/1625818901281.png)]

Hadoop 源码编译

官网下载源码

https://hadoop.apache.org/release/3.1.3.html

修改源码中的 HDFS 副本数的设置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OHTUq045-1669214287079)(png/1625993980646.png)]

CentOS 虚拟机准备

(1)CentOS 联网

配置 CentOS 能连接外网。Linux 虚拟机 ping www.baidu.com 是畅通的

注意:采用 root 角色编译,减少文件夹权限出现问题

(2)Jar 包准备(Hadoop 源码、JDK8、Maven、Ant 、Protobuf)

➢ hadoop-3.1.3-src.tar.gz

➢ jdk-8u212-linux-x64.tar.gz

➢ apache-maven-3.6.3-bin.tar.gz

➢ protobuf-2.5.0.tar.gz(序列化的框架)

➢ cmake-3.17.0.tar.gz

工具包安装

注意:所有操作必须在 root 用户下完成

0)分别创建/opt/software/hadoop_source和/opt/module/hadoop_source 路径

1)上传软件包到指定的目录,例如 /opt/software/hadoop_source

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ed2EIWP6-1669214287079)(png/1625994078229.png)]

2)解压软件包指定的目录,例如: /opt/module/hadoop_source

[root@hadoop101 hadoop_source]$ tar -zxvf apache-maven-3.6.3-bin.tar.gz -C /opt/module/hadoop_source/

[root@hadoop101 hadoop_source]$ tar -zxvf cmake-3.17.0.tar.gz -C /opt/module/hadoop_source/

[root@hadoop101 hadoop_source]$ tar -zxvf hadoop-3.1.3-src.tar.gz -C /opt/module/hadoop_source/

[root@hadoop101 hadoop_source]$ tar -zxvf protobuf-2.5.0.tar.gz -C /opt/module/hadoop_source/

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QWETrU5E-1669214287080)(png/1625994247739.png)]

3)安装 JDK

验证 JDK 是否安装成功

[root@hadoop101 hadoop_source]$ java -version

java version “1.8.0_212”

Java™ SE Runtime Environment (build 1.8.0_212-b10)

Java HotSpot™ 64-Bit Server VM (build 25.212-b10, mixed mode)

4)配置 maven环境变量,maven 镜像,并验证

(1)配置 maven 的环境变量

[root@hadoop101 hadoop_source]# vim /etc/profile.d/my_env.sh

#MAVEN_HOME

MAVEN_HOME=/opt/module/hadoop_source/apache-maven-3.6.3

PATH= P A T H : PATH: PATH:JAVA_HOME/bin:$MAVEN_HOME/bin

[root@hadoop101 hadoop_source]# source /etc/profile

(2)修改 maven 的镜像

[root@hadoop101 apache-maven-3.6.3]# vi conf/settings.xml

# 在 mirrors 节点中添加阿里云镜像
<mirrors>
 <mirror>
 <id>nexus-aliyun</id>
 <mirrorOf>central</mirrorOf>
 <name>Nexus aliyun</name>
 
<url>http://maven.aliyun.com/nexus/content/groups/public</url>
 </mirror>
</mirrors>

(3)验证 maven 安装是否成功

[root@hadoop101 hadoop_source]# mvn -version

Apache Maven 3.6.3 (cecedd343002696d0abb50b32b541b8a6ba2883f)

Maven home: /opt/module/hadoop_source/apache-maven-3.6.3

Java version:

1.8.0_212, vendor: Oracle Corporation, runtime:

/opt/module/hadoop_source/jdk1.8.0_212/jre

Default locale: zh_CN, platform encoding: UTF-8

OS name: “linux”, version: “3.10.0-862.el7.x86_64”, arch: “amd64”, family:

“unix”

5)安装相关的依赖(注意安装顺序不可乱,可能会出现依赖找不到问题)

(1)安装 gcc make

[root@hadoop101 hadoop_source]# yum install -y gcc* make

(2)安装压缩工具

[root@hadoop101 hadoop_source]# yum -y install snappy* bzip2* lzo* zlib* lz4* gzip*

(3)安装一些基本工具

[root@hadoop101 hadoop_source]# yum -y install openssl* svn ncurses* autoconf automake libtool

(4)安装扩展源,才可安装 zstd

[root@hadoop101 hadoop_source]# yum -y install epel-release

(5)安装 zstd

[root@hadoop101 hadoop_source]# yum -y install zstd

6)手动安装 cmake

(1)在解压好的 cmake 目录下,执行./bootstrap 进行编译,此过程需一小时请耐心等待

[root@hadoop101 cmake-3.17.0]$ pwd

/opt/module/hadoop_source/cmake-3.17.0

[atguigu@hadoop101 cmake-3.17.0]$ ./bootstrap

(2)执行安装

[root@hadoop101 cmake-3.17.0]$ make && make install

(3)验证安装是否成功

[root@hadoop101 cmake-3.17.0]$ cmake -version

cmake version 3.17.0

CMake suite maintained and supported by Kitware (kitware.com/cmake).

7)安装 protobuf,进入到解压后的 protobuf 目录

[root@hadoop101 protobuf-2.5.0]$ pwd

/opt/module/hadoop_source/protobuf-2.5.0

(1)依次执行下列命令 --prefix 指定安装到当前目录

[root@hadoop101 protobuf-2.5.0]$ ./configure --prefix=/opt/module/hadoop_source/protobuf-2.5.0

[root@hadoop101 protobuf-2.5.0]$ make && make install

(2)配置环境变量

[root@hadoop101 protobuf-2.5.0]$ vim /etc/profile.d/my_env.sh

输入如下内容

PROTOC_HOME=/opt/module/hadoop_source/protobuf-2.5.0

PATH= P A T H : PATH: PATH:JAVA_HOME/bin: M A V E N H O M E / b i n : MAVEN_HOME/bin: MAVENHOME/bin:PROTOC_HOME/bin

(3)验证

[root@hadoop101 protobuf-2.5.0]$ source /etc/profile

[root@hadoop101 protobuf-2.5.0]$ protoc --version

libprotoc 2.5.0

8)软件包安装配置工作完成。

编译源码

1)进入解压后的 Hadoop 源码目录下

[root@hadoop101 hadoop-3.1.3-src]$ pwd

/opt/module/hadoop_source/hadoop-3.1.3-src

#开始编译

[root@hadoop101 hadoop-3.1.3-src]$ mvn clean package -DskipTests -Pdist,native -Dtar

注:中间过程很久,有时候好像会断网,依赖下载不全,最终安装成功,借鉴尚硅谷视频。结果如下。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tjdnDjan-1669214287080)(png/1625995942075.png)]

成功的 64 位 hadoop 包在/opt/module/hadoop_source/hadoop-3.1.3-src/hadoop-dist/target 下

[root@hadoop101 target]# pwd

/opt/module/hadoop_source/hadoop-3.1.3-src/hadoop-dist/target

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bTRkrwL4-1669214287080)(png/1625995996809.png)]

学习路径:https://space.bilibili.com/302417610/,如有侵权,请联系q进行删除:3623472230

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/33653.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

视频转换软件哪个好?万兴优转-支持超过1000种格式转换和输出

想必大家都知道&#xff0c;视频的格式分为很多种&#xff0c;而且不同设备能够播放的视频格式也各不相同&#xff0c;就比如PC端和mac端&#xff0c;其就有很大的不兼容问题。在日常工作中&#xff0c;我们往往将一个视频发给了对方&#xff0c;但对方却因为设备的差异而无法直…

023.二叉树的最近公共祖先

题目链接&#xff1a; 236. 二叉树的最近公共祖先 大概思路&#xff1a; 题目要求&#xff1a; 给定一个二叉树, 找到该树中两个指定节点q&#xff0c;p的最近公共祖先x。&#xff08;q、p一定存在且值不同&#xff09; 最近公共祖先&#xff1a; 两个节点共同的祖先&…

为什么浏览器控制台(Console)运行JavaScript代码有时会出现“undefined”?

为什么浏览器控制台&#xff08;Console&#xff09;运行JavaScript代码有时会出现“undefined”&#xff1f; 浏览器“控制台”&#xff08;console&#xff09;使用简介 about:blank是打开浏览器空白页的命令——内置在浏览器中的命令&#xff0c;可以打开浏览器空白页&…

SpringAMQP WorkQueue消息队列模型的理解与使用

原理分析 Work Queue&#xff0c;故名思意&#xff0c;工作队列&#xff0c;互相配合工作。适用于消息密集型消息队列的场景&#xff0c;如下图所示&#xff0c;queue中存在着大量的消息&#xff0c;而消费者有续配合工作&#xff0c;消息队列有阅后即焚的特点&#xff0c;所以…

【Spring Cloud实战】Spring Cloud Alibaba Sentinel熔断与限流 (最全讲解,附源码)

gitee地址&#xff1a;https://gitee.com/javaxiaobear/spring-cloud_study.git 在线阅读地址&#xff1a;https://javaxiaobear.gitee.io/ 1、简介 Sentinel 是面向分布式服务架构的流量控制组件&#xff0c;主要以流量为切入点&#xff0c;从流量控制、熔断降级、系统自适应保…

【车载开发系列】CAN总线知识入门篇

【车载开发系列】CAN总线知识入门篇 【车载开发系列】CAN总线知识入门篇【车载开发系列】CAN总线知识入门篇一.总线是什么二.CAN总线是什么三.CAN总线的传输介质四.CAN协议的特性有哪些五.CAN出现的背景六.CAN通信总线的作用七.CAN协议柔软性体现在哪里八.CAN总线的仲裁机制九.…

11月24日:fastadmin根目录下其他文件

addons下的两个文件 其一&#xff1a;.gitkeep 其二&#xff1a;.htaccess application中的common文件 pubilc文件中的uploads runtime中的文件解析 vendor和composer.json的关系 根目录下.gitgnore中的相关标准 composer.json和composer.lock之间的关系 主要是承接之前的fast…

面向对象之抽象类的认识 - (java语法)

文章目录前言1. 什么是抽象类1.1 抽象类与普通类的不同&#xff1a;1.2 子类继承抽象类总结✨✨✨学习的道路很枯燥&#xff0c;希望我们能并肩走下来&#xff01; 编程真是一件很奇妙的东西。你只是浅尝辄止&#xff0c;那么只会觉得枯燥乏味&#xff0c;像对待任务似的应付它…

基于JSP的民宿酒店预约管理系统【数据库设计、源码、开题报告】

数据库脚本下载地址&#xff1a; https://download.csdn.net/download/itrjxxs_com/86466879 主要使用技术 SpringStruts2HibernateJSPCSSJSMysql 功能介绍 后台管理&#xff1a; 修改密码&#xff1a;修改个人密码&#xff1b; 会员信息管理&#xff1a;查看会员基本信息并…

C# 学习之路(C# 编程概述)

C# 学习之路&#xff08;C# 编程概述&#xff09; 前记&#xff1a;C# 学习之路&#xff0c;是我跟着 C# 图解教程(第五版) 学习的笔记&#xff0c;每一章都会有一篇笔记发出&#xff0c;小标题会对应书本的章节标题。 .NET 6 和之前的版本相比在顶级语句方面有很大的变化&…

【内网渗透】记一次靶机实战

一、信息收集 1.端口扫描 使用nmap进行端口扫描&#xff0c;发现其开放了22、80、8080、9000端口。 访问其8080端口&#xff0c;发现是一个web界面。 浏览页面内容&#xff0c;提升有一些提示。 【一一帮助安全学习&#xff0c;所有资源获取处一一】 ①网络安全学习路线…

vue2升级vue3的新变化

目录1、组合式API和setup语法糖definePropsdefineEmitsdefineExpose其他2、响应式原理ref和reactiverefreactivetoReftoRefs3、computed和watchcomputedwatchwatchEffect4、v-modelv-model参数v-model修饰符5、key6、v-if和v-for的优先级对比7、异步组件vue 作者&#xff08;尤…

天宇优配|医药股反弹受阻 公募乐观态度不改

历经前期继续反弹后&#xff0c;医药板块11月23日呈现大幅回调&#xff0c;相关细分赛道指数均有所下行&#xff0c;跌幅超越9%的相关个股更是不在少数。 国庆以来这轮医药反弹行情是否就此结束&#xff1f;对此&#xff0c;公募最新预判指出&#xff0c;23日医药板块回调与商场…

mp4视频格式转换器工具,万兴优转-多功能视音频处理软件

MP4是一种大众熟知的视频格式其优势在于在所有的播放器上都能够基本适用因此对于一些较为特殊的视频格式往往都需要将其转换为MP4视频格式才能够在播放器上正常播放。 那么怎样才能将这些特殊的视频格式转换为常用的mp4视频格式呢&#xff1f;这就需要用到mp4视频格式转换器工具…

用于useradd创建用户的规则文件-尚文网络xUP楠哥

~~全文共1026字&#xff0c;阅读需约5分钟。 进Q群11372462&#xff0c;领取专属报名福利&#xff0c;包含云计算学习路线图代表性实战训练大厂云计算面试题资料! # Linux创建普通用户 找来一台Linux系统&#xff0c;首先&#xff0c;执行useradd命令&#xff0c;不加任何参数…

力扣(LeetCode)65. 有效数字(C++)

模拟 面向测试用例的编程&#xff0c;想象到了工程开发的画面。改需求&#xff0c;代码也可以精简&#xff01; 首先判断首位正负号&#xff0c;去除正负号&#xff0c;如果只有一个正负号字符&#xff0c;false。 判断 ′.′.′.′ &#xff0c;如果是单独的 ′.′.′.′ &a…

PS软件下载安装以基本配置

先访问地址 PS下载地址 下载需要付费 给你的下载地址链接一定要保存好 然后根据自己的电脑系统和配置选择一个适合自己的 最后 会下下来一个解压包 然后 我们在 一个盘下 注意 不要用C盘 这里我选择D盘 创建一个文件夹 叫PS设计工具 然后将解压包解压到对应的 PS开发工具文…

第五章 神经网络(下)

5.3 误差逆传播算法 多层网络地学习能力比单层感知机强的多。欲训练多层网络&#xff0c;之前的简单感知机学习规则显然不够用了&#xff0c;需要更强大的学习算法。误差逆传播&#xff08;error BackPropagation&#xff0c;简称BP&#xff09;算法就是其中最杰出的代表。现实…

CPU受限直接执行

目录 1. 虚拟化CPU 2. 进程 2.1 进程的机器状态 2.2 进程创建 2.3 进程的状态 3. 受限直接执行 3.1 直接执行 3.2 受限制的操作 3.3 在进程之间切换 3.3.1 协作方式&#xff1a;等待系统调用 3.3.2 非协作方式&#xff1a;操作系统进行控制 3.3.3 保存和恢复上下…

油藏生产业务+机器学习代理优化算法

前前处理&#xff0c;把后台需要的参数都读出来。写进name.txt 生成新的sch文件&#xff0c;需要在data里追加新sch名字 没改变的井就不用重新卸载关键字里了。 重启动模型&#xff1a;制作出来是空的&#xff0c;得自己加别的东西 模型要准确&#xff0c;否则不好和历史模型…