Windows环境部署Hadoop-3.3.2和Spark3.3.2

Windows环境部署Hadoop-3.3.2和Spark3.3.2

news2026/5/22 12:22:38

目录

一、Windows环境部署Hadoop-3.3.2

1.CMD管理员解压Hadoop压缩包

2.配置系统环境变量

3.下载hadoop winutils文件

4.修改D:\server\hadoop-3.3.2\etc\hadoop目录下的配置文件

(1)core-site.xml

(2)hdfs-site.xml

(3)mapred-site.xml

(4)yarn-site.xml

(5)workers

(6)hadoop-env.cmd

5.初始化hadoop

6.启动Hadoop

7.进入浏览器查看

二、Windows环境部署Spark-3.3.2

1.下载压缩包

2.解压后配置环境变量

3.进入spark-shell

4.进入浏览器

一、Windows环境部署Hadoop-3.3.2

1.CMD管理员解压Hadoop压缩包

不可以直接用winRAR，会报错

输入命令

start winrar x -y 压缩包 压缩路径


例如,将xx.tar.gz解压到当前目录
cd xxx								// 进入到xx.tar.gz目录下
start winrar x -y xx.tar.gz ./		// 即可

##############################################

start winrar x -y hadoop-3.3.2.tar.gz ./

2.配置系统环境变量

PATH中添加

3.下载hadoop winutils文件

下载链接：https://github.com/cdarlint/winutils

选择hadoop3.2.2的bin包即可

下载并解压后，将winutils里面的bin目录中所有的文件复制到hadoop-3.3.2/bin目录下，注意不要直接替换整个bin目录，是把bin下的文件复制过去

4.修改D:\server\hadoop-3.3.2\etc\hadoop目录下的配置文件

(1)core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/D:/server/hadoop-3.3.2/data/tmp</value> 
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

(2)hdfs-site.xml

<configuration>
    <!-- 这个参数设置为1，因为是单机版hadoop -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/D:/server/hadoop-3.3.2/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/D:/server/hadoop-3.3.2/data/datanode</value>
    </property>
</configuration>

(3)mapred-site.xml

<configuration>
    <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
    </property>
    <property>
       <name>mapred.job.tracker</name>
       <value>hdfs://localhost:9001</value>
    </property>
</configuration>

(4)yarn-site.xml

<configuration>
	 <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
	<property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hahoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

(5)workers

localhost

(6)hadoop-env.cmd

# 大约在24行左右

@rem The java implementation to use.  Required.
set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_333
# 注意java目录要改成PROGRA~1的位置


# 大约在在最后一行
set HADOOP_IDENT_STRING=%"USERNAME"%

5.初始化hadoop

管理员运行CMD

Microsoft Windows [版本 10.0.19045.4046]
(c) Microsoft Corporation。保留所有权利。

C:\WINDOWS\system32>D:

D:\>cd server\hadoop-3.3.2

D:\server\hadoop-3.3.2>hadoop version
Hadoop 3.3.2
Source code repository git@github.com:apache/hadoop.git -r 0bcb014209e219273cb6fd4152df7df713cbac61
Compiled by chao on 2022-02-21T18:39Z
Compiled with protoc 3.7.1
From source with checksum 4b40fff8bb27201ba07b6fa5651217fb
This command was run using /D:/server/hadoop-3.3.2/share/hadoop/common/hadoop-common-3.3.2.jar



D:\server\hadoop-3.3.2>hdfs namenode -format

6.启动Hadoop

D:\server\hadoop-3.3.2>cd sbin

D:\server\hadoop-3.3.2\sbin>start-all.cmd
This script is Deprecated. Instead use start-dfs.cmd and start-yarn.cmd
starting yarn daemons

会出现4个窗口

7.进入浏览器查看

localhost:9870

localhost:8088

二、Windows环境部署Spark-3.3.2

1.下载压缩包

Index of /dist/spark/spark-3.3.2

2.解压后配置环境变量

解压命令和上面的解压hadoop命令一样

配置环境变量：

PATH路径添加%SPARK_HOME%\bin

3.进入spark-shell

4.进入浏览器

localhost:4040

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1508804.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Extended Feature Pyramid Network for SmallObject Detection

Extended Feature Pyramid Network for SmallObject Detection

摘要各种尺度的特征耦合会削弱小对象的性能，本文中，我们提出了具有超高分辨率金字塔的扩展特征金字塔网络（EFPN ），专门用于小目标检测。具体来说，我们设计了一个新模块，称为特征纹理转移&#…

阅读更多...

智能测径仪的精度主要依赖什么

智能测径仪的精度主要依赖什么

关键字：智能测径仪镜头洁净度，智能测径仪系统自检，测径仪智能降温，智能测径仪远程升级，智能测径仪算法改进， 智能测径仪的精度保证主要依赖于以下几个方面： 智能监测镜头的洁净度：智…

阅读更多...

二，几何相交---4，BO算法---（2）比较和排序

二，几何相交---4，BO算法---（2）比较和排序

在某一时刻xt，扫描线从左到右时，一部分线段会与扫描线相交，此时此刻，线段可以分成高低顺序， 那么对于给定两条线段，是如何变化的呢？有两个端点，左端点和右端点， 三种情况…

阅读更多...

dubbo 总结

dubbo 总结

1.dubbon 基本使用 <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">&l…

阅读更多...

计算机网络-第5章运输层（2）

计算机网络-第5章运输层（2）

5.6 TCP可靠传输实现以字节为单位的滑动窗口。发送窗口已满，停止发送。发送和接收的数据都来自缓存。超时重传时间RTO选择：自适应算法， 选择确认SACK：只传送缺少的数据。大多数实现还是重传所有未被确认的数据块。 5.7 TCP的…

阅读更多...

sheng的学习笔记- AI-类别不平衡问题

sheng的学习笔记- AI-类别不平衡问题

目录：sheng的学习笔记-AI目录-CSDN博客什么是类别不平衡问题类别不平衡（class-imbalance），也叫数据倾斜，数据不平衡，就是指分类任务中不同类别的训练样例数目差别很大的情况。例如有998个反例&#xf…

阅读更多...

C 嵌入式系统设计模式 24：安全性和可靠性介绍

C 嵌入式系统设计模式 24：安全性和可靠性介绍

本书的原著为：《Design Patterns for Embedded Systems in C ——An Embedded Software Engineering Toolkit 》，讲解的是嵌入式系统设计模式，是一本不可多得的好书。本系列描述我对书中内容的理解。本文章描述嵌入式安全性和可靠性模式之一…

阅读更多...

ERP实施顾问面试题目

ERP实施顾问面试题目

02什么是BOM和ECN？它们的完整英文拼写是什么？什么是替代料？（10分） BOM物料清单是英文Bill of Material的简写；ECN工程变更通知单是英文Engineering Change Notice的简写；替代料：由于…

阅读更多...

vscode中解决驱动编写的时候static int __init chrdev_init()报错的问题

vscode中解决驱动编写的时候static int __init chrdev_init()报错的问题

目录错误出错原因解决方法错误在入口函数上，出现 expected a ; 这样的提示出错原因缺少了 __KERNEL __ 宏定义解决方法补上__KERNEL__宏定义具体做法：在vscode中按下ctrlshiftp ，输入：C/C:Edit Configurations&#xff0…

阅读更多...

JMM(Java Memory Model)内存模型

JMM(Java Memory Model)内存模型

Java内存模型，规范了计算机内存与java虚拟机之间的协调工作，即规定了将java 虚拟机中的变量存储到内存中和从内从中取出来的内存细节。 Java内存模型中规定了所有的变量都存储在内存中，每条线程还有自己的工作内存，线程对变量的…

阅读更多...

Exception异常处理

Exception异常处理

1. 两种异常处理机制 1.1 使用 throw 关键字手动抛出异常使用throw关键字抛出异常，代码会的显得简单明了如下图所示 1.2 使用 try-catch 捕获异常使用try-catch进行捕获异常，往往会使代码变得更加笼统，层层包裹如下图所示 2. 自定义…

阅读更多...

大数据 - Spark系列《十三》- spark集群部署模式

大数据 - Spark系列《十三》- spark集群部署模式

Spark系列文章： 大数据 - Spark系列《一》- 从Hadoop到Spark：大数据计算引擎的演进-CSDN博客大数据 - Spark系列《二》- 关于Spark在Idea中的一些常用配置-CSDN博客大数据 - Spark系列《三》- 加载各种数据源创建RDD-CSDN博客大数据 - Spark系列《…

阅读更多...

【pycharm使用ssh连接服务器】

【pycharm使用ssh连接服务器】

2、pycharm使用ssh连接服务器 1、具体流程2、一些需要注意的小问题2.1 更改代码地址2.2 本地代码上传到服务器2.3 在服务器的环境中上新安装库，但是pycharm检测不到 1、具体流程打开pycharm – File – Setting 输入服务器的IP地址，端口号、登录账号名…

阅读更多...

qt如何配置ros环境

qt如何配置ros环境

在Qt5.7的版本可以使用bash -i -c来启动qt，让Qt自己识别系统环境，不知道为什么Qt在之后的版本，这样使用都失效了。因为它会默认把CMAKE_PREFIX_PATH修改掉。网上还有安装ros插件版本的qt creator，感觉失去了一些灵活性。自己测试…

阅读更多...

连接端口和连接端口转换OrCAD补丁

连接端口和连接端口转换OrCAD补丁

来介绍此功能之前先复习一下一些OrCAD的基础知识。说到连通两个器件，有什么办法呢？最直接的就是用线连通。比如下面这两个器件需要连通，我们可以直接用线Place wire连接。但是如果这两个器件由于某些原因，他们之间相隔很远&…

阅读更多...

Milvus的相似度指标

Milvus的相似度指标

官网：https://milvus.io/docs/metric.md版本: v2.3.x 在 Milvus 中，相似度度量用于衡量向量之间的相似度。选择良好的距离度量有助于显着提高分类和聚类性能。下表展示了这些广泛使用的相似性指标如何与各种输入数据形式和 Milvus 索引相匹配。一、浮…

阅读更多...

大语言模型：Large Language Models Are Human-Level Prompt Engineers概述

大语言模型：Large Language Models Are Human-Level Prompt Engineers概述

研究内容如何通过prompt，在不进行微调大语言模型的前提下，增加大语言模型的表现研究动机 prompt非常有用，但是人工设置的非常不自然；因此提出了要自动使用大语言模型自己选择prompt；取得了很好的效果。作者主要…

阅读更多...

java异常概述及自定义处理

java异常概述及自定义处理

前言学到异常了，本来以为处理异常只是避免bug，结果发现还可以为了编程需要自定义异常。打好基础，daydayup! 异常什么是异常异常就是代表程序出现的问题异常的体系异常体系指的是java开发人员为了方便程序员使用所开发的异常类&#xff…

阅读更多...

一文彻底搞懂MySQL建表规范

一文彻底搞懂MySQL建表规范

文章目录 1. 表设计规范2. 索引规范3. SQL语句规范4. 散表规范 1. 表设计规范库名、表名、字段名使用小写字母，使用“_”分割，不超过12个字符。使用InnoDB存储引擎。存储精确浮点数使用DECIMAL替代FLOAT和DOUBLE。使用UNSIGNED存储非负数值&#xff0c…

阅读更多...

Linux基础学习：常用命令

Linux基础学习：常用命令

目录结构及其常用命令处理目录的常用命令： ls ：列出目录及文件名cd：切换目录pwd：显示目前的目录mkdir：创建一个新的目录rmdir：删除一个空的目录cp：复制文件或目录rm：删除文件或目录…

阅读更多...

推荐文章

最新文章