jupyter中安装scala和spark内核详细教程

news2025/7/6 20:42:02

jupyter中安装scala和spark内核

jupyter中安装scala和spark内核

文章目录

  • jupyter中安装scala和spark内核
    • 一、前期准备
    • 二、安装
      • (一)Anaconda
        • 1、文件上传到Linux系统上
          • 方法一:
        • 方法二:使用wget
        • 2、安装Anaconda
        • 3、激活环境
        • 4、jupyter
      • (二)Scala内核
        • 1、文件上传到Linux系统上
          • 方法一:
          • 方法二:使用wget
        • 2、将文件进行解压
        • 3、安裝scala内核
        • 4、验证内核
      • (三)spark内核
        • 1、安装spark内核
        • 2、安装sparkSQL内核
        • 3、验证内核
        • 补充知识:

在jupyter中安装scala和spark的内核,主要是通过jupyter来编写scala和spark的代码,安装成功后就可以编写一些scala、SparkSQL、Spark的代码。

在这里插入图片描述

一、前期准备

提前下载:

  • Anaconda3-5.3.1-Linux-x86_64.sh
    • anaconda清华大学开源软件镜像站 ,可以选择自己需要下载版本
  • jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz 这里我准备的是最新scala 内核的文件
    • jupyter-scala其他版本

提前安装好spark,并且启动

二、安装

(一)Anaconda

使用Anaconda中自带的jupyter,而且Anaconda中集成了众多包

1、文件上传到Linux系统上

方法一:

将提前下载好的Anacoda,通过rz命令上传到centos中,我是使用的是SecureCRT来连接centos

我一般将文件上传到/opt/software

[andy@hadoop1 ~]$ cd /opt/software/
[andy@hadoop1 software]$ rz
rz waiting to receive.
Starting zmodem transfer.  Press Ctrl+C to cancel.

选择文件就可以上传

在这里插入图片描述

方法二:使用wget

使用wget在centos中下载Anaconda

wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-5.3.1-Linux-x86_64.sh

2、安装Anaconda

执行安装命令

bash Anaconda3-5.3.1-Linux-x86_64.sh

可以一直按Enter,一直到需要输入yes或者no的时候,输入yes

在这里插入图片描述

选择Anaconda的安装位置,默认是在执行安装命令的用户家目录下,可以更换位置或者不更换。

在这里插入图片描述

然后是Anaconda的初始化,一定要输入yes

就此安装成功

3、激活环境

命令:

source activate base
[andy@hadoop1 software]$ source activate base
(base) [andy@hadoop1 software]$ 

激活成功后,会出现(base)

注意:这点环境一定要激活,后面的安装需要使用到

4、jupyter

如果直接执行jupyter notebook,只能在本地运行,但是想过将jupyter在windows上运行,需指定ip地址

jupyter notebook --ip=0.0.0.0

在这里插入图片描述

在这里插入图片描述

(二)Scala内核

安装scala内核,主要是为了练习scala时使用,如果用spark的scala来练习scala,内核需要消耗大量的资源,因此安装scala内核

1、文件上传到Linux系统上

方法一:

将下载好的jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz,通过rz命令上传到centos

一般将文件上传到/opt/software

cd /opt/software
rz
方法二:使用wget
wget https://oss.sonatype.org/content/repositories/snapshots/com/github/alexarchambault/jupyter/jupyter-scala-cli_2.11.6/0.2.0-SNAPSHOT/jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz

2、将文件进行解压

将文件解压到/opt/module/

 tar -zxvf jupyter-scala_2.11.6-0.2.0-SNAPSHOT.tar.xz -C /opt/module/

在这里插入图片描述

3、安裝scala内核

执行命令:

进入到解压路径中

cd /opt/module/
jupyter-scala_2.11.6-0.2.0-SNAPSHOT/bin/jupyter-scala

运行情况:

(base) [andy@hadoop1 ~]$ cd /opt/module/
(base) [andy@hadoop1 module]$ jupyter-scala_2.11.6-0.2.0-SNAPSHOT/bin/jupyter-scala

在这里插入图片描述

4、验证内核

查看jupyter中的内核:

jupyter kernelspec list

在这里插入图片描述

(三)spark内核

安装spark和sparkSQL

需要提前安装toree

pip install toree

1、安装spark内核

jupyter toree install --spark_opts='--master=spark://hadoop1:7077' --user --kernel_name=Spark3.0.2 --spark_home=/opt/module/spark-yarn
  • spark_opts:是指spark使用的方法,这点是standalone模型(独立部署),这点可以看spark教程

  • kernel_name:是spark的版本

    • 可以通过spark-shell来查看

      在这里插入图片描述

  • spark_home:spark的安装位置

    需要修改成自己的

2、安装sparkSQL内核

jupyter toree install --spark_opts='--master=spark://hadoop1:7077' --user --kernel_name=Spark3.0.2 --spark_home=/opt/module/spark-yarn --interpreters=SQL

3、验证内核

查看jupyter中的内核:

jupyter kernelspec list

在这里插入图片描述

补充知识:

  • 删除内核

    jupyter kernelspec remove 环境名
    
  • 命令参考 — conda 22.9.0 文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/37129.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一文剖析Linux内核中内存管理

Linux中内存管理 内存管理的主要工作就是对物理内存进行组织,然后对物理内存的分配和回收。但是Linux引入了虚拟地址的概念。 文章推荐: 关于如何快速学好,学懂Linux内核。内含学习路线 需要多久才能看完linux内核源码? ​​…

windows位图绘制(显示位图资源)LoadBitmap、CreateCompatibleDC、BitBlt、StretchBlt

位图绘制 位图相关 光栅图形-记录图像中每一点的颜色等信息。 矢量图形-记录图像算法、绘图指令等。 HBITMAP-位图句柄 位图的适用 1.在资源中添加位图资源(在vs中点鼠标增加) 2.在资源中加载位图LoadBitmap 3.创建一个与当前DC相匹配的DC(内…

Js逆向教程-13浏览器和JS的关系/伪造浏览器环境 )

作者:虚坏叔叔 博客:https://xuhss.com 早餐店不会开到晚上,想吃的人早就来了!😄 Js逆向教程-13浏览器和JS的关系/伪造浏览器环境 ) 一、浏览器必然包含几个部分: 显示区域、输入网址、刷新按钮DOMBOM运行…

计算机网络笔记【面试】

计算机网络笔记【面试】前言推荐计算机网络笔记二、基础篇三、HTTP篇四、TCP 篇4.1 TCP 三次握手与四次挥手面试题什么是 TCP ?UDP 和 TCP 有什么区别呢?分别的应用场景是?TCP 连接建立TCP 三次握手过程是怎样的?为什么是三次握手…

Aspose.Slides 21.11.0 For .NET Crack

适用于 .NET 的 Aspose.Slides 用于 PowerPoint 文件格式的 .NET API 在 .NET C# 中读取、写入、修改、合并、克隆、保护和转换 PowerPoint 和 OpenOffice 演示文稿,无需任何外部软件。 Aspose.Slides for .NET 是一个用于 PowerPoint 和 OpenOffice 格式的演示文稿…

Linux Mint 的更新管理器现在支持 Flatpak

导读Linux Mint 的更新管理器变得更有用了! Linux Mint 的更新管理器是该发行版的一个重要组成部分,它使新用户可以获得更为方便简易的体验。 最近的一次更新 Linux Mint 21 推出了许多改进,包括更新管理器对 Flatpak 的支持。 你只需要更新…

【每周CV论文推荐】初学模型蒸馏值得阅读的文章

欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。模型蒸馏是非常重要的模型压缩方法,在学术界研究非常广泛,本次我们来简…

HTML5期末考核大作业网站——卫生与健康HTML+CSS+JavaScript

🎀 精彩专栏推荐👇🏻👇🏻👇🏻 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业…

SpringBoot SpringBoot 原理篇 1 自动配置 1.14 自动配置思想

SpringBoot 【黑马程序员SpringBoot2全套视频教程,springboot零基础到项目实战(spring boot2完整版)】 SpringBoot 原理篇 文章目录SpringBootSpringBoot 原理篇1 自动配置1.14 自动配置思想1.14.1 自动配置原理1 自动配置 1.14 自动配置思…

LeetCode_dijkstra 算法_困难_882.细分图中的可到达节点

目录1.题目2.思路3.代码实现(Java)1.题目 给你一个无向图(原始图),图中有 n 个节点,编号从 0 到 n - 1。你决定将图中的每条边细分为一条节点链,每条边之间的新节点数各不相同。 图用由边组成…

使用 Next.js 搭建 Monorepo 组件库文档

文章为稀土掘金技术社区首发签约文章,14 天内禁止转载,14 天后未获授权禁止转载,侵权必究! 阅读本文你将: 使用 pnpm 搭建一个 Monorepo 组件库使用 Next.js 开发一个组件库文档changesets 来管理包的 version 和生成…

Linux进程总结详解(上——初识)

Linux进程 文章目录Linux进程前言——先从硬件和软件谈起一、冯诺依曼体系结构二、操作系统概念一、进程介绍概念进程控制块查看进程通过系统创建进程二、进程状态1.内核代码如下:总结前言——先从硬件和软件谈起 一、冯诺依曼体系结构 定义:数学家冯诺…

【数据结构】二叉树的遍历

目录☀️二叉树的构建☀️二叉树的遍历🌻前序遍历🌻中序遍历🌻后序遍历☀️完整代码展示☀️二叉树的构建 便于理解二叉树的遍历,这里我们手动简单构建一个二叉树,当然,此处二叉树的构建并不是真正二叉树的…

C++类与对象(一)

目录 一、面向过程和面向对象认识 二、类的引入 三、类的定义 类的两种定义方式: 四、类的访问限定符及封装 4.1 访问限定符 4.2 封装 五、类的作用域 六、类的实例化 七、类对象模型 7.1 如何计算类对象的大小​​​​​ 7.2 类对象的存储方式 7.3 结…

SpringBoot+Mybaits搭建通用管理系统实例十一:数据缓存功能实现

一、本章内容 使用ehcache实现系统缓存功能,并配置实现mybatis的二级缓存,自定义分页缓存的key,识别实体类型,并根据实体属性的配置,组合生成key值用于标识缓存数据。 完整课程地址二、开发视频 SpringBoot+Mybaits搭建通用管理系统实例三:缓存管理功能实现 三、缓存配置 …

滚动吧,数字

朋友有个需求关于金币滚动效果,网上也有很多教程;但多不太符合他的需求,所有利用空余时间帮他做了一个通用组件。 效果图如下: 1、按照次数和速度进行,对应的滚动效果。 2、缓动效果可以根据自己的情况进行修改。 项目地址&#x…

windows安装VMware虚拟机(附带CentOS7部署)

软件下载 链接:https://pan.baidu.com/s/1Vw2Bilf9uf-EYR6_MR86aA?pwdd2qr 提取码:d2qr VMware安装 通你上述链接下载VMware安装包,没有特别选项,选安装位置无脑下一步安装,安装完成后会提示你输入激活码&#xf…

Java中的OpenCV-图像处理

我们将在本文中介绍以下高级图像处理操作:Canny 边缘检测轮廓和形状识别Canny 边缘检测:Canny 边缘检测是一种流行的边缘检测算法。它是由 John F. Canny 在 1986 年开发的。它是一个多阶段算法,我们将按如下方式经历每个阶段:噪声…

Java与GitLab OpenAPI交互

通过Gitlab Open api代码来操作代码的合并及关闭&#xff0c;项目的模板生成........ 方式一&#xff1a; 使用java-gitlab-api(推荐) 接口文档Java Gitlab API Documentation <dependency> <groupId>org.gitlab</groupId> <art…

49 多个 classloader 加载的同类限定名的Class 在 jhat 中显示不全

前言 呵呵 这是在之前 排查一个 flink 的相关问题的时候 发现的一个问题 flink 默认的 job 隔离是基于 Classloader 来进行隔离的 直到 最近才有时间来看一下 这个问题的原因, 究其代码 也还是比较容易找到 大致记录一下 以下内容, 截图 基于 jdk8 测试用例 /*** …