Slurm作业管理系统常用命令和教程

news2025/7/20 17:18:59

Slurm ( Simple Linux Utility for Resource Management )是开源的、具有容错性和高度可扩展大型和小型 Linux集群资源管理和作业调度系统。超级计算系统可利用 Slurm 进行资源和作业管理,以避免相互干扰,提高运行效率。所有需运行的作业无论是用于程序调试还是业务计算均必须通过交互式并行 srun、批处理式 sbatch 或分配式 salloc 等命令提交,提交后可以利用相关命令查询作业状态等。

同时北鲲云超算平台也是使用的Slurm作业管理系统,熟悉slurm作业管理系统的同学可以快速上手北鲲云进行计算,不熟悉的也没关系,一是可以学,我们有完整的教程以及技术支持服务,另外就是平台还提供模板提交方式,无需it基础也可以快速进行计算。直接按照模板提示提交作业即可。多种软件覆盖多个行业,欢迎来试一试。

一. 常用命令​

sinfo       #查看分区状态
squeue      #查看队列中的作业
scontrol    #查看作业详细信息
scancel     #取消已经提交的作业
sbatch      #批处理式提交作业
salloc      #分配式运行作业
  1. 查看分区状态​
sinfo

CPU分区命名规则为c-核心数-每核心内存大小,如c-8-4:表示单节点规格为8核,每核心有4G内存,即节点规格为8核32G。

GPU分区命名规则为g-卡号-每节点卡数,如g-v100-2:表示有两张显卡型号为tesla v100的gpu节点。
在这里插入图片描述

  1. 查看作业队列​
squeue
JOBID:作业号

ST:状态 (R:运行中;CF:配置中;PD:排队中)。
在这里插入图片描述

  1. 查看所有作业详细信息​
scontrol show jobs

在这里插入图片描述

  1. 取消作业号为20的作业​
scancel 20

二. 提交作业的方式​

  1. 使用sbatch批处理模式提交作业​

sbatch命令可以提交任务至一个或多个计算节点,实现并行计算。

sbatch命令的一些常用选项:

在这里插入图片描述

参考运行程序:demo.sh

#!/bin/bashsleep 6000

提交示例:

使用2个4核心节点启动8个并行任务。

sbatch -N 2 -p c-4-1 -n 8 -c 1 demo.sh

1个4核心节点启动4个并行任务。

sbatch -N 1 -p c-4-1 -n 4 -c 1 demo.sh

1个4核心节点启动4个并行任务。

sbatch -p c-4-1 -n 4 demo.sh

1个4核心节点启动1个并行任务, 该任务使用4个cpu核心。

sbatch -p c-4-1 -n 1 -c 4 demo.sh

2个4核心节点启动2个并行任务, 每个任务使用4个cpu核心。

sbatch -p c-4-1 -n 2 -c 4 demo.sh
  1. 使用salloc分配模式提交作业​

salloc命令可以用来分配节点,用户可以在获取分配的计算节点后,ssh进入直接运行相关计算程序,主要用来调式程序执行。

使用步骤(案例):

Step1. salloc申请计算节点;

salloc -N 1 -p c-8-2 &

Step2. ssh登录到分配的计算节点;

ssh c-8-2-worker0001

Step3. 调试或运行程序;

./demo.sh

Step4. 结束程序运行后释放分配的节点;

scancel 17

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/7913.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

charles

charles中文名叫青花瓷,是一款基于HTTP协议的代理服务器。通过电脑或浏览器的代理来截取请求和请求结果,达到抓包并进行数据分析的目的。charles可以截取HTTP和HTTPS的网络封包,支持重发网络请求、修改网络请求参数、流量控制等场景 安装 由…

LeetCode刷题(python版)——Topic65.有效数字

一、题设 有效数字(按顺序)可以分成以下几个部分: 一个 小数 或者 整数(可选)一个 e 或 E ,后面跟着一个 整数 小数(按顺序)可以分成以下几个部分: (可选&…

Vue:搭建前端项目-----我给你打个样

如果文章对你有帮助欢迎【关注❤️❤️❤️点赞👍👍👍收藏⭐⭐⭐】一键三连!一起努力! 家人们好久不见,这次我们继续上干货,我们来介绍一下如何使用vue搭建一个前端项目; 在这里我会…

pytest fixture 中的使用包信scope skip conftest.py 和参数化等功能使用

pytest中所谓的夹具: fixture scope参数详解: scope: 表示fixture共享夹具的范围,有以下五个范围 function 功能: 在函数或方法运行时执行fixture函数的功能 默认作用域 class 功能:在类运行时调用一次。…

Mindspore网络构建

网络构建 神经网络模型是由神经网络层和Tensor操作构成的,mindspore.nn提供了常见神经网络层的实现,在MindSpore中,Cell类是构建所有网络的基类,也是网络的基本单元。一个神经网络模型表示为一个Cell,它由不同的子Cell…

【python】常见的正则表达式用法;匹配字符串

本文仅仅展现了python正则表达式中的一小部分内容,但是包含了实际应用中非常被频繁使用的例子,本文重在举例,即不需要相关语法知识就能够会用~ 目录re.match()re.findall()匹配两个字符串之间的字符串并返回匹配某字符串之前/之后的所有字符串…

matlab使用NCL提供的colormap

一、自带的colormap matlab默认提供了几个基础的colormap,比如常见的jet和parula matlab里调用colormap的命令是 colormap(jet) jet到底代表什么呢。 可以看到其表示n*3的矩阵,数字介于0-1之间,分别代表红绿蓝。 二、m_map的colormap m_…

数据库系统概论第六章(关系数据理论)知识点总结(2)—— 码的概念总结

本专栏收录了数据库的知识点,而从本文起,将讲述有关于关系数据理论中的第一范式、第二范式、第三范式以及BC范式有关知识点,提供给有需要的小伙伴进行学习,本专栏地址可以戳下面链接查看 🎈 数据库知识点总结&#xff…

今年的数据安全风险点是什么?看数据

2022年已接近尾声,降低数据安全风险,加强防御能力依然是政企发展中的重点和目标。 2022年全球网络安全、数据安全事件频发,钓鱼、勒索、欺诈等复合攻击层出不穷,这里对2022年部分时间段的数据进行统计,并且这一趋势很…

基于微信小程序的高校餐厅食品留样管理系统设计与实现-计算机毕业设计源码+LW文档

小程序开发说明 开发语言:Java 框架:ssm JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7(一定要5.7版本) 数据库工具:Navicat11 开发软件:eclipse/myeclipse/idea Mav…

图形学-几何-曲线与曲面

1.什么是曲线 我们使用一系列的点去定义一条曲线。这些控制点描述了曲线的一些性质。最常见的曲线叫做贝塞尔曲线(Bzier Curve)。 1.1 贝塞尔的画法 在三个点的情况下。在二维情况下,使用三个控制点画出的贝塞尔曲线称为二次贝塞尔曲线&am…

第三节.常用Linux命令—文件和目录

第三节.常用Linux命令—文件和目录 1.查看目录内容:ls 1).功能: 列出目录的内容 2).常用选项: 参数含义-a显示指定目录下所有子目录和文件,包含隐藏文件(以 开头的文件)-l以列表形式显示文件的详细信息-h配合 -l 以人性化的方式显示文件大小 3).计算机中文件大小…

【数据结构初阶】(栈和队列)图文详解四道oj+三道easy概念题

你也会感到孤独吗? 文章目录一、队列和栈的接口二、有效的括号2.1 思路呈现2.2 代码呈现细节讲解三、用队列实现栈3.1 思路呈现3.2 代码呈现细节讲解3.3 总结四、用栈实现队列4.1 思路呈现4.2 代码呈现细节讲解4.3 总结五、设计循环队列5.1 思路呈现5.2 数组5.3 链表…

海思3559AV100 gdb+gdbserver调试·基础篇

问题描述 随着程序越来越复杂,单靠输出信息调试程序已然是不合适的,所以必须考虑使用gdb调试,由于板子上比较难加载代码,所以最合适的办法应该是gdbgdbserver远程调试,这样我们可以清楚地看到程序的运行信息。gdb官方…

第三章 组合逻辑电路

思维导图 笔记 组合逻辑电路 电路在任意时刻的输出状态仅由该时刻的输入信号决定,与电路在此信号输入之前的状态无关。 组合逻辑电路的分析 分析步骤 ①根据逻辑电路图,写出输出逻辑函数的表达式 ②根据逻辑表达式,列出真值表 ③由真值表或…

前端动画的另一种方式 json动画

前言 一谈到前端动画,最先想到的就是css3,当然这是其中一种方式,甚至有许多动画库,aniamte.css就是其中的一种。 我之前也谈到过三种做前端动画的方式 https://blog.csdn.net/glorydx/article/details/116102127 但现在&#x…

linux笔记(2):vscode插件remote WSL远程使用交叉编译工具链(全志D1-H)

文章目录1.前期准备1.1 Windows有对WSL文件读写的权限1.2 WSL的C语言编译环境已经搭建完毕2.在windows的vscode安装remoteWSL插件3.从ubuntu启动windows端的vscode4.使用vscode编译ubuntu端的c文件4.1 在《tasks.json》指定可视化make命令4.2编写Makefile文件4.3 开始编译4.3.1…

27服务-安全访问状态转换

诊断协议那些事儿 诊断协议那些事儿专栏系列文章,本文将介绍安全访问状态图——作为UDS27服务的规范性附件。 可参考前两篇文章: 27服务-SecurityAccess UDS - 深论Security Access Service 27服务的初衷就是防止无权限人员进行非法数据操作&#xff…

Day801.内存问题排查方案 -Java 性能调优实战

内存问题排查方案 Hi,我是阿昌,今天学习记录的是关于内存问题排查方案。 碰到内存持续上升的情况,其实很难从业务日志中查看到具体的问题,那么面对多个进程以及大量业务线程,该如何精准地找到背后的原因呢&#xff1…

STM8S903K3基于ST Visual Develop开发定时器1中断示例

STM8S903K3基于ST Visual Develop开发定时器1中断示例 📌相关篇《STM8S903K3T6C基于IAR开发GPIO点灯示例》 🎉在基于STVP环境下和IAR环境下,如果都使用寄存器操作,那么差异不大,主要在中断函数的书写上有差异。 &#…