在E-Shell中执行
1. salloc -p 队列名 -N 1 -n 32 --gres=dcu:4
salloc -p wzhdtest -N 1 -n 32 --gres=dcu:4
2. ssh 节点名
ssh g01r3n07
3. conda deactivate
4. 查看当前所有模块
module ava compiler

从上图中加载某个dtk模块
module load compiler/dtk/21.10
注:乌镇没有rocm,需要加载dtk
5. 执行ifconfig获取当前节点ip地址
ifconfig
6. 开启tensorboard 服务
#进入虚拟环境
source pytorch_env.sh
# 进入events所在目录
cd project/rng-kbqa/GrailQA/runs/
# 开启tensorboard 服务
tensorboard --logdir .

7. 打开VNC界面(创建图形界面)

8. 右击选择Konsole窗口

9. 在命令行输入 firefox

10. 在打开的firefox 浏览器中输入http://10.7.1.48:6006/ 或者 http://g01r3n07:6006/

注:申请的地方不同,对应的使用教程也会有差异,一定要仔细看!!此篇仅适用于乌镇中心!!



















