书生·浦语大模型实战营第四次课堂笔记

news2026/2/27 18:39:34

先来看看参考作业

哈哈到这才想起来写笔记
在这里插入图片描述

倒回去看发现要求将不要葱姜蒜换成自己的名字和昵称！

好好好我就是不配玩（换成管理员也不行！）
诶怎么能进这个环境？要进双系统ubuntu？
现在看视频发现原来是我进入成功了，可以接着往下做omygod！！！！
在这里插入图片描述
但是

还是看看视频吧
微调是在海量的文本内容的基础上以无监督或半监督的方式进行训练的

qlora是对lora的一种改进~感觉就是更高级点的工具

对话模版~

在这里插入图片描述

XTuner介绍~

XTuner快速上手：
1.安装(指定版本，在这之前需要创建conda环境

pip install xtuner

2.挑选配置模板

xtuner list-cfg -p internlm_20b

3.一键训练

xtuner train interlm_20b_qlora_512_e3

Config 命名规则
模型名 internlm_20b 无chat代表是基座模型
使用算法 qlora
数据集 oasst1
数据长度 512
Epoch e3,epoch 3

自定义微调
1.拷贝配置模版

xtuner copy-cfg internlm_20b_qlora_oasst1_512_e3 ./

2.修改配置模版

vi internlm_20b_qlora_oasst1_512_e3_copy.py

3.启动训练

xtuner train internlm_20b_qlora_oasst1_512_e3_copy.py

常用超参：

data_path   数据路径或HuggingFace 仓库名
max_length  单条数据最大Token数，超时则截断
pack_to_max_length  是否将多条短数据拼接到max_length,提高GPU利用率
accumulative_counts  梯度累积，每多少backward更新一次参数
evaluation_inputs 训练过程中，会根据给定的问题进行推理，便于观测训练状态
evaluation_freq Evaluation的评测间隔iter数

训练完成之后
我们就得到了这个Adapter文件就是所谓的lora文件，我们就需要在加载底座模型的基础上同时加载这个Adapter也就是lora来进行与模型的对话与测试。

为了便于开发者查看训练效果，Xtuner提供了一键对话接口
Float 16模型对话

xtuner chat internlm/internlm-chat-20b

4bit模型对话

xtuner chat internlm/internlm-chat-20b --bits 4

加载Adapter模型对话

xtuner chat internlm/internlm-chat-20b --adapater $ADAPTER_DIR

在这里插入图片描述
deepspeed不是默认启动，需要加默认参数

xtuner train internlm_20b_qlora_oasst1_512_e3\ --deepspeed deepspeed_zero3

在这里插入图片描述
通过问不要葱姜蒜大佬知道了它通过ssh连接的话还是在开发机上也不会下载到本地yes太好了我还能玩~

进入：tmux attach -t finetune
退出：ctrl+b 然后再按d
可以关机让它在后台训练~
在这里插入图片描述
要敲两次回车！看得出来有点慢哈哈
再来写一遍作业

啊这是为啥失败了嘛
原来是需要训练！！！是小罗的助手啦~

在这里插入图片描述

在这里插入图片描述
还在加载中

在这里插入图片描述
到46%了感觉我的网速有点慢啊~

好好好发现自己

算啦算啦其实差不多了

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1397128.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

书生·浦语大模型实战营第四次课堂笔记

先来看看参考作业

相关文章

Vcruntime140_1.dll丢失的错误提示怎么解决，关于Vcruntime140_1.dll文件

档案数字化如何选择合适的扫描仪

代码随想录二刷｜二叉树｜二叉搜索树的最近公共祖先

Qt简单使用与初识

vector迭代器的失效

深入Android S (12.0) 探索Framework之输入子系统InputReader的流程

redisson的延时队列机制简述

初识React,基础(1), 安装react,jsx文件,类组件和函数组件,css样式

视频增强修复Topaz Video AI

NFS网络共享存储服务技术攻略

【C++干货铺】C++11常用新特性 | 列表初始化 | STL中的变化

【Python_PySide6学习笔记（三十一）】基于PySide6实现自定义串口设备连接界面类：可实现串口连接断开、定时发送等功能

ChatGPT提示词保姆级教程

将vue项目打包成桌面客户端实现点击桌面图标直接进入项目

《游戏-01_2D-开发》

K8s知识点总结_part1

C#编程-使用反射检索元数据

Python自动化报告的输出用例详解

监控系统——Zabbix

如何使用idm下载百度网盘的资源