ms-swift保姆级教程:从安装到微调,小白也能轻松上手
ms-swift保姆级教程从安装到微调小白也能轻松上手1. 前言为什么选择ms-swift如果你正在寻找一个简单易用的大模型微调框架ms-swift可能是目前最好的选择之一。这个由魔搭社区推出的开源工具让大模型微调变得像搭积木一样简单。想象一下你只需要几行命令就能在消费级显卡上微调Qwen、Llama等主流大模型还能轻松实现多模态训练、强化学习等高级功能。这就是ms-swift的魅力所在。2. 环境准备与安装2.1 硬件要求ms-swift对硬件要求非常友好最低配置NVIDIA显卡如RTX 3090/4090推荐配置A100/H100等专业显卡显存要求7B模型微调仅需9GB显存使用QLoRA2.2 安装步骤安装ms-swift非常简单只需执行以下命令pip install ms-swift如果需要使用最新的开发版本pip install githttps://github.com/modelscope/ms-swift.git3. 快速开始10分钟微调Qwen2.5-7B让我们用一个简单的例子快速体验ms-swift的强大功能。3.1 准备微调命令在单卡3090上对Qwen2.5-7B-Instruct进行自我认知微调CUDA_VISIBLE_DEVICES0 \ swift sft \ --model Qwen/Qwen2.5-7B-Instruct \ --train_type lora \ --dataset AI-ModelScope/alpaca-gpt4-data-zh#500 \ AI-ModelScope/alpaca-gpt4-data-en#500 \ swift/self-cognition#500 \ --torch_dtype bfloat16 \ --num_train_epochs 1 \ --per_device_train_batch_size 1 \ --per_device_eval_batch_size 1 \ --learning_rate 1e-4 \ --lora_rank 8 \ --lora_alpha 32 \ --target_modules all-linear \ --gradient_accumulation_steps 16 \ --eval_steps 50 \ --save_steps 50 \ --save_total_limit 2 \ --logging_steps 5 \ --max_length 2048 \ --output_dir output \ --system You are a helpful assistant. \ --warmup_ratio 0.05 \ --dataloader_num_workers 4 \ --model_author swift \ --model_name swift-robot3.2 参数说明--model: 指定要微调的模型--train_type: 微调方式这里使用LoRA--dataset: 使用的数据集--lora_rank: LoRA的秩大小--output_dir: 输出目录4. 进阶使用自定义数据集微调4.1 准备自定义数据集ms-swift支持自定义数据集只需按照以下格式准备JSON文件[ { instruction: 解释什么是人工智能, input: , output: 人工智能是... }, { instruction: 写一首关于春天的诗, input: , output: 春风拂面... } ]4.2 使用自定义数据集微调准备好数据集后只需修改--dataset参数CUDA_VISIBLE_DEVICES0 \ swift sft \ --model Qwen/Qwen2.5-7B-Instruct \ --train_type lora \ --dataset /path/to/your/dataset.json \ ...5. 模型推理与部署5.1 使用训练好的模型进行推理训练完成后可以使用以下命令进行推理CUDA_VISIBLE_DEVICES0 \ swift infer \ --adapters output/vx-xxx/checkpoint-xxx \ --stream true \ --temperature 0 \ --max_new_tokens 20485.2 合并LoRA权重并使用vLLM加速CUDA_VISIBLE_DEVICES0 \ swift infer \ --adapters output/vx-xxx/checkpoint-xxx \ --stream true \ --merge_lora true \ --infer_backend vllm \ --vllm_max_model_len 8192 \ --temperature 0 \ --max_new_tokens 20486. Web UI界面操作ms-swift还提供了Web UI界面让操作更加直观swift web-ui启动后在浏览器中访问http://localhost:7860即可使用。7. 总结与下一步通过本教程你已经学会了ms-swift的基本安装与配置使用内置数据集进行模型微调准备和使用自定义数据集训练后的模型推理与部署Web UI界面的基本使用下一步你可以尝试探索ms-swift支持的其他模型尝试不同的微调方法如QLoRA、全参数微调使用多模态数据集进行训练部署模型到生产环境获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2429140.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!