3步搞定Phi-3-mini-4k-instruct-gguf在WSL中的部署与调用
3步搞定Phi-3-mini-4k-instruct-gguf在WSL中的部署与调用1. 引言想在Windows系统上快速体验Phi-3-mini模型通过WSLWindows Subsystem for Linux环境部署是个不错的选择。本文将带你用最简单的方式在WSL中完成Phi-3-mini-4k-instruct-gguf模型的部署和调用。整个过程只需要三个主要步骤准备WSL环境、安装必要依赖、加载并调用模型。即使你是第一次接触WSL或Phi-3模型跟着本文操作也能在30分钟内完成部署并看到实际运行效果。2. 环境准备2.1 启用WSL功能首先确保你的Windows系统已启用WSL功能。以管理员身份打开PowerShell运行以下命令wsl --install这个命令会自动安装WSL所需组件和默认的Ubuntu发行版。安装完成后需要重启系统。2.2 设置Ubuntu环境重启后从开始菜单打开Ubuntu应用它会自动完成初始化设置。你需要创建用户名和密码密码输入时不会显示字符正常输入即可运行更新命令确保系统是最新的sudo apt update sudo apt upgrade -y3. 安装必要依赖3.1 基础工具安装在Ubuntu终端中运行以下命令安装基础工具sudo apt install -y python3 python3-pip git3.2 Python环境配置建议使用venv创建独立的Python环境python3 -m venv phi3_env source phi3_env/bin/activate然后安装必要的Python包pip install torch transformers sentencepiece4. 模型部署与调用4.1 下载GGUF模型文件在WSL中创建一个工作目录并下载模型mkdir phi3_demo cd phi3_demo wget https://huggingface.co/TheBloke/Phi-3-mini-4k-instruct-GGUF/resolve/main/phi-3-mini-4k-instruct.Q4_K_M.gguf4.2 编写调用代码创建一个Python脚本demo.py内容如下from transformers import AutoModelForCausalLM, AutoTokenizer import torch model_path ./phi-3-mini-4k-instruct.Q4_K_M.gguf tokenizer AutoTokenizer.from_pretrained(microsoft/Phi-3-mini-4k-instruct) model AutoModelForCausalLM.from_pretrained(model_path, torch_dtypetorch.float16) input_text 解释一下量子计算的基本概念 inputs tokenizer(input_text, return_tensorspt) outputs model.generate(**inputs, max_length200) print(tokenizer.decode(outputs[0], skip_special_tokensTrue))4.3 运行模型在终端中执行脚本python demo.py第一次运行时可能需要几分钟加载模型之后调用会快很多。你应该能看到模型生成的回答。5. 常见问题解决5.1 权限问题如果遇到权限错误尝试chmod x phi-3-mini-4k-instruct.Q4_K_M.gguf5.2 内存不足WSL默认内存限制可能较低可以调整配置文件在Windows用户目录下创建或修改.wslconfig文件添加以下内容[wsl2] memory8GB swap8GB然后重启WSLwsl --shutdown5.3 模型加载慢首次加载GGUF模型需要较长时间耐心等待即可。后续调用会快很多。6. 总结通过以上三个主要步骤我们成功在WSL环境中部署并运行了Phi-3-mini-4k-instruct模型。整个过程相对简单不需要复杂的配置适合快速体验和开发测试。实际使用中你可以根据需要调整Python脚本中的参数比如修改max_length控制生成文本长度或者调整temperature参数改变生成结果的随机性。这个基础示例为你提供了一个起点你可以在此基础上开发更复杂的应用。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2508708.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!