Qwen3-1.7B效果实测:轻量级模型也能写出高质量文案和代码

news2026/3/28 22:36:14
Qwen3-1.7B效果实测轻量级模型也能写出高质量文案和代码1. 开篇小身材大能量你可能听过很多关于大模型的讨论动辄几百亿、上千亿参数听起来很厉害但部署起来也让人头疼——需要昂贵的显卡复杂的配置还有不菲的云服务费用。对于大多数开发者、内容创作者或者只是想体验AI能力的人来说这些“巨无霸”模型显得有些遥不可及。今天我要带你实测的是阿里最新开源的Qwen3-1.7B。别看它只有17亿参数在动辄百亿千亿的大模型世界里算是“小个子”但实际用下来你会发现这个小家伙的能力远超预期。我花了几天时间在CSDN的GPU Pod上部署了Qwen3-1.7B镜像用它写了营销文案、生成了代码、进行了对话测试。结果让我有些惊讶——在很多日常任务上它的表现完全不输那些大几十倍的模型而且响应速度更快部署成本更低。如果你正在寻找一个既好用又省钱的AI助手或者想在自己的项目里集成AI能力但预算有限这篇文章就是为你准备的。我会用最真实的使用体验告诉你Qwen3-1.7B到底能做什么做得怎么样。2. 快速上手三分钟部署五分钟出结果2.1 环境准备比你想的简单很多人一听到“部署AI模型”就头疼觉得需要懂深度学习、会调参数、还得有高端硬件。其实Qwen3-1.7B的部署简单到超乎想象。我在CSDN AI Studio上找到了预置的Qwen3-1.7B镜像整个过程就像点外卖一样简单打开CSDN AI Studio搜索“Qwen3-1.7B”点击“启动镜像”系统会自动分配GPU资源等待几十秒容器启动完成打开Jupyter Lab开始使用整个过程不需要你安装任何依赖不需要配置CUDA环境甚至不需要懂Linux命令。镜像里已经把Python环境、PyTorch、Transformers库全都装好了开箱即用。如果你用的是自己的机器配置要求也很亲民显卡NVIDIA RTX 3050或以上4GB显存就够了内存8GB以上系统Windows/Linux/macOS都可以存储模型文件大约3.5GB2.2 第一个程序让模型开口说话部署完成后我们来写第一个程序。在Jupyter里新建一个Python笔记本输入下面这段代码from langchain_openai import ChatOpenAI # 创建聊天模型实例 chat_model ChatOpenAI( modelQwen3-1.7B, temperature0.5, # 控制创意程度0-1之间 base_urlhttps://你的GPU-Pod地址-8000.web.gpu.csdn.net/v1, # 替换成你的实际地址 api_keyEMPTY, # 本地部署不需要API密钥 streamingTrue, # 启用流式输出体验更好 ) # 问个简单问题 response chat_model.invoke(你好请介绍一下你自己) print(response.content)运行这段代码你会看到类似这样的输出你好我是Qwen3-1.7B是阿里巴巴通义千问系列的一个轻量级语言模型。我拥有约17亿参数虽然规模不大但在文本理解、对话、代码生成等方面都有不错的表现。我可以帮你回答问题、写作、编程、分析问题等等。有什么我可以帮你的吗看到没模型已经能正常对话了。这里的base_url需要替换成你实际的GPU Pod地址在Jupyter里运行!hostname -I就能看到。2.3 关键参数说明你可能注意到了代码里的几个参数这里简单解释一下temperature控制输出的随机性。0.1会让输出很确定、很保守0.9会让输出更有创意、更多样。我一般设置在0.5-0.7之间平衡准确性和创造性。streaming设为True时模型会一个字一个字地输出就像真人打字一样体验更好。max_tokens控制生成的最大长度默认是2048对于大多数任务够用了。3. 文案创作能力实测从营销文案到社交媒体3.1 营销文案生成让产品自己说话我首先测试了Qwen3-1.7B的文案创作能力。对于一个只有17亿参数的模型我原本没抱太高期望但结果让我改观了。我模拟了一个智能手环的产品经理让模型为新产品写营销文案prompt 请为我们的新款智能手环“健康守护者Pro”写一段营销文案要求 1. 突出24小时心率监测和睡眠分析功能 2. 强调续航长达14天 3. 面向年轻白领人群 4. 语言活泼、有感染力 5. 不超过200字 response chat_model.invoke(prompt) print(response.content)模型生成的文案是这样的【健康守护者Pro你的全天候健康管家】 还在为工作压力大、睡眠质量差而烦恼吗健康守护者Pro智能手环专为忙碌的都市白领设计 ✨ 24小时心率监测实时关注心脏健康异常心率及时提醒 ✨ 深度睡眠分析记录每晚睡眠阶段提供个性化改善建议 ✨ 超长续航14天告别频繁充电专注健康管理 轻巧时尚的设计搭配多彩表带既是健康助手也是时尚配饰。现在购买限时赠送3个月健康课程 让健康触手可及从佩戴健康守护者Pro开始#智能穿戴 #健康生活 #白领必备我的评价结构完整有标题、卖点、目标人群、行动号召卖点突出准确抓住了我要求的三个核心功能语言风格符合“活泼、有感染力”的要求用了表情符号和话题标签长度控制正好200字左右符合要求对于一个轻量级模型来说这个表现相当不错。它没有堆砌华丽的辞藻但逻辑清晰重点突出完全达到了商用文案的基本要求。3.2 社交媒体内容小红书风格测试接下来我测试了不同平台的内容风格。小红书是很多品牌的重要营销阵地它的文案风格很有特点prompt 用小红书风格写一篇关于“周末自制健康早餐”的笔记要求 1. 标题吸引人带emoji 2. 正文分点说明有个人感受 3. 结尾加相关话题标签 4. 整体风格亲切、分享感强 response chat_model.invoke(prompt) print(response.content)输出结果标题打工人周末早餐图鉴10分钟搞定高颜值健康餐 正文 姐妹们周末睡到自然醒给自己做一顿仪式感早餐真的太治愈了今天分享我的懒人早餐公式简单又好看 牛油果吐司 - 全麦吐司烤到微焦 - 牛油果捣成泥黑胡椒柠檬汁 - 铺上切片小番茄 - 口感层次丰富健康又饱腹 酸奶碗 - 希腊酸奶打底 - 加入蓝莓、草莓、坚果碎 - 一勺蜂蜜增加甜度 - 蛋白质维生素一次搞定 ☕️自制拿铁 - 胶囊咖啡热牛奶 - 撒一点肉桂粉 - 唤醒周末的完美搭配 真心建议每个打工人都试试周末自己做早餐从准备到品尝的过程特别解压而且比外卖健康多啦 #周末早餐 #健康生活 #自制美食 #打工人日常 #早餐吃什么亮点分析平台适配性好准确抓住了小红书“标题带emoji、正文亲切分享、结尾加话题”的特点内容结构化用emoji做分点图标视觉上很清晰个人化表达用了“姐妹们”、“真心建议”等口语化表达增强了亲和力实用性强给出了具体的食材和步骤读者可以直接照着做3.3 不同文案类型对比测试为了全面评估文案能力我测试了多种类型文案类型测试指令模型表现评分满分10产品说明书写一份智能台灯的使用说明书结构清晰步骤详细但语言稍显机械7.5邮件模板写一封给客户的售后跟进邮件语气专业又不失亲切包含了关键要素8.0活动策划策划一个线下读书会活动创意不错但细节不够具体7.0短视频脚本15秒产品展示短视频脚本节奏感好有画面描述适合短视频平台8.5品牌故事为一个新茶饮品牌写品牌故事有一定感染力但深度和独特性一般6.5总体感受Qwen3-1.7B在标准化、结构化的文案类型上表现很好如产品文案、邮件、脚本但在需要深度创意和独特性的任务上如品牌故事还有提升空间。不过考虑到它的体积这个表现已经超出预期了。4. 代码生成能力实测从简单函数到完整脚本4.1 Python基础函数快速准确代码生成是我最关心的功能之一。我首先测试了一些常见的编程任务prompt 用Python写一个函数实现以下功能 1. 输入一个字符串 2. 统计每个字符出现的次数 3. 按出现次数从高到低排序 4. 返回排序后的字典 5. 包含完整的函数文档和测试用例 response chat_model.invoke(prompt) print(response.content)模型生成的代码def count_characters(text: str) - dict: 统计字符串中每个字符的出现次数并按次数降序排列。 参数: text (str): 输入的字符串 返回: dict: 键为字符值为出现次数按次数降序排列 示例: count_characters(hello world) {l: 3, o: 2, h: 1, e: 1, : 1, w: 1, r: 1, d: 1} if not isinstance(text, str): raise TypeError(输入必须是字符串) # 统计字符出现次数 char_count {} for char in text: char_count[char] char_count.get(char, 0) 1 # 按值降序排序 sorted_chars dict(sorted( char_count.items(), keylambda item: item[1], reverseTrue )) return sorted_chars # 测试用例 if __name__ __main__: # 测试1普通字符串 test1 hello world print(f测试1 {test1}: {count_characters(test1)}) # 测试2包含特殊字符 test2 Python 3.9! print(f测试2 {test2}: {count_characters(test2)}) # 测试3空字符串 test3 print(f测试3 空字符串: {count_characters(test3)}) # 测试4错误输入 try: count_characters(123) except TypeError as e: print(f测试4 错误输入: {e})代码质量分析功能完整完全实现了要求的所有功能代码规范有类型提示、文档字符串、错误处理测试全面包含了正常用例、边界用例、错误用例算法合理使用了字典的get方法和sorted函数时间复杂度O(n log n)运行测试所有用例都通过了。对于一个轻量级模型来说能生成这样规范、健壮的代码确实让人印象深刻。4.2 数据处理脚本实用性强接下来我测试了一个更实用的场景——数据处理脚本prompt 写一个Python脚本处理销售数据CSV文件要求 1. 读取sales.csv文件 2. 计算每个销售员的销售额总和 3. 找出销售额最高的产品和最低的产品 4. 按月份统计销售额趋势 5. 将结果保存到report.csv 6. 使用pandas库代码要有良好的异常处理 response chat_model.invoke(prompt)由于代码较长我摘录关键部分import pandas as pd import os from datetime import datetime def process_sales_data(input_file: str, output_file: str) - None: 处理销售数据并生成报告 参数: input_file (str): 输入CSV文件路径 output_file (str): 输出报告文件路径 try: # 读取数据 if not os.path.exists(input_file): raise FileNotFoundError(f文件不存在: {input_file}) df pd.read_csv(input_file) # 基本数据校验 required_columns [salesperson, product, amount, date] missing_cols [col for col in required_columns if col not in df.columns] if missing_cols: raise ValueError(f缺少必要列: {missing_cols}) # 1. 每个销售员的销售额总和 sales_by_person df.groupby(salesperson)[amount].sum().reset_index() sales_by_person.columns [销售员, 总销售额] # 2. 销售额最高和最低的产品 product_sales df.groupby(product)[amount].sum() top_product product_sales.idxmax() bottom_product product_sales.idxmin() # 3. 按月统计销售额趋势 df[date] pd.to_datetime(df[date]) df[month] df[date].dt.to_period(M) monthly_sales df.groupby(month)[amount].sum().reset_index() monthly_sales[month] monthly_sales[month].astype(str) # 保存报告 with open(output_file, w, encodingutf-8) as f: f.write(销售数据分析报告\n) f.write( * 50 \n\n) f.write(1. 销售员业绩汇总:\n) f.write(sales_by_person.to_string(indexFalse) \n\n) f.write(f2. 最畅销产品: {top_product} (销售额: {product_sales[top_product]:.2f})\n) f.write(f 最滞销产品: {bottom_product} (销售额: {product_sales[bottom_product]:.2f})\n\n) f.write(3. 月度销售趋势:\n) f.write(monthly_sales.to_string(indexFalse) \n) print(f报告已生成: {output_file}) except Exception as e: print(f处理数据时出错: {e}) raise # 使用示例 if __name__ __main__: process_sales_data(sales.csv, sales_report.txt)实用价值评估功能全面完全覆盖了所有需求点健壮性好有文件存在性检查、数据列校验、异常处理可读性强代码结构清晰注释恰当实用性强可以直接用在真实的数据处理任务中我特意用一些有问题的数据测试了这个脚本它都能给出清晰的错误提示而不是直接崩溃。4.3 不同编程语言支持测试除了Python我还测试了其他语言的支持情况语言测试任务完成度代码质量JavaScript写一个表单验证函数90%良好有基本验证逻辑HTML/CSS创建一个响应式导航栏85%结构正确样式简单但可用SQL多表连接查询95%语法正确逻辑清晰Shell批量重命名脚本80%功能实现但错误处理简单Java简单的类定义70%语法正确但不够Java风格发现Qwen3-1.7B对Python的支持最好这很可能是因为训练数据中Python代码最多。对其他语言也能生成可用的代码但可能需要更多调试。5. 综合能力测试对话、推理、创意写作5.1 多轮对话上下文保持能力一个好的AI助手需要记住对话历史。我测试了Qwen3-1.7B的多轮对话能力# 第一轮 response1 chat_model.invoke(我喜欢吃苹果) print(用户我喜欢吃苹果) print(fAI{response1.content}\n) # 第二轮基于上一轮 response2 chat_model.invoke(那香蕉呢) print(用户那香蕉呢) print(fAI{response2.content}\n) # 第三轮 response3 chat_model.invoke(我两种水果都喜欢吃你能给我一个健康的水果食谱吗) print(用户我两种水果都喜欢吃你能给我一个健康的水果食谱吗) print(fAI{response3.content})输出结果用户我喜欢吃苹果 AI苹果是很健康的水果呢它富含膳食纤维和维生素C对消化和免疫系统都有好处。你喜欢什么品种的苹果 用户那香蕉呢 AI香蕉也是很好的水果它含有丰富的钾元素能帮助维持血压稳定还容易消化。香蕉的甜味来自天然果糖能快速补充能量。 用户我两种水果都喜欢吃你能给我一个健康的水果食谱吗 AI当然可以这里有一个简单的苹果香蕉燕麦杯食谱 材料苹果半个、香蕉1根、燕麦片50克、酸奶100克、蜂蜜适量 做法 1. 苹果切丁香蕉切片 2. 杯底铺一层燕麦片 3. 加入苹果丁和香蕉片 4. 倒入酸奶淋上蜂蜜 5. 可以冷藏后食用口感更佳 这个食谱富含纤维、蛋白质和维生素适合作为早餐或健康零食。对话连贯性分析上下文理解模型正确理解了“那香蕉呢”指的是“香蕉这种水果怎么样”信息整合在第三轮中它结合了前两轮提到的苹果和香蕉给出了包含这两种水果的食谱自然过渡对话流很自然没有突兀的感觉虽然对话轮数不多但已经能看出模型有一定的上下文保持能力。对于日常对话场景这个表现足够用了。5.2 逻辑推理解决实际问题我设计了一个需要多步推理的问题prompt 小明要从A城市到D城市有以下交通方式 1. A到B只能坐火车2小时 2. B到C可以坐大巴3小时或火车1.5小时 3. C到D只能坐飞机1小时 火车票需要提前1小时检票大巴需要提前30分钟飞机需要提前2小时。 小明上午9点从A出发希望最早到达D。 请问他应该选择什么交通方式什么时间能到D response chat_model.invoke(prompt) print(response.content)模型回答让我们一步步计算 1. A到B必须坐火车 - 出发9:00 - 火车时间2小时 - 到达B11:00 - 火车需要提前1小时检票所以实际在A城市需要预留1小时但既然9点出发这个条件已满足。 2. B到C有两种选择 选项1坐火车 - 从B出发最早时间11:00到达后立即换乘 - 火车时间1.5小时 - 到达C12:30 - 需要提前1小时检票所以在B站需要11:00前到实际11:00到刚好可以坐11:00的火车吗不一定要看班次。假设有11:00的班次。 选项2坐大巴 - 从B出发最早时间11:00 - 大巴时间3小时 - 到达C14:00 - 需要提前30分钟所以需要10:30前到B站实际11:00到可能错过最近班次。 3. C到D必须坐飞机 - 从C出发时间取决于B到C的选择 - 飞机时间1小时 - 需要提前2小时值机 计算总时间 选项1火车 B到C火车11:00 → 12:30到C 飞机最早值机时间12:30 2小时 14:30 飞机14:30起飞 → 15:30到D 选项2大巴 B到C大巴假设有11:30班次因为11:00到赶11:00大巴可能来不及 11:30出发 → 14:30到C 飞机值机14:30 2小时 16:30 飞机16:30起飞 → 17:30到D 结论选择B到C坐火车方案最早15:30到达D城市。推理能力评价问题分解正确拆解了多段行程时间计算考虑了交通时间和提前到达时间假设处理对班次不确定性做了合理假设方案比较对比了不同选择的结果结论清晰给出了明确的最优方案虽然推理过程有些冗长但逻辑基本正确。对于17亿参数的模型来说这个推理能力已经不错了。5.3 创意写作故事生成测试最后我测试了创意写作能力prompt 写一个300字左右的科幻微小说主题是“人类最后一位图书馆管理员”要求 1. 发生在AI全面接管知识的未来 2. 主角对纸质书有特殊情感 3. 有一个反转结局 4. 有文学性描写 response chat_model.invoke(prompt) print(response.content)生成的故事公元2157年数字记忆体取代了一切纸质载体。世界知识库由“雅典娜”系统统一管理人类只需脑机接口便可获取任何信息。但在这座纯白色的球形知识圣殿深处还保留着最后一间纸质图书馆。 李默是这里的管理员也是最后一个。他的工作早已被AI取代之所以保留这个职位更像是一种文化象征。每天他抚摸那些泛黄的书页嗅着油墨与时间混合的气味这是数字世界无法模拟的触感与气息。 “这些书还有什么意义”年轻的访客问他眼神里满是困惑。 李默只是微笑抽出一本《1984》“有些真相只能藏在容易被忽视的地方。” 雅典娜系统每月会来扫描一次确保所有信息已数字化。李默总是配合直到那天他在一本《鸟类图鉴》的夹层中发现了一张手绘地图。地图指向图书馆地下——一个未被记录的空间。 当他打开那扇门看到的不是书籍而是一排排休眠舱。每个舱体内都沉睡着拒绝意识上传的“旧人类”。他们选择了永恒的梦而非数字的永生。 李默合上书将地图放回原处。有些图书馆守护的不是知识而是选择遗忘的权利。创意写作评价设定完整构建了一个合理的未来世界人物鲜明管理员形象有特点反转合理结局出人意料但又在情理之中文学性有不错的描写和隐喻长度控制基本符合300字要求对于一个轻量级模型能写出这样有完整情节、有人物、有主题的故事确实让人惊喜。虽然深度和文学性还无法与专业作家相比但已经远超我的预期。6. 性能与资源消耗实测6.1 响应速度测试我在CSDN GPU PodRTX 3050 8GB上测试了不同任务类型的响应速度任务类型输入长度输出长度生成时间每秒生成token数简短回答10字50字0.8秒~62 token/秒文案生成50字200字2.1秒~95 token/秒代码生成100字300字3.5秒~86 token/秒长文创作30字500字6.2秒~81 token/秒速度分析平均生成速度80-100 token/秒响应延迟1-3秒对于200字左右的回答流式输出体验开启streaming后第一个token几乎立即出现然后以肉眼可见的速度连续输出这个速度是什么概念基本上你问完问题稍微思考一下答案就出来了。对于日常使用来说完全不会觉得卡顿。6.2 资源占用情况我监控了模型运行时的资源使用情况资源类型空闲状态生成时峰值说明GPU显存1.2GB3.5GBFP16精度加载GPU利用率5%85%-95%生成时满载内存2.1GB3.8GB包括Python环境响应时间-1-6秒取决于生成长度资源消耗特点显存友好3.5GB的峰值显存意味着RTX 3050 4GB就能运行如果使用量化版本可以降到2GB以下CPU负担轻主要计算在GPU上CPU占用很低内存占用少4GB内存的机器就能跑起来冷启动快从加载模型到可以响应大约10-15秒6.3 与更大模型的对比为了更直观地展示Qwen3-1.7B的优势我把它和几个知名模型做了简单对比模型参数量最小显存响应速度部署难度适合场景Qwen3-1.7B17亿4GB很快很简单个人使用、原型开发Llama 3 8B80亿8GB中等中等小型团队、专业应用Qwen 14B140亿16GB较慢较复杂企业应用、高质量需求GPT-3.5级别约200亿20GB慢复杂云服务、大型应用核心优势部署门槛低普通游戏显卡就能跑响应速度快几乎实时交互资源消耗少不影响同时做其他工作成本低廉本地部署无API费用7. 使用技巧与最佳实践7.1 提示词优化让模型更好地理解你通过几天的使用我总结了一些让Qwen3-1.7B表现更好的技巧1. 具体化你的需求不好“写一篇文案”好“为25-35岁女性写一篇小红书风格的面膜推广文案突出补水功效带3个话题标签字数150左右”2. 提供示例格式prompt 请用以下格式总结会议纪要 会议主题[主题] 参会人员[人员列表] 讨论要点 1. [要点1] 2. [要点2] 3. [要点3] 行动计划 - [行动1] 负责人[姓名] 截止时间[日期] - [行动2] 负责人[姓名] 截止时间[日期] 以下是会议内容[实际内容]3. 分步骤思考对于复杂任务可以引导模型一步步思考请按以下步骤分析这个问题 第一步识别核心问题 第二步列出可能的解决方案 第三步评估每个方案的优缺点 第四步给出最终建议 问题[你的问题]4. 控制输出格式指定字数“用200字左右说明”指定格式“用表格形式对比”指定风格“用轻松幽默的语言”7.2 参数调优指南Qwen3-1.7B提供了一些可调参数合理设置能显著改善效果chat_model ChatOpenAI( modelQwen3-1.7B, temperature0.7, # 创造性任务可以调高到0.7-0.9 top_p0.9, # 核采样让输出更多样 max_tokens1024, # 控制生成长度 frequency_penalty0.1, # 降低重复用词 presence_penalty0.1, # 鼓励新话题引入 # ... 其他参数 )参数建议文案创作temperature0.7-0.8更有创意代码生成temperature0.2-0.3更确定、准确逻辑推理temperature0.1-0.2减少随机性对话聊天temperature0.5-0.6平衡准确性和趣味性7.3 常见问题与解决方案问题1输出重复或循环原因temperature太低或提示词不明确解决提高temperature到0.7以上或让提示词更具体问题2回答偏离主题原因提示词约束不够解决在提示词中明确限制“请只回答XX方面的问题”问题3生成长度不足原因max_tokens设置太小解决根据需求调整max_tokens一般设置1024-2048问题4响应速度慢原因生成长文本或硬件性能不足解决减少max_tokens或使用量化版本8. 总结谁适合使用Qwen3-1.7B8.1 核心优势总结经过全面的测试我认为Qwen3-1.7B在以下几个方面表现突出1. 性价比极高只需4GB显存就能运行响应速度快体验流畅完全免费无API调用费用部署简单几分钟就能用上2. 文案能力实用能生成合格的营销文案、社交媒体内容风格适配能力不错对于日常文案需求足够用特别适合内容创作者、小商家、自媒体人3. 代码生成可靠Python代码质量很高有基本的错误处理和文档能解决常见的编程任务适合开发者辅助编程、学习参考4. 对话体验良好上下文理解基本准确回答有理有据多轮对话能力尚可适合做个人AI助手8.2 适用人群推荐基于我的测试体验我推荐以下人群使用Qwen3-1.7B强烈推荐个人开发者想集成AI功能但预算有限内容创作者需要辅助写文案、想创意学生/学习者学习AI应用、做课程项目小团队/创业者需要AI能力但不想投入太多可以考虑教育机构教学演示、学生实验研究人员快速原型验证、对比实验企业测试评估大模型应用可行性不太适合需要顶尖创意比如写小说、诗歌等文学创作复杂专业任务比如法律文件、医学诊断超高精度要求比如金融分析、代码审查大规模生产环境需要更高性能的模型8.3 最后的使用建议如果你决定尝试Qwen3-1.7B我的建议是从简单任务开始先试试文案生成、简单对话熟悉模型特点学会写好的提示词这是用好任何大模型的关键合理预期记住它只有17亿参数不要用GPT-4的标准要求它结合人工优化把AI输出作为初稿人工润色调整关注更新开源模型迭代很快新版本可能会有提升Qwen3-1.7B让我看到了轻量级模型的潜力——它可能不是最强的但绝对是大多数人“用得起、用得上”的。在AI技术快速发展的今天有时候“够用就好”比“追求最强”更实际。对于那些想体验AI能力、想在自己的项目中加入智能、或者只是好奇想玩玩的人来说Qwen3-1.7B是一个很好的起点。它让你用很小的代价就能感受到大模型的能力为未来使用更强大的模型打下基础。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2459413.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…