华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

news2025/6/4 22:08:22

华为云Flexus+DeepSeek征文 | 初探华为云ModelArts Studio:部署DeepSeek-V3/R1商用服务的详细步骤

  • 前言
  • 一、华为云ModelArts Studio平台介绍
    • 1.1 ModelArts Studio介绍
    • 1.2 ModelArts Studio主要特点
    • 1.3 ModelArts Studio使用场景
    • 1.4 ModelArts Studio产品架构
  • 二、访问ModelArts Studio大模型即服务平台
    • 2.1 登录华为云
    • 2.2 进入ModelArts Studio介绍页
    • 2.3 进入ModelArts Studio控制台
    • 2.4 配置ModelArts委托授权
    • 2.5 华为云账号充值
  • 三、开通DeepSeek-V3/R1商用服务
    • 3.1 预置服务介绍
    • 3.2 开通商用服务DeepSeek-V3-32K
    • 3.3 开通商用服务DeepSeek-R1-32K
  • 四、商用服务DeepSeek-V3/R1对比
  • 五、商用服务DeepSeek-V3/R1在线体验
    • 5.1 DeepSeek-V3-32K在线体验
    • 5.2 DeepSeek-R1-32K在线体验
    • 5.3 DeepSeek-V3/R1调用统计功能
  • 六、使用体验与总结

前言


华为云ModelArts Studio作为一站式大模型即服务平台,凭借其强大的模型管理能力和简洁易用的操作界面,为企业和开发者提供了高效、稳定的AI服务部署体验。平台全面支持主流大模型的快速接入与商用服务开通,显著降低了AI应用开发的技术门槛。通过集成自动调优、资源按需分配、API调用监控等智能功能,ModelArts Studio实现了从模型训练到生产落地的无缝衔接。本文将以部署DeepSeek-V3和DeepSeek-R1商用服务为例,带领大家深入了解这一平台的强大能力与实际应用价值。


一、华为云ModelArts Studio平台介绍

1.1 ModelArts Studio介绍

🌟 平台介绍

ModelArts Studio是华为云提供的一个大模型即服务平台(MaaS服务),旨在简化模型开发流程,支持定制化大模型的开发,并使这些模型能够无缝集成到业务系统中。通过降低企业AI应用的成本和难度,ModelArts Studio助力企业快速实现AI技术落地。

👉 立即体验:通过ModelArts Studio,让大模型成为企业数字化转型的核心驱动力,解锁智能未来!

在这里插入图片描述

1.2 ModelArts Studio主要特点

  1. 全栈模型生态,性能卓越
    主流模型全覆盖:集成Llama、Baichuan、Yi、Qwen、DeepSeek等99%业界SOTA开源模型,预适配昇腾算力底座,精度与推理性能显著提升。
    零代码自动化开发:沉淀100+行业调优经验,提供一键训练、自动超参优化、标准化流水线,无需手动调参,开发周期缩短50%+。
    昇腾深度优化:基于昇腾算子与显存优化技术,训练/推理效率大幅提升,预置最优超参配置,开箱即用。

  2. 资源灵活可控,成本优化
    💡 按需付费,弹性扩缩:分钟级获取算力资源,按实际使用收费,避免闲置浪费,降低AI入门门槛。
    💡 高可用性保障:多数据中心部署,支持故障快速恢复(快恢)断点续训,确保训练任务不中断,保护项目连续性。

  3. 智能应用快速构建
    🤖 Agent开发加速器:提供优质Prompt模板与智能Agent沉淀,支持复杂任务拆解(如多系统协同决策),快速生成业务专属智能体。
    🤝 组件化生态集成:即插即用MCP Server、LangChain、RAG、Guard等工具,一站式构建智能问答、知识管理、流程自动化等应用。

  4. 一站式全生命周期服务
    📦 全流程工具链:覆盖模型调优、压缩、部署、评测等环节,支持「即开即用」,无需跨平台切换。
    ⚙️ 标准化流水线:内置性能与精度评价体系,自动化完成模型优化,确保全场景高性能表现。

1.3 ModelArts Studio使用场景

  1. 行业大模型定制开发
    🔹 金融/医疗/制造:基于开源模型微调,快速构建风控分析、智能诊断、供应链优化等垂直领域大模型。
    🔹 优势:无需从头训练,依托昇腾优化提升行业数据适配性,降低定制成本。

  2. 复杂业务流程自动化
    🔹 企业级决策支持:拆解项目级任务(如跨部门协作、多系统调用),通过智能Agent实现自动化决策与执行。
    🔹 典型场景:智能客服(多轮对话+知识库检索)、工单自动化处理、数据分析报告生成。

  3. 低成本AI创新探索
    🔹 中小企业/初创团队:通过按需付费模式,零门槛试用大模型能力,快速验证业务场景(如营销文案生成、智能质检)。
    🔹 优势:分钟级启动开发,无需预置算力资源,试错成本降低80%。

  4. 高性能实时推理场景
    🔹 实时交互应用:智能问答、推荐系统、工业实时监控等,依托昇腾优化保障低延迟、高并发推理。
    🔹 技术支撑:多数据中心容灾架构,确保7×24小时稳定服务。

  5. 多模态应用集成
    🔹 智能内容生成:结合RAG(检索增强生成)与Guard(安全防护),构建企业级知识中台、数字人交互等多模态应用。
    🔹 组件化优势:快速集成LangChain等工具,实现「数据-模型-应用」闭环。

1.4 ModelArts Studio产品架构

华为云ModelArts Studio产品架构集成了模型服务、应用服务和资源管理等多个模块,支持从模型调优、压缩到部署的全生命周期管理,并提供丰富的插件和应用体验。其底层依托于ModelArts Standard平台,涵盖模型开发、数据工程、训练和推理等核心功能,确保高效灵活的AI开发流程。通过统一资源调度和AI专属资源池,ModelArts Studio实现了资源的按需使用和快速扩展,助力企业轻松应对复杂多变的业务需求。

在这里插入图片描述

二、访问ModelArts Studio大模型即服务平台

2.1 登录华为云

华为云官网:https://www.huaweicloud.com/,在电脑浏览器打开华为云官网后,点击“登录”选项,输入自己的华为云账号和密码,登录华为云官网。

在这里插入图片描述

2.2 进入ModelArts Studio介绍页

在华为云首页的产品——查看所有产品,搜索框内输入ModelArts Studio,即可看到ModelArts Studio大模型即服务平台,点击进去即可。

在这里插入图片描述

同时,可以直接输入ModelArts Studio的地址:https://www.huaweicloud.com/product/modelarts/studio.html,进入ModelArts Studio的介绍页。

在这里插入图片描述

2.3 进入ModelArts Studio控制台

在ModelArts Studio介绍页中,我们点击“ModelArts Studio控制台”。

在这里插入图片描述

刚开始进入时,会提示我们勾选“ModelArts Studio服务声明”,勾选后,选择“确定”选项即可。

在这里插入图片描述

2.4 配置ModelArts委托授权

在ModelArts Studio控制台首页中,在页面上方我们看到依赖服务的授权提醒,我们按照提示点击“此处”,配置相关授权即可。

在这里插入图片描述

快速添加授权:选择新增委托,权限配置则选择普通模式。将服务列表全选后,选择创建即可。

在这里插入图片描述

回到ModelArts Studio控制台首页后,可以看到授权提示已经消失。

在这里插入图片描述

2.5 华为云账号充值

为避免测试过程中出现部署失败等问题,请确保自己的华为云账号余额充足,建议保持账户余额大于10元。

  • 华为云充值地址:https://account.huaweicloud.com/usercenter/?region=cn-north-4&locale=zh-cn#/userindex/allview

在这里插入图片描述

三、开通DeepSeek-V3/R1商用服务

3.1 预置服务介绍

在ModelArts Studio控制台首页中。我们依次选择模型推理—在线推理——预置服务,可以看到商用服务和免费服务列表。预置服务为平台已部署好的服务,无等待时间,按token计费、适合快速测试

在这里插入图片描述

  • 服务类型与计费规则
类别描述说明
服务类型免费服务 / 商用服务
免费服务- 仅限用于模型体验
- 受严格的速率限制
- 平台可能不定期调整支持的模型、免费额度及有效期等信息
商用服务- 提供商用级别的推理 API 服务
- 开通后可获取付费 API 使用权限
  • 推理额度与使用方式
项目说明
免费额度单个模型提供 200万 token 推理额度
额度耗尽后处理方式- 可开通商用级别推理 API(仅限区域:贵阳一)
- 或前往“我的服务”部署为自定义服务后按需付费使用
优惠折扣相关信息有关模型服务的优惠折扣发放与使用情况,请前往 费用中心查看

备注:如果需了解更多详情,建议访问华为云官方文档或费用中心页面。

3.2 开通商用服务DeepSeek-V3-32K

我们选择开通商用服务DeepSeek-V3-32K,其专注于内容生成、代码辅助与多轮对话,在长文本处理与逻辑连贯性方面表现出色。

在这里插入图片描述

注意保证华为云账户余额充足,确认开通DeepSeek-V3-32K服务。

在这里插入图片描述

查看DeepSeek-V3-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

3.3 开通商用服务DeepSeek-R1-32K

我们选择开通商用服务DeepSeek-R1-32K,它聚焦于检索增强生成(RAG),适用于企业知识库问答、文档分析等强调准确性和可溯源性的场景。

在这里插入图片描述

查看DeepSeek-R1-32K服务开通状态,可以看到已经成功开通。

在这里插入图片描述

四、商用服务DeepSeek-V3/R1对比

  • 📊 模型功能与适用场景对比
对比维度DeepSeek-V3-32KDeepSeek-R1-32K
核心能力内容创作、代码生成、多轮对话、逻辑推理检索增强生成(RAG)、知识库问答、文档分析
输入价格¥0.002 / 千 tokens¥0.004 / 千 tokens
输出价格¥0.008 / 千 tokens¥0.016 / 千 tokens
典型应用场景技术文档撰写、自动化内容生成、智能客服、编程辅助企业内部知识库查询、法律/金融文档解析、精准问答服务
响应速度快速响应,适合实时交互略慢(因涉及外部数据检索),但准确性高
优势特点结构清晰、逻辑连贯、长文本记忆能力强可溯源、精准回答、支持超长文本(如100K+)处理
局限性对实时性知识依赖训练数据,可能存在滞后响应时间较长,不适合极高时效性要求的场景

✅ 使用建议总结

  • 如果业务侧重于内容生成、代码编写或对话理解,推荐使用 DeepSeek-V3-32K,性价比高且响应迅速。
  • 如果应用更注重知识检索、答案可追溯性及超长文本处理,例如在企业知识库、法律合同分析等场景中,DeepSeek-R1-32K 更为合适。

💡 提示:结合具体业务需求测试两种模型的实际表现,将有助于选择最优方案。

五、商用服务DeepSeek-V3/R1在线体验

5.1 DeepSeek-V3-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-V3-32K的在线体验选项。

在这里插入图片描述

在DeepSeek-V3-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

我们让DeepSeek-V3-32K编写一段以端午节祝福为主题的简单静态 HTML 网页代码。

  • 我们在对话框内,输入以下提示词:
请生成一段简单且美观的静态 HTML 代码,用于展示一个以 “端午节祝福” 为主题的网页。具体要求如下:
页面整体风格温馨、传统,体现浓厚的节日气氛;
使用柔和的中国传统色系(如红色、金色、浅绿、粽叶绿等);
包含标题(如“端午安康,粽情祝福!”)、正文祝福语、背景图片或图案(可使用CSS模拟背景图或渐变);
添加字体动画或淡入效果,使页面更具观赏性;
使用 Google 字体(如 "Noto Serif CJK""Ma Shan Zheng" 等书法/手写字体)提升美感;
不使用外部 JS 和图片资源,所有样式通过内联 CSS 实现;
页面适配移动端,结构简洁,加载快速。

在这里插入图片描述

将生成的代码保存到本地电脑并命名为 .html 后缀的文件后,用浏览器打开即可查看页面效果,整体呈现非常美观、节日氛围浓厚。

在这里插入图片描述

5.2 DeepSeek-R1-32K在线体验

在已开通的商用服务列表中,我们选择DeepSeek-R1-32K的在线体验选项。

在这里插入图片描述

在 DeepSeek-R1-32K的对话框中,我们对其简单提问,让其介绍下自己,如下所示:

在这里插入图片描述

在DeepSeek-R1-32K对话框内,要求也一首现代诗,要求赞美夏天,要求质量高。给出的提示词如下所示:

请以“夏天”为主题,创作一首现代诗。要求如下:

语言优美,富有画面感和情感表达;
运用丰富的意象,如阳光、蝉鸣、荷花、雷雨、西瓜、微风等元素;
表达对夏天的喜爱与赞美,可融入自然之美、生命之力或时光之美的描写;
结构清晰,段落之间有节奏感和层次感;
风格清新自然或深沉热烈均可,避免陈词滥调,追求诗意创新。

生成的现代诗效果如下,整体质量还是令人非常满意的。

在这里插入图片描述

5.3 DeepSeek-V3/R1调用统计功能

ModelArts Studio 平台(MaaS服务)为 DeepSeek-V3 和 R1 模型提供了调用统计功能,可实时监控并记录模型服务的使用情况。 目前,调用统计数据仅针对通过 API 接口调用 产生的请求进行统计,页面体验等前端操作所触发的调用暂未纳入统计范围。

在这里插入图片描述

六、使用体验与总结

🌟 使用体验

在本次部署 DeepSeek-V3 与 DeepSeek-R1 商用服务的过程中,ModelArts Studio 展现出极高的易用性与稳定性。平台界面清晰直观,操作流程简洁流畅,即使是首次使用也能快速上手。从模型选择、服务开通到API调用,每一步都提供了详细的指引和实时反馈,极大提升了部署效率。整体体验下来,不仅感受到华为云在AI工程化落地方面的深厚技术积累,也对企业级AI服务平台的成熟度有了更深认知。

📈 总结展望

ModelArts Studio 凭借其强大的功能集成和灵活的资源调度能力,为企业大模型应用提供了坚实的技术底座。通过本次实践,我们验证了其在实际业务场景中的高效支持能力,特别是在模型性能、计费透明和调用监控方面的表现尤为突出。未来,随着更多大模型的接入和功能的持续优化,ModelArts Studio 将成为推动企业智能化转型的重要引擎。相信在华为云的持续赋能下,AI技术将更加快速、深入地融入各行各业的发展之中。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2396962.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

下载即转化的商业密码:解析华为应用商店CPD广告的智能投放逻辑

在移动互联网流量红利见顶的背景下,华为应用市场凭借其终端生态优势正成为开发者获客的新蓝海。数据显示,2025年Q1华为应用商店全球分发量同比增长27%,其中CPD广告因其"下载才付费"的精准特性,已成为金融、游戏、工具类…

分布式锁和数据库锁完成接口幂等性

1、分布式锁 唯一主键与乐观锁的本质是使用了数据库的锁,但由于数据库锁的性能不太好,所以我们可使用Redis、Zookeeper等中间件来实现分布式锁的功能,以Redis为例实现幂等:当用户通过浏览器发起请求,服务端接收到请求…

浅谈JMeter之常见问题Address already in use: connect

浅谈JMeter之常见问题Address already in use: connect 在JMeter高并发测试中出现“address already in use”错误,主要源于Windows系统的TCP端口资源耗尽及连接配置问题,在执行JMeter中查看结果树 原因分析 GET请求默认采用短连接(Conne…

【机器学习基础】机器学习入门核心算法:随机森林(Random Forest)

机器学习入门核心算法:随机森林(Random Forest) 1. 算法逻辑2. 算法原理与数学推导2.1 核心组件2.2 数学推导2.3 OOB(Out-of-Bag)误差 3. 模型评估评估指标特征重要性可视化 4. 应用案例4.1 医疗诊断4.2 金融风控4.3 遥…

【深度学习】12. VIT与GPT 模型与语言生成:从 GPT-1 到 GPT4

VIT与GPT 模型与语言生成:从 GPT-1 到 GPT4 本教程将介绍 GPT 系列模型的发展历程、结构原理、训练方式以及人类反馈强化学习(RLHF)对生成对齐的改进。内容涵盖 GPT-1、GPT-2、GPT-3、GPT-3.5(InstructGPT)、ChatGPT …

常规算法学习

算法 1. 排序算法1. 归并排序1.1 普通归并排序1.2 优化后的归并排序(TimSort) 2. 插入排序2.1 直接插入排序2.2 二分插入排序2.3 成对插入排序 3. 快速排序3.1 单轴快速排序3.2 双轴快排 4. 计数排序 2. 树1. 红黑树(Red Black Tree&#xff…

Google 发布的全新导航库:Jetpack Navigation 3

前言 多年来,Jetpack Navigation 库一直是开发者的重要工具,但随着 Android 用户界面领域的发展,特别是大屏设备的出现和 Jetpack Compose 的兴起,Navigation 的功能也需要与时俱进。 今年的 Google I/O 上重点介绍了 Jetpack Na…

Arbitrum Stylus 合约实战 :Rust 实现 ERC20

在《Arbitrum Stylus 深入解析与 Rust 合约部署实战》篇中,我们深入探讨了 Arbitrum Stylus 的核心技术架构,包括其 MultiVM 机制、Rust 合约开发环境搭建,以及通过 cargo stylus 实现简单计数器合约的部署与测试。Stylus 作为 Arbitrum Nitr…

内存管理--《Hello C++ Wrold!》(8)--(C/C++)--深入剖析new和delete的使用和底层实现

文章目录 前言C/C内存分布new和deletenew和delete的底层定位new表达式 内存泄漏作业部分 前言 在C/C编程中,内存管理是理解程序运行机制的核心基础,也是开发高效、稳定程序的关键。无论是局部变量的存储、动态内存的分配,还是对象生命周期的…

Java进阶---JVM

JVM概述 JVM作用: 负责将字节码翻译为机器码,管理运行时内存 JVM整体组成部分: 类加载系统(ClasLoader):负责将硬盘上的字节码文件加载到内存中 运行时数据区(RuntimeData Area):负责存储运行时各种数据 执行引擎(Ex…

C++ 检查一条线是否与圆接触或相交(Check if a line touches or intersects a circle)

给定一个圆的圆心坐标、半径 > 1 的圆心坐标以及一条直线的方程。任务是检查给定的直线是否与圆相交。有三种可能性: 1、线与圆相交。 2、线与圆相切。 3、线在圆外。 注意:直线的一般方程是 a*x b*y c 0,因此输入中只给出常数 a、b、…

23. Merge k Sorted Lists

目录 题目描述 方法一、k-1次两两合并 方法二、分治法合并 方法三、使用优先队列 题目描述 23. Merge k Sorted Lists 方法一、k-1次两两合并 选第一个链表作为结果链表,每次将后面未合并的链表合并到结果链表中,经过k-1次合并,即可得到…

Unity + HybirdCLR热更新 入门篇

官方文档 HybridCLR | HybridCLRhttps://hybridclr.doc.code-philosophy.com/docs/intro 什么是HybirdCLR? HybridCLR(原名 huatuo)是一个专为 Unity 项目设计的C#热更新解决方案,它通过扩展 IL2CPP 运行时,使其支持动态加载和…

ElasticSearch迁移至openGauss

Elasticsearch 作为一种高效的全文搜索引擎,广泛应用于实时搜索、日志分析等场景。而 openGauss,作为一款企业级关系型数据库,强调事务处理与数据一致性。那么,当这两者的应用场景和技术架构发生交集时,如何实现它们之…

【C语言极简自学笔记】项目开发——扫雷游戏

一、项目概述 1.项目背景 扫雷是一款经典的益智游戏,由于它简单而富有挑战性的玩法深受人们喜爱。在 C 语言学习过程中,开发扫雷游戏是一个非常合适的实践项目,它能够综合运用 C 语言的多种基础知识,如数组、函数、循环、条件判…

Maven概述,搭建,使用

一.Maven概述 Maven是Apache软件基金会的一个开源项目,是一个有优秀的项目构建(创建)工具,它用来帮助开发者管理项目中的jar,以及jar之间的依赖关系,完成项目的编译,测试,打包和发布等工作. 我在当前学习阶段遇到过的jar文件: MySQL官方提供的JDBC驱动文件,通常命名为mysql-…

Unity 环境搭建

Unity是一款游戏引擎,可用于开发各种类型的游戏和交互式应用程序。它由Unity Technologies开发,并在多个平台上运行,包括Windows、macOS、Linux、iOS、Android和WebGL。Unity也支持虚拟现实(VR)和增强现实(AR)技术,允许用户构建逼…

【入门】【练9.3】 加四密码

| 时间限制:C/C 1000MS,其他语言 2000MS 内存限制:C/C 64MB,其他语言 128MB 难度:中等 分数:100 OI排行榜得分:12(0.1*分数2*难度) 出题人:root | 描述 要将 China…

使用 SASS 与 CSS Grid 实现鼠标悬停动态布局变换效果

最终效果概述 页面为 3x3 的彩色格子网格;当鼠标悬停任意格子,所在的行和列被放大;使用纯 CSS 实现,无需 JavaScript;利用 SASS 的模块能力大幅减少冗余代码。 HTML 结构 我们使用非常基础的结构,9 个 .i…

Spring如何实现组件扫描与@Component注解原理

Spring如何实现组件扫描与Component注解原理 注解配置与包扫描的实现机制一、概述:什么是注解配置与包扫描?二、处理流程概览三、注解定义ComponentScope 四、核心代码结构1. ClassPathScanningCandidateComponentProvider2. ClassPathBeanDefinitionSca…