基于PAI+专属网关+私网连接:构建全链路 Deepseek 云上私有化部署与模型调用架构

news2025/5/20 3:22:33

DeepSeek - R1 是由深度求索公司推出的首款推理模型,该模型在数学、代码和推理任务上的表现优异,市场反馈火爆。在大模型技术商业化进程中,企业级用户普遍面临四大核心挑战:

  • 算力投入成本高昂:构建千亿参数级模型的训练与推理集群需巨额开支,导致中小企业难以跨越技术准入门槛;
  • 算力资源供应紧张:一线城市 GPU 集群受限于硬件供应短缺与资源抢占激烈,算力资源不足;
  • 模型部署复杂:从算法适配、性能调优到业务系统集成的端到端部署周期动辄数月,部署困难;
  • 数据安全合规风险:传统公网调用模式存在数据泄露隐患,难以满足企业对核心数据安全防护的严苛要求。

对于对数据主权敏感、业务全球化、需长期技术自主权的企业来说,其在 AI 商业化进程中实现技术可控、成本可控、风险可控尤为重要,基于以上基本诉求,此类客户更加注重:

  1. 自主可控的 AI 部署能力:
  • 需要灵活管理模型版本、算法优化路径,而非完全依赖第三方 API 接口。
  • 可定制模型(如微调预训练模型或集成自研算法)。
  1. 数据隐私与合规性保障:
  • 核心业务数据(如客户隐私、生产数据、财务数据)需在私有网络内处理,避免公网暴露风险。
  1. 跨区域业务协同需求:
  • 全球化业务需在不同区域(如亚洲、欧洲、美洲)部署低延迟的AI推理服务。
  1. 成本与资源效率优化:
  • AI 推理使用量大,避免 API 的高单价调用成本,需自主可控的按需弹性调度算力资源。

为了解决以上问题,阿里云推荐使用基于阿里云 PAI+ 专属网关 + 私网连接解决方案:破解大模型落地的技术与资源瓶颈。

阿里云 PAI 目前已经支持一键部署 DeepSeek-V3、DeepSeek-R1 模型,结合乌兰察布的 GPU 资源与阿里云 CEN 全球骨干网能力,配合使用专属网关 + 私网连接,企业可快速搭建:

  1. 全球骨干级内网通道:通过 CEN 云企业网打通全球 VPC 与本地混合云,实现内网级访问延迟

  2. 全链路零公网暴露:专属网关 + 私网连接确保模型调用、数据传输全程私有化

  3. 东数西算算力网络:低成本利用乌兰察布算力资源,支撑全球业务的 AI 推理需求

通过此方案可以帮助企业级用户搭建东数西算核心算力网络,快速构建零公网暴露的云上私有化部署与模型调用架构。

场景示例

本文以下图场景为例。某企业在阿里云华东(上海)地域创建了专有网络 VPC1,在该 VPC1 中有业务环境。为了业务环境的稳定性和安全性,该企业希望在乌兰察布使用 PAI 部署一套自有的云上 Deepseek 模型调用环境,提供给上海的业务集群使用,并要求私网访问,以构建全链路私有化部署与模型调用架构。
在这里插入图片描述

前提条件

  • 您已在乌兰察布地域创建了专有网络 VPC1,并在两个可用区内创建两台交换机
    VSW1、VSW2,创建了对应的安全组。具体操作,请参见创建专有网络,创建和管理交换机。
  • 您已在上海地域创建了专有网络 VPC2,并在两个可用区内创建两台交换机
    VSW3、VSW4,创建了对应的安全组。具体操作,请参见创建专有网络,创建和管理交换机。
  • 您已分别在 VSW3 和 VSW4 中创建 ECS01 和 ECS02 实例。
  • 您已创建云企业网 CEN,并分别在上海、乌兰察布创建好转发路由器 TR,并将 VPC1 和 VPC2 互相打通,具体步骤请参考跨地域
    VPC 互通。

步骤一:使用模型在线服务 EAS,一键搭建 DeepSeek-R1 模型

  1. 登录人工智能平台 PAI。

  2. 在顶部菜单栏,选择 PAI 所属的地域。

  3. 在左侧导航栏,选择模型部署 > 模型在线服务( EAS )。

  4. 在推理服务中,点击部署服务。

  5. 在场景化模型部署中,选择 LLM 大语言模型部署。
    在这里插入图片描述
    在这里插入图片描述

  6. 点击部署。

步骤二:在 EAS 模型在线服务中创建专属网关,打通服务调用所属 VPC

  1. 在模型在线服务( EAS )菜单栏中,切换到专属网关页签,新建专属网关 > 新建后付费专属网关。
    在这里插入图片描述

  2. 在模型在线服务( EAS )菜单栏中,切换到专属网关页签,新建专属网关 > 新建后付费专属网关(按量付费)。

  3. 购买完成后,为专属网关添加专有网络。
    单击专属网关名称,在开通相关服务后,在网关详情页面网关访问控制 > 专有网络页签,添加乌兰察布地域专有网络 VPC1 ,交换机 VSW2。创建后,在乌兰察布地域进入私网连接 > 终端节点,可以看到专属网关自动已经创建好对应的接口终端节点。
    在这里插入图片描述
    在这里插入图片描述

  4. 为专属网关关联其他 VPC,本文选择华东(上海)地域 VPC1。
    在这里插入图片描述
    在这里插入图片描述

创建后,在云解析 Privatezone > 域名设置里,可以看到专属网关已自动创建好对应的 VPC 内网解析。
在这里插入图片描述
5. 修改专属网关白名单设置,放通对应的 VPC 网段。
在这里插入图片描述
在这里插入图片描述

步骤三:将模型在线服务 EAS 加入到对应专属网关

  1. 在模型在线服务( EAS )菜单栏中,切换到推理服务页签,在对应模型服务的操作菜单中点击更新。
    在这里插入图片描述
  2. 在页签的右上角点击切换为自定义部署,下拉菜单到服务功能页签,选择已经创建的专属网关,并更新配置。
    在这里插入图片描述
    在这里插入图片描述
  3. 在模型在线服务( EAS )菜单栏中,切换到推理服务页签,在对应模型服务的服务方式菜单中点击调用信息。
    在这里插入图片描述
    选择 VPC 地址调用,可以看到对应的模型服务地址以及 Token 信息
    在这里插入图片描述

步骤四:测试使用私网调用 EAS 模型服务

  1. 登录上海地域 VPC2 内的 ECS01,并将 EAS 模型服务对应的 Token 添加到环境变量中。

执行以下命令,将环境变量设置追加到 ~/.bashrc 文件中:
# 用对应的调用 Token 代替 <你的EAS的TOKEN>

echo "export EAS_TOKEN=<你的EAS的TOKEN>" >> ~/.bashrc

执行以下命令,刷新环境变量设置

source ~/.bashrc

在这里插入图片描述
2. 使用私网 HTTP / HTTPS 调用模型服务

示意如下,其中,< model_name > 请替换为模型列表接口 <EAS_ENDPOINT>/v1/models 获取的模型名称,< EAS_ENDPOINT > 请替换为 EAS VPC 地址调用的域名。

备注:调用方式可以为 HTTP / HTTPS.

curl -X POST \
    -H "Content-Type: application/json" \    
    -H "Authorization: Bearer $EAS_TOKEN" \    
    -d '{
         "model": "<model_name>",        
         "messages": [        
         {      
              "role": "system",            
              "content": "You are a helpful assistant."        
         },        
         {            
              "role": "user",            
              "content": "hello!"       
         }        
         ]    
    }' \    
    <EAS_ENDPOINT>/v1/chat/completions

返回成功响应表明私网调用 DeepSeek - R1 通道 已成功建立。
在这里插入图片描述

(可选)步骤五:使用 EAS 专属网关公网调用能力

  1. 为专属网关添加公网访问能力。

单击专属网关名称,在开通相关服务后,在网关详情页面网关访问控制 > 公网页签,打开访问入口按钮,并添加公网访问白名单。
在这里插入图片描述
2. 使用公网 HTTP / HTTPS 调用模型服务

示意如下,< EAS_TOKEN > 请替换为 EAS 的 Token 信息,< model_name > 请替换为模型列表接口 <EAS_ENDPOINT>/v1/models 获取的模型名称,

< EAS_ENDPOINT > 请替换为 EAS 公网调用的地址。

备注:调用方式可以为 HTTP / HTTPS.

curl -X POST \
    -H "Content-Type: application/json" \
    -H "Authorization:  <EAS_TOKEN>" \
    -d '{
        "model": "<model_name>",
        "messages": [
        {
            "role": "system",
            "content": "You are a helpful assistant."
        },
        {
            "role": "user",
            "content": "hello!"
        }
        ]
    }' \
    <EAS_ENDPOINT>/v1/chat/completions

使用本地设备测试,返回成功响应表明公网调用 DeepSeek - R1 通道 已成功建立。
在这里插入图片描述
阿里云通过 PAI+ 专属网关 + 私网连接方案,为企业级用户构建了技术可控、成本优化、安全可靠的 AI 私有化部署调用路径。该方案不仅解决了算力资源紧张与部署复杂度高的痛点,全链路私有化部署和全球低延迟算力网络,也满足了企业对数据主权、全球化业务部署及长期技术自主的需求。凭借乌兰察布算力资源与 CEN 骨干网的协同,企业可快速实现大模型的高效落地,为 AI 技术的规模化应用提供了可信赖的基础设施支撑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2337436.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【cocos creator 3.x】cocos creator2.x项目升级3.x项目改动点

1、基本改动 基本改动&#xff1a;去掉了cc.&#xff0c;改成在顶部添加导入 项目升级时候直接将cc.去掉&#xff0c;根据提示添加引用 node只保留position,scale,rotation,layer 其余属性如opacity&#xff0c;如果需要使用需要在节点手动添加UIOpacity组件 3d层和ui层分开…

List基础与难度题

1. 向 ArrayList 中添加元素并打印 功能描述&#xff1a; 程序创建一个空的 ArrayList 集合&#xff0c;用于存储字符串类型的元素。向该 ArrayList 中依次添加指定的字符串元素。使用增强型 for 循环遍历 ArrayList 中的所有元素&#xff0c;并将每个元素打印输出到控制台。 …

Oracle19C低版本一天遭遇两BUG(ORA-04031/ORA-600)

昨天帮朋友看一个系统异常卡顿的案例&#xff0c;在这里分享给大家 环境&#xff1a;Exadata X8M 数据库版本19.11 1.系统报错信息 表象为系统卡顿&#xff0c;页面无法刷出&#xff0c;登陆到主机上看到节点1 系统等待存在大量的 cursor: pin S wait on X等待 查看两个节…

【4.1.-4.20学习周报】

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 摘要Abstract一、方法介绍1.1HippoRAG 1.2HippoRAG2二、实验2.1实验概况2.2实验代码2.3实验结果 总结 摘要 本博客介绍了论文《From RAG to Memory: Non-Parametri…

python学习—合并多个word文档

系列文章目录 python学习—合并TXT文本文件 python学习—统计嵌套文件夹内的文件数量并建立索引表格 python学习—查找指定目录下的指定类型文件 python学习—年会不能停&#xff0c;游戏抽签抽奖 python学习—循环语句-控制流 python学习—合并多个Excel工作簿表格文件 pytho…

[Python] UV工具入门使用指南——小试牛刀

背景 MCP开发使用到了uv&#xff0c;简单记录一下&#xff1a; 为什么MCP更推荐使用uv进行环境管理&#xff1f; MCP 依赖的 Python 环境可能包含多个模块&#xff0c;uv 通过 pyproject.toml 提供更高效的管理方式&#xff0c;并且可以避免 pip 的一些依赖冲突问题。…

PclSharp ——pcl的c#nuget包

简介&#xff1a; NuGet Gallery | PclSharp 1.8.1.20180820-beta07 下载.NET Framework 4.5.2 Developer Pack&#xff1a; 下载 .NET Framework 4.5.2 Developer Pack Offline Installer 离线安装nupkg&#xff1a; nupkg是visual studio 的NuGet Package的一个包文件 安…

MGR实现mysql高可用性

一。MGR和PXC的区别 1. PXC的消息广播机制是在节点间循环的&#xff0c;需要所有节点都确认消息&#xff0c;因此只要有一个节点故障&#xff0c;则会导致整个PXC都发生故障。而MGR则是多数派投票模式&#xff0c;个别少数派节点故障时&#xff0c;一般不影响整体的可用性。这…

新型多机器人协作运输系统,轻松应对复杂路面

受到鱼类、鸟类和蚂蚁等微小生物体协作操纵的启发&#xff0c;研究人员开发了多机器人协作运输系统&#xff08;Multirobot Cooperative Transportation Systems&#xff0c;MRCTS&#xff09;运输单个机器人无法处理的重型超大物体&#xff0c;可用于搜救行动、灾难响应、军事…

【秣厉科技】LabVIEW工具包——OpenCV 教程(19):拾遗 - imgproc 基础操作(上)

文章目录 前言imgproc 基础操作&#xff08;上&#xff09;1. 颜色空间2. 直方图3. 二值化4. 腐蚀、膨胀、开闭运算5. 梯度与轮廓6. 简易绘图7. 重映射 总结 前言 需要下载安装OpenCV工具包的朋友&#xff0c;请前往 此处 &#xff1b;系统要求&#xff1a;Windows系统&#x…

学习笔记:金融经济学 第3讲

学习笔记&#xff1a;金融经济学 第3讲 注&#xff1a;A本金&#xff0c;n时间&#xff08;比如年&#xff09;&#xff0c;r利率一、 计算习惯1. 单息&#xff08;新产生的利息不算进本金重新计算利息&#xff0c;收款额A(1nr) &#xff09;2. 复利(新产生的利息算进本金重新计…

NVIDIA RTX™ GPU 低成本启动零售 AI 场景开发

零售行业正在探索应用 AI 升级客户体验&#xff0c;同时优化内部流程。面对多重应用场景以及成本优化压力&#xff0c;团队可采用成本相对可控的方案&#xff0c;来应对多重场景的前期项目预演和落地&#xff0c;避免短期内大规模投入造成的资源浪费。 客户体验 AI 场景的研究…

【网络】IP层的重要知识

目录 1.IP层的作用 2.主机和节点 3.网络层和数据链路层的关系 4.路由控制 4.1.路由控制的过程 4.2. IP地址与路由控制 4.3.路由控制表的聚合 4.4.静态路由和动态路由 4.5.动态路由的基础 5.数据链路的抽象化 5.1.数据链路不同&#xff0c;MTU则相异 5.2.路径MTU发…

OpenCV 模板匹配方法详解

文章目录 1. 什么是模板匹配&#xff1f;2. 模板匹配的原理2.1数学表达 3. OpenCV 实现模板匹配3.1基本步骤 4. 模板匹配的局限性5. 总结 1. 什么是模板匹配&#xff1f; 模板匹配&#xff08;Template Matching&#xff09;是计算机视觉中的一种基础技术&#xff0c;用于在目…

一键解锁Landsat 9地表温度计算!ENVI与ArcGIS Pro全流程详解(无需NASA大气校正)

为什么选择Landsat 9的L2SP数据&#xff1f; 之前&#xff1a;《ArcGIS与ENVI——基于landsat与Modis影像的遥感技术的生态环境质量评价》&#xff0c;基于Landsat前期的产品计算温度反演数据需要一系列复杂的步骤。 现在&#xff1a; Landsat 8-9的Collection 2 Level-2&…

RK3588的linux下实现HDMI输出分辨率及帧率的裁剪

bug反馈&#xff1a;客户现场反馈hdmi接显示屏出现概率性闪黑屏&#xff0c;排除线材&#xff0c;显示屏及GND等外部因素后&#xff0c;提出尝试降低hdmi的输出分辨率和帧率对比测试看看。 Step1&#xff1a;先直接在linux的sdk中找到板卡编译生成后的dts找到hdmi节点 然后找到…

XR技术赋能艺术展演|我的宇宙推动东方美学体验化

本次广州展览现场引入我的宇宙XR体验模块&#xff0c;通过空间计算与动作捕捉技术&#xff0c;让观众在潮玩艺术氛围中体验虚拟互动&#xff0c;打造“看得懂也玩得动”的展演新场景。 作为科技与文化融合的推动者&#xff0c;我的宇宙正在以“体验科技”为媒介&#xff0c;为潮…

多线程进阶知识篇(二)

文章目录 一、Synchronized 锁二、ReentrantLock 锁三、两阶段终止阶段一&#xff1a;通知终止阶段二&#xff1a;响应中断 四、线程池为什么要使用线程池&#xff1f;如何创建线程池&#xff1f;ExecutorsThreadPoolExecutor 线程池的基本参数 五、线程池处理任务的流程 一、S…

Python深度学习基础——深度神经网络(DNN)(PyTorch)

张量 数组与张量 PyTorch 作为当前首屈一指的深度学习库&#xff0c;其将 NumPy 数组的语法尽数吸收&#xff0c;作为自己处理张量的基本语法&#xff0c;且运算速度从使用 CPU 的数组进步到使用 GPU 的张量。 NumPy 和 PyTorch 的基础语法几乎一致&#xff0c;具体表现为&am…

简单实现单点登录

单点登录 单点登录&#xff08;Single Sign-On, SSO&#xff09; SSO是一种统一身份认证技术&#xff0c;用户只需在认证平台登录一次&#xff0c;即可访问所有关联的应用程序或网站&#xff0c;无需重复输入凭据。例如&#xff0c;企业员工登录内部系统后&#xff0c;可直接…