CIPU落地专有云:是“小众需求”还是“机会之门”?

news2025/8/7 1:44:51

2022 年 11 月,云栖大会主论坛,阿里巴巴集团副总裁、阿里云智能基础产品事业部负责人蒋江伟分享了阿里云专有云的一项新进展 —— CIPU 落地飞天企业版。在分析师峰会上,阿里巴巴集团研究员、阿里云专有云总经理刘国华也向分析师们详细介绍了 CIPU 在专有云商用的核心技术指标。

CIPU 落地专有云,简单的一句话,背后却是一个不简单的故事。
在这里插入图片描述

刘国华向分析师们介绍 CIPU 在专有云商用的核心技术指标

让阿里云骄傲的 CIPU

时间拉回到 5 个月前,2022 年 6 月阿里云峰会上,阿里云智能总裁张建锋献出“大招”,首次推出 CIPU 云基础设施处理器(Cloud Infrastructure Processing Units),这是一套为云而生的全新计算体系架构。

罗马不是一天建成,这一架构先从「神龙」开始,然后通过「洛神」解决网络性能瓶颈问题,最后「盘古」实现对存储资源的云化加速,是三大计算核心组件全面加速的成果。

云计算优势众多,但是虚拟化带来的资源损耗过大,一度是困扰云服务商的“卡脖子问题”。在 CPU 通用架构之下,云厂商在软件层面的优化早已走到尽头,于是转身开始从硬件侧攻克。在 2017 年 10 月,阿里云神龙横空出世,通过软硬一体化思路来解决虚拟化开销问题,比亚马逊 AWS 的 Nitro 架构早了一个月。

淮南为橘,淮北为枳?

CIPU 对于阿里云来说,是一个强有力的竞争门槛。早期的神龙架构通过将虚拟化损耗不断降低,在部分场景下甚至可以实现超越物理机的性能,帮助阿里云降本增效,在公共云的红海市场中,以技术加深了市场护城河。

在公共云上纵横披靡的 CIPU,是否适合专有云呢?虽然阿里云专有云一直和公共云技术架构同源,采用相同的飞天云计算操作系统,但是二者服务的客户群体却有很大区别。专有云作为一种部署形态,一般是政企大B 客户通过资产自持的方式,建立自己的云计算数据中心。

除了少数需要对外提供行业云服务的政企外,很多政企的云平台只需要面向内部提供平台侧服务,不需要面向外部提供租户侧服务。也就是说,资源反正都已经买回家了,虚拟化损耗问题虽然也是问题,但是远没有稳定、弹性、性能等问题重要。

阿里云的大招 CIPU,对于专有云,究竟是食之无味的鸡肋,还是能撬动政企市场的神之一手?

CIPU 一小步 核心应用上云的一大步

一项技术是否能够撬动市场,很大程度上取决于这项技术是否能切中客户的核心需求。

对于政企客户而言,他们对于云平台的痛点在哪里?为什么有些政企迟迟不将核心应用从传统架构迁移到自家的云平台?又是为什么,很多政企客户即使建了云,使用率也并不高?

两个字概括原因:运维。

与公共云不同,在专有云的部署形态下,运维主体从云厂商迁移至政企自身。政企 CIO 要面临的核心课题,就是把 IT 基础设施运维好,能稳定支持业务的发布、变更和运行。而现在,政企需要同时维护好两套端到端完全不同的技术栈,这是非常困难的。特别是在运维压力最大的 IT 基础设施领域,传统专有硬件基础上的各种封闭系统,与软件化服务化 IaaS、DBaaS 等系统,在技术架构、运维方法、生态体系方面,差异巨大。这种割裂的方式,带来了很高的复杂性和挑战,也越来越难以持续。

这里可能会有疑问,为什么要维护两套技术栈呢?既然云计算是未来,为什么不把所有的业务都放在云上呢?

不是不想,而是太难。

过去 30 年,政企借助传统软硬一体、存算分离的集中式数据库架构,支持保障核心业务系统的建设和发展。之后,随着数字化转型大潮涌来,政企也在发展互联网型的创新业务,数据量急剧增多,数据库也逐渐从 Shared Mem/Disk 的集中式架构,向 Shared Nothing 分布式架构演变。

互联网型的创新业务往往是从 0 到 1 使用云原生的方式开发建设,没有历史包袱,上云步伐非常轻快。然而,还有大量的核心生产业务和传统业务,仍然停留在基于单台物理机本地盘的数据库中。如果要这些业务和互联网业务一样走向分布式架构,那就要求政企对大量应用架构配套进行分布式重构。

可是许多政企的传统应用负载积累了几十年,弹性扩展要求不高,大多是外采或外包定制开发,政企自己的软件开发运维人员很少,很难快速实现全面的云原生化重构。

如果没有好的解决方案,政企的大量传统业务就会迟迟停留在传统 IT 基础架构上,只有少量的互联网业务在云平台上运行。这就导致了上文所说的“运维两套技术栈”的难题。

政企客户不想大跃进 需要陪伴式一步一步前行

2B IT 市场的发展,不是一蹴而就的,而是陪伴式的。既然政企客户传统应用快速全面 PaaS 云原生重构不现实,那是不是可以有另一种解题思路,让客户只对传统应用做少量云就绪化改动,通过 IaaS 平迁的方式上云呢?

神龙+VPC 网络+全闪云盘的新一代软硬一体、存算分离架构,配合其上部署的、封装了分布式技术,对客户提供 100T 容量、100 万 QPS 的集中式大型数据库 PolarDB,就可以很好地满足这一要求,使政企不一定都要做云原生分布式改造,也能进行 IaaS 托管式平迁上云。

阿里云专有云首席架构师张晓丹,一直坚信 CIPU 对于政企客户的巨大价值。因为他认为,Back to basic,回归技术本源,云计算的核心本质是池化共享、按需服务、敏捷弹性。之前专有云上的各个云产品分散在各自的物理机上,无法形成共池,弹性也受损。如果能够借助 VPC 内存算分离的 ECS,把计算、存储、网络三大件分别池化服务化,再带动上层产品池化服务化,就能为云产品带来更好的按需服务敏捷弹性、与客户应用共池复用、最小交付部署起步、增加容灾备份企业特性等好处。但是,云产品全面上 ECS,也会带来存算分离时延大,相比物理机虚拟化开销更大的问题。

作为 CIPU 的前身,神龙软硬一体解决方案的技术本质,就是用软件定义硬件卸载的新一代软硬一体、存算分离架构,取代之前硬件定义系统集成的传统软硬一体、存算分离架构,让 ECS 存算分离架构容量吞吐量更大,单位成本更低,同时保证弹性,让用户能敏捷获取资源。

理论合理,回归现实,CIPU 在专有云的表现究竟如何?

走向政企之前 需要用事实和数据说话

政企客户需要了解实现的过程,看到真实的测试数据甚至实践案例,才可能对新技术产生信任。

2020 年,一场技术原型验证在阿里云团队默默开始了,张晓丹和架构师林泉一起选定了 3 个典型场景。尽管一开始的测试结果让所有人大失所望,好在转机很快到来,一项刚刚出炉的软件加速技术像是关键补给一样让 CIPU 的测试“鲤鱼跃龙门”,达到整体性价比刚好超越传统架构的及格水平。随着后续更新一代飞天神龙、硬件加速新技术的推出,CIPU 在专有云的整体性能和性价比也就像“开挂”了一样“一骑绝尘”,相对传统架构,在性价比上有了大幅的提升,在容量吞吐量上甚至有几倍的提升。

在家里表现优异还不够,还需要到客户的真实业务场景中接受考验。于是,阿里云和几家国有大行一同启动科研共创,基于金融客户真实的使用场景,以及大量的客户交流反馈,在两个月的实验之后,终于锁定了 CIPU 在专有云的落地场景。

2021 年的春天,阿里云专有云掌门人刘国华很明确地告诉团队,我们要在专有云的飞天企业版上,落地 CIPU。2022 年 5 月,CIPU 在飞天企业版正式发布,刘国华和他的团队,做到了。

CIPU,飞天企业版请你释放实力

CIPU 技术在专有云刚落地,就收到了国内某大型头部金融客户的需求,这一客户之前就在阿里云公共云上使用 CIPU,希望在专有云上也能实现同样的高性能和高稳定性。

结果让客户非常满意。数据库在专有云上部署的场景中,CIPU 不仅可以提供存算分离的弹性数据库架构,同时可显著提升云上数据库的性能。针对 PolarDB 和客户在 ECS 上自建数据库两个应用场景,典型使用场景的性能提升可达到 30%-50%,整体时延可降低 40%-50%。

在高性能之外,专有云 CIPU 对于政企客户另一大吸引力是拥有极致稳定的核心优势。很多金融客户对稳定性要求很高,甚至一些大型银行机构对数据库在云平台上的运行要求是“零毛刺”。之前使用传统虚拟化技术时,当并发量较高时会产生显著的资源争抢,导致数据库/云原生应用运行时性能不够稳定。通过 CIPU,飞天企业版可以实现数据库所在的计算实例与虚拟化内核之间的“0”资源争抢,完全消除因此带来的运行态毛刺。直观来说,就算进行上万笔交易,也不会有一笔交易被卡住。

目前,飞天企业版 CIPU 解决方案已经在某大型金融集团和国内某大行投入使用,从而拥有了大规模标准化交付的竞争力优势。这一方面得益于 CIPU 核心技术在公共云上的长期验证,方案被打磨得更加成熟,另一方面也得益于专有云不断提升的可运维和交付的产品化能力。

通往未来的必经之路,道阻且长

虽然 CIPU 在专有云上的实力不容质疑,但是依然受到了一些政企客户的怀疑。软硬一体使得政企担心被一家厂商绑定的风险,客户说:“我们不想用十年时间刚刚送走传统 IT 厂商,又来了一个可能再次绑定我们的阿里云”。

面对这些质疑,张晓丹一直在各种场合反复布道:软硬一体并不代表系统封闭。首先,CIPU 可以适配不同的服务器,并且向上也在开放适配数据库/大数据/PaaS 等多种解决方案,甚至客户可以自己采购类似硬件,自己设计开发 DIY 类似的架构(只是 ROI 不好)。在价格方面,CIPU 是透明的,这个成本占服务器总成本的比例小于对服务器总体容量性能的提升。这里,还没有算上时延大幅降低、企业级特性全面增强的红利。

此外,行业也有多供应商提供解决方案选择,是行业普遍认同的技术发展方向。客户还可以通过建设异构多云,防止供应商绑定,不会出现大机、小机独家垄断的局面。

一项新的技术,可能会受到市场的质疑,但是技术的发展趋势,不会就这样被打断。随着向上向下生态的不断拓展,CIPU 的优势会被不断累积放大。

软硬一体的道路,现在已经成为了行业共识。

这是一条通往未来的必经之路,可以预见的是依然很远很长,好在阿里云专有云,已经迈出了这一步。

机会之门,终究会为有准备的人打开

2022 年 11 月云栖大会专有云技术和应用实践论坛上,专有云产品负责人谢宁把飞天企业版的核心竞争力概括为“一体两翼”,其中“一体”就是指,专有云和公共云同根同源,充分利用公共云的技术红利。

而 CIPU 在专有云的落地,不仅是验证专有云竞争力的一个例子,还打开了未来更多可能性的大门。政企客户非常在意稳定,先进的技术可以在公共云上完成打磨变得成熟之后,落地专有云,以更好地服务政企。

刘国华在对内部述职的时候说到,他最欣慰的是,做专有云这几年来,没有让团队走弯路,没有让客户做小白鼠。也是因为一直以来,阿里云专有云平台的核心技术架构始终坚持与公共云保持一致,最大限度复用公共云技术研发实践红利,避免了产品技术路线分支可能的推倒重来,保持了产品技术架构稳定、平滑升级和持续发展。

而回顾整个 CIPU 落地专有云的始末,首席架构师张晓丹说他感觉最挑战的时刻,就是在项目开展最初,需要向各方反复宣讲未来的场景价值,取得广泛的共识。同时,也要引导大家,选择一起为未来投资。

如果一定要问是什么让大家凝聚起来,最终做成了这件事,那应该就是一种相信。

在阿里云,大家相信专有云是陪伴政企数智创新的同行者,必须坚定地投入专有云;专有云更相信,公共云是专有云背后的坚实依靠,只有不断充分释放公共云红利,才能更好地服务政企,拥有确定性的未来。

而未来的机会之门,终究会为有准备的人打开。

CIPU落地专有云:是“小众需求”还是“机会之门”?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/15606.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

双一流高校全球通邮经验:Coremail安全海外中继提升科研效率

在这个“后疫情时代”,高校间的国际交流合作更应架起桥梁,承担起文明交流互鉴的责任,邮件往来交流作为学术交流的重要工具,保障全球高校学术交流安全畅通,是Coremail针对高校教育邮件服务的重点之一。 针对高校行业面临…

python一键采集高质量陪玩,心动主播随心选......

人生苦短,我用python 北京时间11月6日上午,2022英雄联盟全球总决赛(S12)冠亚军决赛在美国旧金山大通中心球馆进行,随着DRX的成功夺冠,在全球进一步掀起了电竞热潮。 newzoo 《2022电竞市场报告》显示&…

《MySQL实战45讲》——学习笔记18 “索引失效、函数/隐式转换“【建议收藏】

本文介绍几种MYSQL中索引失效的典型SQL用法,包括对索引字段使用函数、索引字段隐式类型转换(如字符串转数值类型,实质上也是使用CAST函数)、索引字段隐式字符编码转换(如utf8mb4字符集与utf8字符集的等值判断&#xff…

Leetcode101:对称二叉树

原文链接:101. 对称二叉树 - 力扣(LeetCode) 题目 给你一个二叉树的根节点 root , 检查它是否轴对称。 示例 1: 输入:root [1,2,2,3,4,4,3] 输出:true 示例 2: 输入:r…

日志异常检测准确率低?一文掌握日志指标序列分类

背景 目前,日志异常检测算法采用基于时间序列的方法检测异常,具体为:日志结构化->日志模式识别->时间序列转换->异常检测。异常检测算法根据日志指标时序数据的周期性检测出历史新增、时段新增、时段突增、时段突降等多种异常。 然…

那么多优秀的自动化测试工具,而你只知道Selenium?

如今,作为一名软件测试工程师,几乎所有人都需要具备自动化测试相关的知识,并且懂得如何去利用工具,来为企业减少时间成本和错误成本。这是为什么呢? 在以前,测试人员一般都只需要扮演终端用户,…

【云原生 | Kubernetes 系列】--Gitops持续交付 ArgoCD 部署与概念

1. Pull Pipeline 使用Pull Pipeline可以不在集群以外的地方保存凭据,避免凭据泄露的风险 工作模式: 两个Git仓库. 程序代码 程序员维护 分支策略 Hotfix Feature Develop Release Master 部署配置 基于OAM管理 Updater CI流水线交付了新的Image Operator Spec 期望状态 …

UE5笔记【一】安装、第一个关卡:光线、原点、平面;光线、天空、云朵;内容抽屉;运动控制;

第一步:安装UE5 下载Epic Games客户端。 下载EpicGames客户端,完成注册账户。 然后选择【库】、选择【引擎版本】后面的加号【】、然后点击【下拉箭头】选择你要安装的版本。点击【安装】。 特别提醒:请找一块特别大的硬盘存储空间&#xf…

prometheus+alertmanager 企业微信告警

一、应用安装启动 1、软件准备 alertmanager-0.24.0.linux-amd64.tar.gz blackbox_exporter-0.22.0.linux-amd64.tar.gz node_exporter-1.4.0.linux-amd64.tar.gz prometheus-2.40.0-rc.0.linux-amd64.tar.gz 2、配置文件 cat /data/prometheus/prometheus.yml #根据自己情况…

liunx集成jmeter进行压测实践

首先liunx环境需要部署jdk 1,获取jmeter免安装包:点击我获取免安装包 2,获取jmeter-manger工具,用于生成报告,日志等 点击我获取工具 3,在服务器上新建一个文件夹存放jmeter,推荐在/usr/local/下面,我这里由于权限问…

微服务真的过时了吗?Twitter员工因为微服务被马斯克解雇了

马斯克吐槽微服务 最近Twitter因为马斯克收购而大幅裁员的消息闹得可谓是沸沸扬扬,但是最近马斯克吐槽Twitter内部服务200个RPC的新闻更是闹得不可开交,并且和员工在twitter上的争论更是因为了程序猿界的广泛转发和评论 微服务真的是一个糟糕的设计吗&a…

如何处理海量数据文件以及大文件数据查找

目录 一.处理海量整数文件 ①问:假定有40亿个无符号整数,判断某数据是否在其中? ②问:假定有40亿个无符号整数,找到只出现一次的数据,两次,三次...? ③问:两个文件各…

[ Linux ] 动静态库 手把手教你写一个自己的库

目录 静态库与动态库 生成 发布动静态库 形成发布静态库 形成发布动态库 一个makefile同时生成动静态库 如何使用动静态库 使用静态库 正确做法: 使用动态库 运行动态库 为什么动态库运行时有找库的步骤 静态库与动态库 静态库(.a&#xff0…

聊一聊作为高并发系统基石之一的缓存,会用很简单,用好才是技术活

大家好,又见面了。 在服务端开发中,缓存常常被当做系统性能扛压的不二之选。在实施方案上,缓存使用策略虽有一定普适性,却也并非完全绝对,需要结合实际的项目诉求与场景进行综合权衡与考量,进而得出符合自…

Spring Security认证之用户定义

本文内容来自王松老师的《深入浅出Spring Security》,自己在学习的时候为了加深理解顺手抄录的,有时候还会写一些自己的想法。 在前面的案例中,我们登陆的用户信息是基于配置文件来配置的,其本质上是基于内存来实现的。但是在实际…

(5)多机器人集群编队策略

系列文章目录 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 TODO:写完再整理 文章目录系列文章目录前言一、多机器人集群编队策略1、多机器人协同作业冲突问题(1)介绍(2)多机器人系统…

学会Spring Cloud微服务架构绝活,渣本也能进大厂

微服务架构是互联网很热门的话题,是互联网技术发展的必然结果。它提倡将单一应用程序划分成一组小的服务,服务之间互相协调、互相配合,为用户提供最终价值。虽然微服务架构没有公认的技术标准和规范或者草案,但业界已经有一些很有…

C++程序设计--第三章内容

提前声明: 本文内容为华北水利水电大学研究生C课程,如有 侵权请告知,作者会予以删除 1.函数 函数作用 —— 任务划分;代码重用定义形式 类型 函数名 ( 形式参数表){语句序列}调用形式 函数名&#x…

数据结构:树

文章目录一.树的概念二.树的相关概念三.树的表示一.树的概念 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下…

『Java』数组中值得说的那些事

文章目录前言一、数组的创建及初始化🌳1、数组的创建🌳2、数组的初始化🍑(1)动态初始化🍑(2)静态初始化二、数组的使用🌳1、数组中元素访问🌳2、遍历数组&…