黄仁勋:龙虾就是新操作系统!英伟达7种芯片拼出算力怪兽,放话2027营收万亿美元

news2026/3/19 13:34:11
梦晨 henry 发自 凹非寺量子位 | 公众号 QbitAI英伟达GTC 2026很不寻常黄仁勋迟到了15分钟。今年有450家企业赞助、1000场技术分会、2000位演讲者、110台机器人这样的规模已经不像一场技术会议更像AI行业的年度朝圣。皮衣老黄站在舞台中央接受了新称号“Token之王”。这次他没有直奔芯片发布而是花了整整一个小时从25年前的GeForce游戏显卡讲起讲到20年前的CUDA讲到10年前的RTX渲染技术讲到云计算合作伙伴再讲到今天的爆火OpenClaw和token经济。AI从感知到生成到推理再到执行每一步都需要生成更多token消耗更多算力。所有这一切铺垫只为引出一个数字英伟达到2027年营收预计至少达到1万亿美元。去年GTC上我看到了5000亿美元的高确信需求。今年站在同一个舞台上这个数字变成了1万亿美元覆盖Blackwell和Rubin到2027年的订单。而且我确定实际需求会比这更高。就在这个瞬间与现场观众的掌声和欢呼声一同高涨的是英伟达股价。Token工厂经济学老黄教全球CEO看一张图只有英伟达的Keynote你才会看到去年的slide再出现一次。而老黄称这是全球CEO都要仔仔细细研究的一张图。纵轴是Token吞吐量每瓦产出多少Token横轴是Token速率每秒生成多少Token。吞吐量代表你的工厂产能速率代表AI的“聪明程度”模型越大、上下文越长、思考越深速率就越低但每个Token越值钱。老黄把这张图变成了一套完整的商业模型。免费层高吞吐、低速率用来获客。中间层$3-$6/百万Token服务普通用户。高级层$45/百万Token大模型深度推理。顶级层$150/百万Token超长研究任务、关键路径实时响应。去年Semi Analysis做了一次有史以来最大规模的AI推理基准测试。结果显示Grace Blackwell NVLink 72的每瓦token吞吐量比上一代Hopper H200高出50倍。而黄仁勋自己说说的35倍。对此Semi Analysis创始人公开表示“黄仁勋在sand bagging故意保留余地”。老黄说没错我就说故意的实际是50倍每瓦性能决定了一切。因为每座数据中心的功率都是物理约束一座1GW的AI工厂永远不会变成2GW。在固定功率下谁的每瓦token产出更高谁的token成本就更低。这就是Vera Rubin存在的理由作为下一代计算平台再次将每瓦token吞吐量提高2-10倍。Vera Rubin十年千万倍加速Hopper时代老黄还会举起一块芯片秀给观众看但那个时代已经结束了。去年我说Hopper的时候会举起一块芯片那很可爱。但这是Vera Rubin当人们想到Vera Rubin人们想到的是整个系统。Vera Rubin是英伟达有史以来最复杂的AI计算系统。7种芯片5种机架垂直集成、端到端优化成一台巨型计算机Rubin GPU全新架构支持NVLink 72全互联3.6 exaflops算力260TB/s全对全带宽。Vera CPU全新数据中心CPU全球唯一采用LPDDR5的服务器处理器单线程性能和能效比出色。老黄原本没打算单独卖CPU但Vera卖得太好这已经确定是一个数十亿美元的业务了。Groq LP30世界上从未见过的第三代芯片500MB片上SRAM确定性数据流处理器静态编译、软件调度专为推理而生。BlueField 4 DPU CX9网卡全新存储平台共同构成了面向AI原生的全新存储基础设施。NVLink Switch第六代NVLink交换芯片提供大规模MoE模型所需的快速、无缝的GPU到GPU通信Spectrum X CPO交换机全球首款量产的共封装光学Co-Packaged Optics交换机电子直接转光子。在同一座1GW数据中心里从Grace Blackwell到Vera Rubin Groqtoken生成速率从200万跳到7亿。‘两年时间350倍。摩尔定律在同样的时间里能给多少大约1.5倍。350倍不是靠芯片上多塞几个晶体管实现的。当算力密度卷到这个程度瓶颈早就转移到了芯片之外散热和互联。Vera Rubin的答案是两大变化一个关于水一个关于光。关于水Vera Rubin采用100%液冷方案连NVLink交换机都泡在液冷系统里。互联不再靠外部线缆而是在液冷模块内部做板级/背板式集成互联。线缆全部消失了过去安装一个机架要两天现在两小时。关于光黄仁勋举起了世界首款量产的CPO共封装光学交换机。传统交换机里电信号从芯片出来经过PCB走线到达光模块在光模块里完成电-光转换再通过光纤传出去。每一次转换都有延迟每一段铜线都有损耗。CPO把这条链路压缩到极致光学器件直接封装到芯片上电子在硅片表面就转换成光子。 没有光模块没有铜线中转。英伟达和TSMC联合发明了一种叫CoUP的封装工艺目前全球只有英伟达在量产。要让72块GPU实现260TB/s的全对全带宽如果还用传统铜缆信号跑不了太远机架尺寸就是物理极限。CPO打破了这个限制光子跑得更远、损耗更低、能效更高。但铜缆和光学不是二选一。黄仁勋被问了太多次这个问题干脆一次说清我们都要我们需要更多的铜缆产能更多的光芯片产能更多的CPO产能。十年前的DGX-18块Pascal GPU170 TFLOPS。十年后的Vera Rubin NVLink 723.6 ExaFLOPS。十年算力增长四千万倍。高吞吐的归Rubin低延迟的归Groq但还有一个问题没解决。NVLink 72在高吞吐区间几乎无敌72块GPU全对全互联带宽拉满。可一旦要求的不是400 token/秒而是1000 token/秒的极速推理NVLink 72的带宽就不够用了。这就是Groq的故事。英伟达在2025年底收购了推理芯片公司Groq后者以“LPU”Language Processing Unit著称。Groq的架构和英伟达GPU截然相反它是一颗确定性数据流处理器静态编译、编译器调度没有动态调度片上堆了500MB的巨量SRAM只干一件事推理。此前业界一直猜测英伟达会如何整合这项资产。答案来了不是替代GPU而是与GPU协同。一颗Groq芯片4GB SRAM一颗Rubin芯片288GB HBM。前者极致快后者极致大。单独用Groq装不下万亿参数模型和海量KV cache单独用Rubin推不到极速token生成。英伟达的解法是分离式推理用Dynamo推理框架把流水线拆开。Pre-fill和attention的计算量大交给Vera Rubindecode阶段的token生成对带宽敏感、对延迟敏感卸载给Groq。两颗极端不同的处理器通过以太网紧密耦合延迟减半。结果在最高价值的推理层级上再提升35倍吞吐量。同时解锁了此前根本不存在的新推理层级千token/秒级别的极速生成。黄仁勋给出了配比建议如果你的工作负载主要是高吞吐100%上Vera Rubin就够了。如果你有大量编程、工程级token生成需求拿出25%的数据中心功率给Groq。Groq 3芯片由三星代工已经量产预计Q3出货。而Vera Rubin的首个机架已经在微软Azure云上跑起来了。OpenClawAI时代的Linux时刻发布会的最后一部分老黄画风一转开始聊人类历史上最受欢迎的开源项目OpenClaw。OpenClaw能做什么老黄举例有人帮60岁的父亲自动化了整个精酿啤酒生意蓝牙连接酿造设备自动生成销售网站顾客可以直接下单“龙虾拉格啤酒”。但老黄更在意的是它的本质。他用操作系统的语言重新定义了OpenClaw资源管理可以调用大语言模型、访问文件系统、使用工具。调度系统能做cron jobs、分步执行、生成子Agent。I/O系统多模态输入输出你可以冲它挥手它给你发邮件。OpenClaw开源了Agent计算机的操作系统。就像Windows让我们创造了个人电脑OpenClaw让我们创造了个人Agent。Windows→PC时代Linux→服务器时代HTML→互联网时代Kubernetes→云时代OpenClaw→Agent时代。每一次平台转移都催生了一批改变世界的公司。企业IT的全部逻辑即将改写。老黄直接断言每家SaaS公司都将变成Agent-as-a-Service公司。ButAgent在企业网络中能访问敏感信息、执行代码、对外通信“你把这三件事连起来大声说出来再想一想……”所以英伟达与OpenClaw合作推出了企业版NeMo Claw加上了策略引擎、网络护栏、隐私路由器。老黄给出了他对未来企业的终极想象未来每个工程师都会有一个年度Token预算。他们年薪几十万美元我会在此基础上再给他们一半的金额作为Token额度。这已经是硅谷的新招聘筹码了你的offer里带多少TokenTwo More Thing在发布会上对于外界备受关注的下一代计算架构Feynman费曼老黄也做了预告并表示计算架构每年都会有新东西。Feynman将带来全新的GPU、LPULP 40和CPU Rosa。新一代的BlueField 5将连接下一代CPU与SuperNIC CX10并配合新的Kyber技术实现铜线与光学双扩展——这意味着Feynman将首次同时支持铜线与光学封装的水平扩展。老黄强调无论是铜线、光学还是CPO未来都需要更高的容量与带宽这正是Feynman的核心突破。此外他还透露NVIDIA 正与合作伙伴联合开发英伟达Space One一台将部署在太空的数据中心计算机开启“太空算力”的新篇章。太空中没有对流没有传导只有辐射散热。我们得想办法在太空里给GPU散热。不过我们有很多优秀的工程师在搞这件事。把GPU送上近地轨道这大概是“AI无处不在”最字面意义上的诠释了。直播回放https://www.youtube.com/watch?vjw_o0xr8MWU一键三连「点赞」「转发」「小心心」欢迎在评论区留下你的想法—完—今天你养虾了吗欢迎加入【龙虾养成讨论组】一起交流养虾经验扫码添加小助手加入社群记得备注【OPENCLAW】哦一键关注 点亮星标科技前沿进展每日见

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2426525.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…