英伟达首台DGX GB300,老黄亲自登门送给他

news2026/3/20 17:09:45
一水 发自 凹非寺量子位 | 公众号 QbitAI老黄又又又亲自上门送“显卡”了首台DGX StationGB300送给了卡帕西——这位AI时代的个人开发者代表。△图源英伟达官方博客注意到没就在这台“大玩具”上老黄还附赠了一篇洋洋洒洒的“小作文”致Andrej——第一台DGX Station的拥有者AI智能体时代已经到来这是一个令人难以置信的里程碑时刻也让人想起我们一起走过的GTC早期岁月。一路走来你始终与我并肩同行。而另一边卡帕西也在上对老黄隔空发射爱心并且透露自己准备用它搭一套个人AI集群专门拿来折腾各种有意思的实验。对了针对老黄提到的“GTC早期岁月”卡帕西还顺带解惑了一波后来的事情大家也都知道了深度学习革命让英伟达这个“卖铲人”赚得盆满钵满。所以老黄这次上门送温暖原来是来“报恩”的(doge当然调侃归调侃只需看一眼老黄曾经的上门服务案例你就知道这背后实则大有文章了。大约10年前天哪都10年了老黄把首台DGX-1送给了彼时还很年轻的OpenAI。而从那时起深度学习开始真正走向工程化AI进入“大模型前夜”。再到近两年他又分别给奥特曼和马斯克送上首台DGX H200、DGX Spark迷你超级计算机。这里头除了两人“闹掰”得分开送的原因外背后的信号也很直接——大模型竞赛进入“深水区”算力正在成为最终胜负手。然后就是现在卡帕西这位超级开发者成为老黄新的“座上宾”这也意味着——进入智能体时代个人开发者正在登上舞台中央。尤其在“龙虾”如此火爆的情况下这股风潮无疑将更甚。这次送给了个人开发者卡帕西书归此次“老黄上门送温暖”事件。之所以说这更多代表着个人开发者的胜利主要还是因为卡帕西这个受赠对象身上的标签实在过于鲜明了。虽然这是位老朋友了但咱还是简单回顾下他的履历。卡帕西英文名Andrej Karpathy早年在斯坦福做深度学习研究后来加入OpenAI成为创始成员之一。在OpenAI待了一年半左右被“负气出走”的马斯克挖到特斯拉负责领导特斯拉自动驾驶系统的计算机视觉团队。不过在特斯拉干了5年多之后他又回归OpenAI了。But这次回去也没待多久然后就选择出来单干了……这中间的弯弯绕绕我们不再赘述只说他最近在干啥、以及留给人的最深印象。总结起来就是他正在把AI从“论文”和“大公司”变成“一个人就能跑起来的系统”。关注卡帕西个人账号的朋友都知道这位AI大神近一两年几乎是在反复做三件事把最新论文快速复现成可运行Demo手搓小而精的模型和工具链搭建能长期运行的Agent系统也就是大家口中的“龙虾”这些事情也让他逐渐成为众人眼中的个人开发者代表——一个人就能完成从想法到产品的完整闭环。而这恰恰就是当下智能体时代最稀缺、也最具代表性的能力。再加上他和老黄之前的“私交”比如前面提到的GTC此时此刻卡帕西就成了那个被老黄选中的人。而要问选中之后干啥老黄的用意当然是“带货”啊提前滑跪了。由于搭载GB300的DGX Station亮相不多所以咱也捎带手介绍下。概括而言这台机器毫无疑问就是为“龙虾”这样的智能体量身定制的。别看这台机器长得像个“桌面工作站”本质上其实是把一整套数据中心级AI算力压缩进了个人开发者的桌面上。简单说DGX Station GB300干的事就一件——把原本属于机房的能力搬到你手边。它用的是和数据中心同源的GB300架构相当于你在本地写代码、跑模型其实就是在“迷你版数据中心”里干活。748GB统一内存20 PFLOPS算力意味着不只是能跑模型而是可以直接上手折腾千亿甚至万亿参数级别的系统。更关键的一点是这套环境不是“孤岛”——你在本地跑通的东西可以无缝迁移到云端或更大规模的集群里不需要推倒重来。所以你会发现它解决的不是“能不能跑AI”的问题而是另一个更实际的需求能不能让AI一直跑下去。话说到这里相信最近已经被“龙虾”360°环绕的大家已经明白这台设备的定位和作用了。而当我们把视线再拉远你就发现老黄在这股“龙虾热”里还有后手。除了找“代言人”英伟达还正在奋力补齐整套Agent基础设施——从硬件到软件一个都没落下。英伟达博客里提到为了配合硬件指这次亮相的DGX Station GB300他们还向OpenClaw项目贡献了一个开源堆栈——NVIDIA NemoClaw。NemoClaw能让开发者用一条命令就把一个“随时在线”的AI助手安全部署起来。它内置了一套面向AI智能体的运行时环境——NVIDIA OpenShell既负责调度模型与工具调用也通过沙箱机制保证整个执行过程安全可控。如此一来从算力到安装部署老黄就又把这门“龙虾生意”做成了产业链。老黄亲自上门送显卡已成风向标实际上细数老黄为数不多的“上门服务”你就知道这位算力掌门人的眼光有多毒辣了。几乎每一次上门背后都对应着一个清晰的时代信号。比较早期、也是比较著名的一次就是10年前送给OpenAI的首台DGX-1当时马斯克还是OpenAI联合创始人。当时OpenAI刚成立不久办公室里除了挤满一群理想主义者几乎啥也没有更别说服务器了。而另一边深度学习革命的暗流已经涌动——只差一股算力把它推到台前。于是老黄亲自带着首台DGX-1直接上门了而且还写下一句话为了计算和人类的未来我送上世界上第一台DGX-1。虽然这话如今听起来有点“豪赌”的意味但事实证明老黄赢了。尽管很难说清这台DGX-1在OpenAI的发展历程中起了多大作用但也正是这一滴一毫最后浇灌出了ChatGPT这颗参天大树。更何况DGX-1在当时本身就是一款比较领先的产品——它第一次把硬件、互联、软件栈全部打包成一个“开箱即用”的深度学习系统对提升训练效率至关重要。所以回过头看老黄这哪是送机器分明是在押注一个时代——一个属于深度革命的时代一个将深度革命从实验室推向公司工程化的时代。也难怪后来很多人说AI大模型前夜就是从这张照片开始的。再到2024年还是在这家公司老黄二次登门给奥特曼送去了世界首台DGX H200。这件事发生的背景是——ChatGPT带来的大模型风暴已经席卷全世界Saling Law定律正当红所有人都在卷参数、卷规模。当然所有人也缺算力。而就在这样的时刻老黄把DGX H200这款当时最新、最强的AI芯片送给了彼时已经被全球公认为最顶尖的AI初创公司OpenAI。并且这一次他写下的话是旨在推进人工智能、计算技术与人类的发展。就怎么说呢表面上看老黄是“初心不改”但背后释放的信号却很明确在大模型已经进入算力竞赛的时刻英伟达正在成为底层供给者——强如OpenAI也得靠老黄送补给。至于2025年他给马斯克送去的DGX Spark迷你超级计算机这一步其实更有意思。如果说DGX H200代表的是“把算力推到极致”那么DGX Spark做的则是另一件事——把顶级算力压缩进更小、更灵活的形态。老黄上门时就调侃了“想象一下把最小的超级计算机放到最大的火箭旁会是什么情景”。实际上这句看似玩笑的话已经暴露了老黄的“野心”——算力不只是用来训练模型还要支撑持续运行的AI系统。而马斯克的火箭其实就是这一设想背后最极端的场景。只要这个都能搞定其他自动驾驶、机器人、工业系统这些自然更不在话下。此时算力的形态已经开始发生改变最终的目标就是走进无数个微小的应用场景。而这一计划放在今天就是无数个个人开发者的“桌面”这里可以包含虚实两层含义。所以我们终于明白为什么老黄这次会选中卡帕西了为什么他会把首台DGX StationGB300送到一个“个人开发者”手中。因为当算力开始走向分布式、走向本地、走向每一个具体场景时——最先承接这一变化的不再是庞大的组织而恰恰是这些能独立完成闭环的个体。而说到这里OpenAI研究科学家Noam Brown发起的讨论也似乎有了初步答案。他曾发帖提问为什么在人类历史上——至少自工业革命以来最关键的时期他卡帕西没有出现在一个前沿的人工智能实验室答案不言自明——因为是卡帕西也因为他是这个时代的“个人开发者”代表。而且据英伟达透露除了卡帕西首批DGX StationGB300还即将交付给Matt Berman。划重点此人既是一位拥有近60万粉的油管博主也是一位喜欢自己搞开发的“个体户”。不过和卡帕西这种有知名代表作的开发者不同Matt Berman能被“选中”或许主要还是因为他的传播讲解能力。其真正有影响力的是一整套教“普通人如何搭AI Agent系统”的方法论。包括演示如何玩“龙虾”而在这个意义上他更是承担着“个体开发”放大者的角色。参考链接[1]https://x.com/karpathy/status/2034321875506196585?s20[2]https://blogs.nvidia.com/blog/gtc-2026-news/#dgx-station[3]https://x.com/polynoamial/status/2032140505124127192—欢迎AI产品从业者共建—「AI产品知识库」是量子位智库基于长期产品库追踪和用户行为数据推出的飞书知识库旨在成为AI行业从业者、投资者、研究者的核心信息枢纽与决策支持平台。一键关注 点亮星标

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2430565.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…