DeepSeek悄悄干了一件大事，但所有人的目光都在OpenAI身上

news2026/4/27 17:58:52

DeepSeek悄悄干了一件大事但所有人的目光都在OpenAI身上AI观察社 · 2026年4月24日今天的AI圈所有人都在讨论GPT-5.5。我也是。早上起来刷了一圈推特满屏都是GPT-5.5来了最强模型Agent时代正式开启。热热闹闹的像过年。然后我看到一条推送DeepSeek的官方公众号。点进去一看——V4来了。不是小更新。是全新的架构直接把上下文干到了百万级别Agent能力据说已经超过Sonnet 4.5。我愣了一下。然后想这消息放今天怎么看都有点大雾天放烟花的意思。────────────────先说V4-Pro到底强在哪1.6万亿参数。MoE架构384个专家每次只激活6个。听着很大但DeepSeek一贯如此大但不笨。关键是Agent能力。DeepSeek自己内部已经把V4当主力编码模型在用了据反馈体验优于Sonnet 4.5交付质量接近Opus 4.6的非思考模式。说人话就是让它帮你写代码、改bug、做项目它干得比Claude还好使。世界知识仅逊Gemini-Pro-3.1数学、STEM、竞赛型代码超过所有已公开的开源模型。换句话说在开源圈子里它没有对手。另外还有个V4-Flash。参数更小推理能力接近Pro简单任务旗鼓相当。但便宜很多适合对成本敏感的场景。────────────────百万上下文成标配了这个我觉得才是最值得说的。以前上下文128K就算大了现在DeepSeek直接把100万token做成所有服务的标配。不是Pro独享Flash也有。怎么做到的他们搞了一种新的注意力机制在token维度做压缩再结合自研的DSA2稀疏注意力。效果是计算量和显存需求大幅降低。100万token是什么概念大概相当于一次性塞进去一本500页的技术手册外加几万行代码外加你的整个项目历史。然后让AI从头到尾读一遍还能记住。以前只能翻到哪页记到哪现在能整本书背下来再跟你聊。────────────────还有个大新闻融资DeepSeek一直有个态度——不拿外部钱。梁文锋DeepSeek创始人以前说过好几次不引入外部资金自己能扛得住。但这次改主意了。腾讯和阿里争着投。估值从100亿美元一路涨到超过200亿美元折合人民币大概1365亿。我个人的判断V4的技术水平已经到了不拿钱反而不正常的阶段。训练成本摆在那再扛一轮可能就扛不住了。────────────────几个需要注意的事第一API名字变了。新模型叫deepseek-v4-pro和deepseek-v4-flash。旧名字deepseek-chat和deepseek-reasoner三个月后停用2026年7月24日。用DeepSeek API的注意改接口。别到时候突然挂了才想起来。第二开源了。权重已经上了HuggingFace和ModelScope技术报告也发了。想本地部署的可以直接下。第三适配国产芯片。他们专门针对寒武纪做了优化。这点我觉得挺重要的——不是嘴上说支持国产是真的做了底层适配。1.2元 / 百万tokensAPI最低输入价格────────────────我怎么看说实话今天GPT-5.5确实抢了风头。OpenAI凌晨发布全网刷屏这是人家的主场优势。但DeepSeek V4有几个点让我觉得更值得关注一是百万上下文标配这意味着以后所有用DeepSeek的应用都能处理超长文档了不是旗舰版特权。二是开源。GPT-5.5再强你不花钱就摸不到。V4-Pro的权重在HuggingFace上躺着谁都能下。三是国产芯片适配。在这个节骨眼上这比任何benchmark都重要。我不知道V4能不能打过GPT-5.5。但我觉得DeepSeek正在走一条不一样的路——不是比谁贵是比谁能用得起。今天是GPT-5.5的场子。但DeepSeek V4告诉我一件事最好的模型不一定是最贵的那个。关注AI观察社带你看清技术趋势

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2560233.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！