AI日报 · 2025年5月15日|GPT-4.1 登陆 ChatGPT

news2025/5/19 15:29:59

AI日报 · 2025年5月15日|GPT-4.1 登陆 ChatGPT在这里插入图片描述

1、OpenAI 在 ChatGPT 全面开放 GPT-4.1 与 GPT-4.1 mini

北京时间 5 月 14 日晚,OpenAI 在官方 Release Notes 中宣布:专为复杂代码与精细指令场景打造的 GPT-4.1 正式加入 ChatGPT,Plus/Pro/Team 付费用户即日起可在模型下拉菜单中直接调用;企业版与 Edu 版将于数周内接入。更新同 步推出 GPT-4.1 mini——在保持推理深度的同时大幅缩短响应延迟,取代原 GPT-4o mini 成为免费层超额 fallback 模型。
在这里插入图片描述

OpenAI 同时上线「Safety Evaluations Hub」,公开 GPT-4.1 系列最新安全基准数据,以期提升外部透明度。官方强调,两款模型沿用 GPT-4o 相同速率限制,且在编码、网页开发与工具调用链路上具备更高稳健度,预计将成为开发者与高级用户日常工作的“主力编译器”。[1]

2、API 直接吃 PDF:OpenAI 推出原生文件输入能力

5 月 15 日,OpenAI 在开发者社区公告板发布 「Direct PDF file input now supported in the API」,首次开放 PDF 作为 file_id 直传格式,无需预先转为文本或多页图片。新能力意味着开发者可在一次调用中上传、解析并让模型对复杂 PDF 结构(目录、表格、批注)进行语义检索、摘要或链式推理。官方示例还展示了结合 o4-mini-high 进行长链路推理的最佳实践。此举将进一步降低文档智能化门槛,为 RAG、合同审核、科研论文导航等场景提供即插即用的后端能力。[2]

3、Google DeepMind 发布 AlphaEvolve:Gemini 驱动的算法设计代理

DeepMind 于 5 月 14 日深夜(PDT)发布博客,推出 AlphaEvolve —— 基于 Gemini 2.5 系列的跨语言多模态编码代理。
在这里插入图片描述

官方称,AlphaEvolve 通过自监督进化搜索结合强化学习,可在数小时内自动生成高质量近似最优算法,并支持 Python/C++/Rust 等语言输出;内部基准显示在图着色、约束满足与半定规划等 12 个经典难题上平均超越人类专家基线 8.3 %。团队还开源了评测框架与部分搜索日志,邀请学术界共同验证可重复性。该项目被视作 AlphaGo 系列“搜索+RL”路线在通用算法设计上的首次产品化落地。[3]

4、Hugging Face × Kaggle:模型一键直连笔记本生态

开源社区旗舰 Hugging Face 5 月 14 日宣布与 Google Kaggle 达成深度集成:即日起,Hugging Face Hub 模型页新增 “Open in Kaggle” 按钮,用户可一键生成预填代码的 Kaggle Notebook;反向地,Kaggle 模型页也同步展示 Hub 元数据与 Spaces 示例。双方还自动为 Notebook 中引用且尚未托管的模型创建 Hub Entry,打通社区示例与数据血缘。官方博客指出,该集成后续将支持离线竞赛场景与私有模型令牌透传,目标是“让任何开发者在零配置下练手最前沿开源 LLM”。[4]

5、DeepSeek-V3 硬件共设论文披露 2 048 张 H800 GPU 训练细节

DeepSeek 团队于 5 月 14 日 20:39 (北京时间)在 arXiv 发布论文《Insights into DeepSeek-V3》。
在这里插入图片描述

“硬件–模型协同”成为核心主题:团队针对 H800 GPU 显存与带宽限制提出 Multi-head Latent Attention、FP8 混精度与多平面网络拓扑,将 128 k 上下文训练成本压缩 43 %。文中还公开了 2 048 卡集群 55 天预训练总耗 $5.6 M 的资源曲线,为大规模推理模型节能给出硬件参考。论文透露 DeepSeek-V3/R1 在推理阶段已内置动态混合专家路由,指向下一代「R2 多代理协同」的实验路线。[5]

6、Qwen 3 技术报告:思考模式与非思考模式合一

阿里 Qwen 团队 5 月 14 日深夜释出 Qwen 3 Technical Report。Qwen 3 覆盖 0.6B-235B 多尺度密集与 MoE 版本,首创“Thinking Mode / Non-Thinking Mode 动态切换”与 思考预算机制:模型可根据任务复杂度自适应调用专家数与计算步长,在保持延迟可控的同时提升多步推理准确率。团队声称,旗舰 235B-A22B MoE 模型在 MATH、CoderBench 与 Agent Arena 多项基准上全面领先同尺寸闭源模型,并扩充至 119 种语言方言。全部权重 Apache 2.0 开源。[6]

7、OpenAI 上线「Safety Evaluations Hub」集中公开模型安全指标

继 GPT-4.1 入驻 ChatGPT 之际,OpenAI 同步推出 Safety Evaluations Hub。该站点汇总 GPT-4o、o-series、GPT-4.1 以及未来版本的越权输出、拒答率、隐私泄漏等多维评测数据,并将随模型迭代定期更新。官方表示此举旨在让外界更直观追踪模型风险曲线、促进社区复现与外部红队反馈,从而加速内部安全对齐流程。业内人士认为,OpenAI 此番“类 Model Card 即时化”策略,或将成为高强度监管语境下的大模型新合规范式。[7]

参考资料

[1] ChatGPT — Release Notes,更新日期:2025-05-14,OpenAI Help Center.
[2] Direct PDF file input now supported in the API,2025-05-15,OpenAI Developer Forum Announcements.
[3] AlphaEvolve: A Gemini-Powered Coding Agent for Designing Advanced Algorithms,2025-05-14,Google DeepMind Blog.
[4] Improving Hugging Face Model Access for Kaggle Users,2025-05-14,Hugging Face Blog.
[5] Zhao C. et al., “Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures”,arXiv preprint arXiv:2505.09343,2025-05-14.
[6] Qwen Team, “Qwen 3 Technical Report”,arXiv preprint arXiv:2505.09388,2025-05-14.
[7] Safety Evaluations Hub,OpenAI 官方网站,访问时间:2025-05-15.

以上为今日重点 AI 新闻,欢迎关注后续更新。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2379376.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

W5500使用ioLibrary库创建TCP客户端

1、WIZnet全硬件TCP/IP协议栈 WIZnet全硬件TCP/IP协议栈,支持TCP,UDP,IPv4,ICMP,ARP,IGMP以及PPPoE协议。 以太网:支持BSD和WIZCHIP(W5500/W5300/W5200/W5100/W5100S)的SOCKET APIs驱动程序。 互联网: DHCP客户端 DNS客户端 FTP客…

组态王|如何创建组态王工程?

哈喽,你好啊,我是雷工! 组态王是比较普及的组态软件之一,大部分工控人应该都接触过组态王软件, 最近有个用组态王软件开发上位机,对设备进行集中控制的项目,边开发,顺便记录一些使用方法。 本篇从基础的如何创建组态王工程开始记录,以下为操作笔记。 1 、首先在工程…

mysql数据库-3(备份和恢复)

1. 冷备份和还原的实现 简介:冷备份定义是 读、写操作均不可进行,数据库停止服务 (超级简单) 冷备份 需求 对 10.0.0.13 主机实现冷备操作 关闭 10.0.0.13 主机的服务(ubuntu系统为例) 10.0.0.12为远程主机 systemctl stop mysql.service 备份数据 mkdir /data/…

估分啦~全国青少年信息素养大赛部分赛项已考完~图形化/算法创意实践

2025年全国青少年信息素养大赛-图形化编程挑战赛-小低组真题试卷 全国青少年信息素养大赛,图形化编程和算法创意实践挑战赛已考完,各位可以去题库重新做做下,复盘下,为更好的自己努力~ 配有答案和解析哦~ 2025年全国青少年信息素…

【Linux服务器】-虚拟机安装(CentOS7.9)

【Linux服务器】-虚拟机安装(CentOS7.9) 需提前准备好环境安装1. 创建新的虚拟机2. 选择默认配置,下一步3. 选择稍后指定操作系统,下一步4. 选择linux操作系统,并选择CentOS 7 64位 ,下一步5. 分配磁盘空间…

2025年渗透测试面试题总结-百度面经(题目+回答)

网络安全领域各种资源,学习文档,以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具,欢迎关注。 目录 百度面经 百度安全工程师面试深度复盘与优化指南 一、项目经验反思与优化策略 二、技术问题深度解析 …

分别用 语言模型雏形N-Gram 和 文本表示BoW词袋 来实现文本情绪分类

语言模型的雏形 N-Gram 和简单文本表示 Bag-of-Words 语言表示模型简介 (1) Bag-of-Words (BoW) 是什么? *定义:将文本表示为词频向量,忽略词序和语法,仅记录每个词的出现次数。 **示例: 句子1:I love …

C#.NET 或 VB.NET Windows 窗体中的 DataGridView – 技巧、窍门和常见问题

DataGridView 控件是一个 Windows 窗体控件,它允许您自定义和编辑表格数据。它提供了许多属性、方法和事件来自定义其外观和行为。在本文中,我们将讨论一些常见问题及其解决方案。这些问题来自各种来源,包括一些新闻组、MSDN 网站以及一些由我…

PyTorch音频处理技术及应用研究:从特征提取到相似度分析

文章目录 音频处理技术及应用音频处理技术音视频摘要技术音频识别及应用 梅尔频率倒谱系数音频特征尔频率倒谱系数简介及参数提取过程音频处理快速傅里叶变换(FFT)能量谱处理离散余弦转换 练习案例:音频建模加载音频数据源波形变换的类型绘制波形频谱图波形Mu-Law 编…

VSTO(C#)Excel开发进阶2:操作图片 改变大小 滚动到可视区

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github:codetoys,所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C++的,可以在任何平台上使用。 源码指引:github源码指引_初级代码游戏的博客-CSDN博客 入…

多用途商务,电子产品发布,科技架构,智能手表交互等发布PPT模版20套一组分享

产品发布类PPT模版20套一组:产品发布PPT模版https://pan.quark.cn/s/25c8517b0be3 第一套PPT模版是一个总结用的PPT封面,背景浅灰色,有绿色叶片和花朵装饰,深绿色标题,多个适用场景和占位符。突出其清新自然的设计和商…

WindowsPE文件格式入门11.资源表

https://www.bpsend.net/thread-411-1-1.html 资源表 资源的管理方式采用windows资源管理器目录的管理方式,一般有三层目录。根目录 结构体IMAGE_RESOURCE_DIRECTORY:描述名称资源和ID资源各自的数量,不描述文件。资源本质都是二进制数据&…

C语言标准I/O与Linux系统调用的文件操作

01. 标准库函数与系统调用对比 系统调用标准I/O库open/read/write/closefopen/fread/fwrite/fclose文件描述符(fd)文件指针(FILE*)无缓冲&#xff0c;直接系统调用自动缓冲管理每次操作触发系统调用减少系统调用次数<fcntl.h> <unistd.h><stdio.h> 系统调用…

【MYSQL】笔记

&#x1f4da; 博主的专栏 &#x1f427; Linux | &#x1f5a5;️ C | &#x1f4ca; 数据结构 | &#x1f4a1;C 算法 | &#x1f152; C 语言 | &#x1f310; 计算机网络 在ubuntu中&#xff0c;改配置文件&#xff1a; sudo nano /etc/mysql/mysql.conf.d/mysq…

线程池核心线程永续机制:从源码到实战的深度解析

简介 源管理的基石,其核心线程为何不会超时销毁一直是开发者关注的焦点。核心线程的永续机制不仅确保了系统的稳定响应,还避免了频繁创建和销毁线程带来的性能损耗。本文将从源码层面深入剖析线程池核心线程的存活原理,同时结合企业级实战案例,展示如何正确配置和管理线程…

DS新论文解读(2)

上一章忘了说论文名字了&#xff0c;是上图这个名字 我们继续&#xff0c;上一章阅读地址&#xff1a; dsv3新论文解读&#xff08;1&#xff09; 这论文剩下部分值得说的我觉得主要就是他们Infra通信的设计 先看一个图 这个是一个标准的h800 8卡with 8cx7 nic的图&#xf…

html文件cdn一键下载并替换

业务场景&#xff1a; AI生成的html文件&#xff0c;通常会使用多个cdn资源、手动替换or下载太过麻烦、如下py程序为此而生&#xff0c;指定html目录自动下载并替换~ import os import requests from bs4 import BeautifulSoup from urllib.parse import urlparse import has…

【ROS2】 核心概念6——通信接口语法(Interfaces)

古月21讲/2.6_通信接口 官方文档&#xff1a;Interfaces — ROS 2 Documentation: Humble documentation 官方接口代码实战&#xff1a;https://docs.ros.org/en/humble/Tutorials/Beginner-Client-Libraries/Single-Package-Define-And-Use-Interface.html ROS 2使用简化的描…

matlab官方免费下载安装超详细教程2025最新matlab安装教程(MATLAB R2024b)

文章目录 准备工作MATLAB R2024b 安装包获取详细安装步骤1. 文件准备2. 启动安装程序3. 配置安装选项4. 选择许可证文件5. 设置安装位置6. 选择组件7. 开始安装8. 完成辅助设置 常见问题解决启动失败问题 结语 准备工作 本教程将帮助你快速掌握MATLAB R2024b的安装技巧&#x…

【运营商查询】批量手机号码归属地和手机运营商高速查询分类,按省份城市,按运营商移动联通电信快速分类导出Excel表格,基于WPF的实现方案

WPF手机号码归属地批量查询与分类导出方案 应用场景 ​​市场营销​​&#xff1a;企业根据手机号码归属地进行精准营销&#xff0c;按城市或省份分类制定针对性推广策略​​客户管理​​&#xff1a;快速对客户手机号码进行归属地分类&#xff0c;便于后续客户关系管理​​数…