AI日报 · 2025年5月07日|谷歌发布 Gemini 2.5 Pro 预览版 (I/O 版本),大幅提升编码与视频理解能力

news2025/5/10 1:32:22

在这里插入图片描述

1、谷歌发布 Gemini 2.5 Pro 预览版 (I/O 版本),大幅提升编码与视频理解能力

谷歌于5月6日提前发布 Gemini 2.5 Pro 预览版 (I/O 版本),为开发者带来更强编码能力,尤其优化了前端与UI开发、代码转换及智能体工作流构建,并在WebDev Arena编码能力排行榜登顶 。其视频理解能力亦达业界领先(VideoMME得分84.8%),催生了“视频转学习应用”等创新流程 。
在这里插入图片描述

此次更新还针对开发者反馈改进了函数调用错误和触发率,旧版用户将自动升级且价格不变,确保在Google I/O前提供体验 。

2、OpenAI 斥资 30 亿美元收购 AI 编程工具 Windsurf,强化代码生成生态

据报道,OpenAI于5月6日确认以约30亿美元完成对其迄今最大的一笔收购,将AI辅助编程工具Windsurf(前身为Codeium)纳入麾下 。
在这里插入图片描述

此举旨在显著增强ChatGPT的编码功能,并使OpenAI在日益激烈的AI编程助手市场中(竞争者包括微软GitHub Copilot、Anthropic等)占据更有利位置 。此次收购标志着AI巨头正从单纯的模型能力竞争,转向构建和控制关键应用生态系统,特别是在高价值的AI编程领域 。

3、Perplexity AI 计划推出 AI 驱动的 Comet 浏览器,提供“智能体搜索”体验

Perplexity AI 计划于2025年5月推出名为Comet的AI驱动网络浏览器,旨在提供“智能体搜索”体验,挑战现有市场格局 。用户现可通过官网perplexity.ai/comet加入等候名单获取早期访问权限 。在这里插入图片描述

Comet浏览器据称将具备基于自然语言的标签页管理、上下文感知响应、原生广告拦截及可选数据共享退出等功能 。然而,其计划通过追踪用户活动提供个性化广告的模式,已引发业界对用户数据隐私的广泛讨论与审视 。

4、谷歌 Gemini 应用更新:单次提示可上传文件增至 10 个

谷歌于5月6日宣布其Gemini AI聊天机器人应用迎来重要用户体验升级:单次提示现可支持同时上传多达10个文件(如图片、文档)。此项被团队称为“痛点修复”的更新已在安卓、iOS及网页版全面铺开,并兼容Gemini 2.0 Flash至2.5 Pro等所有当前模型,显著提升了处理涉及多个来源信息查询时的便捷性与效率 。此前,Gemini每次提示仅允许上传单个文件。

5、Meta AI 独立应用详情披露:基于 Llama 4,主打个性化与社交整合

据5月6日报道,Meta近期推出的独立Meta AI应用基于其Llama 4模型,核心特性在于深度个性化与社交功能整合 。该应用支持文本与语音交互,提供图像生成编辑、网络搜索等服务,并引入“发现”信息流,鼓励用户分享和借鉴AI使用提示,增强社交互动性 。通过关联用户Facebook及Instagram账户数据,Meta AI能学习用户偏好以提供更精准的上下文响应,并将整合Ray-Ban智能眼镜功能,推进扎克伯格构想的互动式社交媒体未来 。

6、谷歌 NotebookLM 新增“音频概览”功能,将书面材料转化为 AI 对话摘要

谷歌为其AI研究和笔记工具NotebookLM于5月6日左右新增“音频概览”(Audio Overview)实验性功能 。用户可一键将上传的文档、幻灯片、图表等多种书面材料,转化为由两位AI虚拟主持人进行的“深度探讨”式音频对话 。
在这里插入图片描述

AI主持人将负责总结材料、建立主题联系并展开讨论。生成的音频内容支持下载,方便用户随时随地通过听觉方式理解和记忆复杂信息,特别适合偏好听觉学习的用户。目前该功能仍有局限,如仅支持英语 。

7、谷歌搜索结果中 AI概览占比升至13.14%,信息类查询为主但商业查询渐增

据Semrush与Datos于5月6日发布的研究报告,截至今年3月,谷歌AI概览(AI Overviews)在美国桌面搜索结果中的出现比例已攀升至13.14%,相较1月份的6.49%实现了102%的显著增长 。AI概览目前主要针对信息类查询(占88.1%),但其在商业查询(8.69%)和导航查询(1.43%)中的占比亦有所提升,尤其在科学、健康等行业增长迅速 。值得注意的是,研究初步显示AI概览的引入并未必然导致零点击搜索行为增加 。

8、OpenAI 确认保持非营利控制,营利部门转型为公益公司 (PBC)

OpenAI于5月6日确认,将放弃原先完全转为营利性公司的计划,其非营利性质的董事会将继续对商业子公司进行监督与控制 。其营利部门将从有利润上限的公司重组为一家公益公司(Public Benefit Corporation, PBC),这一结构类似于Anthropic及xAI,旨在平衡大规模融资需求与其“确保通用人工智能惠及全人类”的核心使命 。此决策是在与监管机构对话并面临包括埃隆·马斯克在内的多方压力后作出的 。

9、xAI 与 Palantir、TWG Global 联手,共同推动 AI 在金融服务领域的应用

埃隆·马斯克旗下的人工智能公司xAI于5月6日宣布,已与数据分析巨头Palantir Technologies及投资公司TWG Global达成战略合作伙伴关系 。三方将共同致力于满足金融服务行业对AI技术日益增长的需求,其中TWG Global将主导AI解决方案的设计与部署实施工作 。此次合作的核心在于将xAI的先进模型(包括Grok系列大语言模型和Colossus超级计算机)深度整合到金融机构的实际业务运营流程中 。

10、美国会议员提案欲加强AI芯片出口管制,要求追踪英伟达等芯片流向

据5月6日报道,为应对先进AI芯片可能通过非正规渠道流入中国的担忧,美国众议员Bill Foster已正式提出一项法案,旨在加强对英伟达等公司高端AI芯片的出口管制 。该法案的核心要求是,芯片制造商必须实施有效机制以追踪其芯片在售出后的实际地理位置,并确保未获得相应许可的芯片无法被激活使用 。此提案已获得两党议员支持,反映了对国家安全的共同关切,若通过可能对全球AI芯片供应链及相关企业合规成本产生深远影响 。

以上为今日重点 AI 新闻,欢迎关注后续更新。

参考资料

[1] Google AI Blog. “Gemini 2.5 Pro Preview: even better coding performance.” 访问时间 2025年5月7日. https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/

[2] DevOps.com. “OpenAI Acquires Windsurf for $3 Billion.” 访问时间 2025年5月7日. https://devops.com/openai-acquires-windsurf-for-3-billion/

[3] Business Standard. “Perplexity AI to rival Google Chrome with AI-powered web browser Comet.” 访问时间 2025年5月7日. https://www.business-standard.com/technology/tech-news/perplexity-ai-to-rival-google-chrome-with-ai-powered-web-browser-comet-125050600938_1.html

[4] Perplexity AI. “Comet Browser by Perplexity.” 访问时间 2025年5月7日. https://www.perplexity.ai/comet

[5] The Keyword. “Perplexity’s ‘Comet’ browser will track users’ data to sell “hyper-personalized” ads.” 访问时间 2025年5月7日. https://www.thekeyword.co/news/perplexitys-comet-browser-will-track-users-data-to-sell-hyper-personalized-ads

[6] LiveMint. “Google Gemini now supports uploading up to 10 files at once: Here’s how users benefit.” 访问时间 2025年5月7日. https://www.livemint.com/technology/tech-news/google-gemini-now-supports-uploading-up-to-10-files-at-once-what-it-means-for-users-11746526219597.html

[7] Indian Express. “Meta AI app: What does it mean for social media future?” 访问时间 2025年5月7日. https://indianexpress.com/article/technology/artificial-intelligence/meta-ai-app-what-does-it-mean-for-social-media-future-9985572/

[8] Google Blog. “NotebookLM now lets you listen to a conversation about your sources.” 访问时间 2025年5月7日. https://blog.google/technology/ai/notebooklm-audio-overviews/

[9] Search Engine Land. “Google AI Overviews now show on 13% of searches: Study.” 访问时间 2025年5月7日. https://searchengineland.com/google-ai-overviews-13-searches-455057

[10] Nieman Lab (citing The Verge). “OpenAI has abandoned its plan to become a for-profit company.” 访问时间 2025年5月7日. https://www.niemanlab.org/reading/openai-has-abandoned-its-plan-to-become-a-for-profit-company/

[11] WHTC (citing Reuters). “Musk’s xAI joins TWG Global, Palantir for AI push in financial sector.” 访问时间 2025年5月7日. https://whtc.com/2025/05/06/musks-xai-joins-twg-global-palantir-for-ai-push-in-financial-sector/

[12] Tribune.com.pk (citing Reuters). “US lawmaker introduces bill to curb Nvidia AI chip smuggling into China: Reuter.” 访问时间 2025年5月7日. https://tribune.com.pk/story/2544249/us-lawmaker-introduces-bill-to-curb-nvidia-ai-chip-smuggling-into-china-reuter

[13] Business Standard. “Google Gemini increases attachment limit in one prompt: Here’s the new cap.” 访问时间 2025年5月7日. https://www.business-standard.com/technology/tech-news/google-gemini-increases-attachment-limit-in-one-prompt-here-s-the-new-cap-125050600739_1.html

[14] OpenTools.ai. “OpenAI keeps mission at heart, avoids for-profit overhaul.” 访问时间 2025年5月7日. https://opentools.ai/news/openai-keeps-mission-at-heart-avoids-for-profit-overhaul

[15] Silicon.co.uk. “Elon Musk To Continue OpenAI Lawsuit – Lawyer.” 访问时间 2025年5月7日. https://www.silicon.co.uk/e-regulation/legal/elon-musk-to-continue-openai-lawsuit-lawyer-612351

[16] The Economic Times. “Is Elon Musk eyeing number one status in AI race? Check Tesla boss’ latest big artificial intelligence move.” 访问时间 2025年5月7日. https://m.economictimes.com/news/international/us/is-elon-musk-eyeing-number-one-status-in-ai-race-check-tesla-boss-latest-big-artificial-intelligence-move/articleshow/120937357.cms

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2371936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

指定Docker镜像源,使用阿里云加速异常解决

yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo异常贴图 yum-config-manager:找不到命令 因为系统默认没有安装这个命令,这个命令在yum-utils 包里,可以通过命令yum -y install yum-util…

VITA STANDARDS LIST,VITA 标准清单下载

VITA STANDARDS LIST,VITA 标准清单下载 DesignationTitleAbstractStatusVMEbus Handbook, 4th EditionA users guide to the VME, VME64 and VME64x bus specifications - features over 70 product photos and over 160 circuit diagrams, tables and graphs. The…

Python从入门到高手8.3节-元组的常用操作方法

目录 11.3.1 元组的常用操作方法 11.3.2 元组的查找 11.3.3 祈祷明天不再打雷下雨 11.3.1 元组的常用操作方法 元组类型是一种抽象数据类型,抽象数据类型定义了数据类型的操作方法,在本节的内容中,着重介绍元组类型的操作方法。 ​ 元组是…

Linux系统安装PaddleDetection

一、安装cuda 1. 查看设备 先输入nvidia-smi,查看设备支持的最大cuda版本,选择官网中支持的cuda版本 https://www.paddlepaddle.org.cn/install/quick?docurl/documentation/docs/zh/install/conda/linux-conda.html 2. 下载CUDA并安装 使用快捷键…

【漫话机器学习系列】239.训练错误率(Training Error Rate)

机器学习基础概念 | 训练错误率(Training Error Rate)详解 在机器学习模型训练过程中,评估模型性能是至关重要的一个环节。其中,训练错误率(Training Error Rate) 是最基础也最重要的性能指标之一。 本文将…

OpenCV 图形API(80)图像与通道拼接函数-----仿射变换函数warpAffine()

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 对图像应用仿射变换。 函数 warpAffine 使用指定的矩阵对源图像进行变换: dst ( x , y ) src ( M 11 x M 12 y M 13 , M 21 x M…

数据结构与算法:图论——最短路径

最短路径 先给出一些leetcode算法题,以后遇见了相关题目再往上增加 最短路径的4个常用算法是Floyd、Bellman-Ford、SPFA、Dijkstra。不同应用场景下,应有选择地使用它们: 图的规模小,用Floyd。若边的权值有负数,需要…

提示词工程:通向AGI时代的人机交互艺术

‌引言:从基础到精通的提示词学习之旅‌ 欢迎来到 ‌"AGI时代核心技能"‌ 系列课程的第二模块——‌提示词工程‌。在这个模块中,我们将系统性地探索如何通过精心设计的提示词,释放大型语言模型的全部潜力,实现高效、精…

是更换Window资源管理器的时候了-> Files-community/Files

Files • 主页https://files.community/ 它已经做到了 云盘文件集成、标签页和多种布局、丰富的文件预览…… 您想要的一切现代文件管理器的强大功能, Files 都能做到。 概述 Files 是一个现代文件管理器,可帮助用户组织他们的文件和文件夹。Files 的…

基于windows安装MySQL8.0.40

基于windows安装MySQL8.0.40 基于windows 安装 MySQL8.0.40,解压文件到D:\mysql-8.0.40-winx64 在D:\mysql-8.0.40-winx64目录下创建my.ini文件,并更新一下内容 [client] #客户端设置,即客户端默认的连接参数 # 设置mysql客户端连接服务…

【Vue】组件自定义事件 TodoList 自定义事件数据传输

目录 一、绑定 二、解绑 组件自定义事件总结 TodoList案例对数据传输事件的修改 总结不易~ 本章节对我有很大收获, 希望对你也是!!! 本章节素材已上传Gitee:yihaohhh/我爱Vue - Gitee.com 前面我们学习的clikc、…

基于Centos7的DHCP服务器搭建

一、准备实验环境: 克隆两台虚拟机 一台作服务器:DHCP Server 一台作客户端:DHCP Clinet 二、部署服务器 在网络模式为NAT下使用yum下载DHCP 需要管理员用户权限才能下载,下载好后关闭客户端,改NAT模式为仅主机模式…

LabVIEW超声波液位计检定

在工业生产、运输和存储等环节,液位计的应用十分广泛,其中超声波液位计作为非接触式液位测量设备备受青睐。然而,传统立式水槽式液位计检定装置存在受建筑高度影响、量程范围受限、流程耗时长等问题,无法满足大量程超声波液位计的…

[STM32] 4-2 USART与串口通信(2)

文章目录 前言4-2 USART与串口通信(2)数据发送过程双缓冲与连续发送数据发送过程中的问题 数据接收过程TXE标志位(发送数据寄存器空)TC标志位(发送完成标志位)单个数据的发送数据的连续发送 接收过程中遇到的问题问题描述&#xf…

基于Python+MongoDB猫眼电影 Top100 数据爬取与存储

前言:从猫眼电影排行榜页面(TOP100榜 - 猫眼电影 - 一网打尽好电影 )爬取 Top100 电影的电影名称、图片地址、主演、上映时间和评分等关键信息,并将这些信息存储到本地 MongoDB 数据库中,🔗 相关链接Xpath&…

Ubuntu 单机多卡部署脚本: vLLM + DeepSeek 70B

# 部署脚本:Ubuntu vLLM DeepSeek 70B # 执行前请确保:1. 系统为 Ubuntu 20.04/22.04 2. 拥有NVIDIA显卡(显存≥24G) # 保存两个文件 1 init.sh 初始化 2、test.sh 测试 # init.sh #!/bin/bash # 系统更新与基础依赖sudo apt update && s…

为了摸鱼和吃瓜,我开发了一个网站

平时上班真的比较累,摸鱼和吃瓜还要跳转多个平台的话,就累上加累了。 所以做了一个聚合了全网主流平台热搜的网站。 目前市面上确实有很多这种网站了,所以目前最主要有两点和他们不同: 给热搜列表增加了配图,刷的时候…

Webug4.0靶场通关笔记11- 第15关任意文件下载与第16关MySQL配置文件下载

目录 一、文件下载 二、第15关 任意文件下载 1.打开靶场 2.源码分析 3.渗透实战 三、第16关 MySQL配置文件下载 1.打开靶场 2.源码分析 3.渗透实战 (1)Windows系统 (2)Linux系统 四、渗透防御 一、文件下载 本文通过…

k8s监控方案实践(一):部署Prometheus与Node Exporter

k8s监控方案实践(一):部署Prometheus与Node Exporter 文章目录 k8s监控方案实践(一):部署Prometheus与Node Exporter一、Prometheus简介二、PrometheusNode Exporter实战部署1. 创建Namespace(p…

具身系列——比较3种vpg算法方式玩CartPole游戏(强化学习)

文档1方式参考:https://gitee.com/chencib/ailib/blob/master/rl/vpg_baseline_cartpole.py 文档2方式参考:https://gitee.com/chencib/ailib/blob/master/rl/vpg_batchupdate_cartpole.py 文档3方式参考:https://gitee.com/chencib/ailib/bl…