谷歌发布Gemma 4模型，为低功耗设备带来复杂推理能力

news2026/4/3 23:06:43

谷歌发布了其最先进的开放权重人工智能模型家族Gemma 4这标志着开放权重AI模型领域的重大进步。技术架构与性能突破Gemma 4基于与Gemini 3相同的架构基础构建专门设计用于处理复杂推理任务并支持在工作站和智能手机等低功耗设备上本地运行的自主AI智能体。谷歌DeepMind研究人员Clement Farabet和Olivier Lacombe表示他们成功实现了更高的每参数智能度使模型能够发挥远超其规模的性能。例如31B Dense变体目前在行业标准Arena AI Text排行榜的开放模型中排名第三。四种模型变体满足不同需求Gemma 4提供四种不同版本Effective 2B、Effective 4B、26B专家混合模型和31B Dense模型。较小的Effective模型专为Android智能手机或树莓派计算机等轻量级硬件的边缘使用场景而设计。26B MoE模型采用了巧妙的设计在推理任务中仅激活38亿个参数既能保持高速运行又不会牺牲大型模型的深度知识库优势。智能体支持与多模态能力与早期的Gemma版本不同Gemma 4模型原生支持函数调用和结构化JSON输出开发者无需调整设计即可让模型与其他软件工具交互。这使得开发者能够利用这些模型构建能够与第三方工具交互并执行多步骤计划的自主智能体。所有四个模型都具备处理图像和视频的能力较小的E2B和E4B变体还进一步支持原生音频输入能够直接在设备上实现实时语音理解。谷歌还增加了模型的上下文窗口最小模型可达128K较大的两个模型可达256K。这意味着开发者能够通过单个提示上传整个代码库或大量文档集合。开放许可与部署方式每个模型都采用宽松的Apache 2.0许可证发布消除了其他AI模型的许多商业限制使其成为构建企业应用程序开发者的绝佳选择。这些模型可以通过Google Cloud直接访问也可以在Hugging Face、Kaggle和Ollama上获取开放权重版本。市场影响与前景展望这次发布凸显了谷歌主导本地AI行业的雄心。Constellation Research分析师Holger Mueller表示由于即使是较大的Gemma 4模型也足够小可以在单个图形处理单元上运行这使得它们适用于对低延迟和数字主权要求较高的边缘使用场景和应用。Mueller评论道谷歌不仅通过推进Gemini还通过Gemma 4系列的开放模型来构建其在AI领域的领先地位。这些模型对于构建AI开发者生态系统非常重要将帮助公司在不同设备形态上挖掘功能性和垂直使用场景。谷歌此前的Gemma 3发布已经设定了很高的标准因此人们对这次发布寄予厚望。QAQ1Gemma 4模型有什么特殊之处AGemma 4是谷歌最先进的开放权重AI模型家族基于与Gemini 3相同的架构专门设计用于处理复杂推理任务。它能够在工作站和智能手机等低功耗设备上本地运行自主AI智能体实现了更高的每参数智能度性能远超其模型规模。Q2Gemma 4有哪些不同版本可以选择AGemma 4提供四种版本Effective 2B和Effective 4B专为智能手机、树莓派等轻量级硬件设计26B专家混合模型在推理时仅激活38亿参数兼顾速度和性能31B Dense模型在开放模型排行榜中排名第三性能强劲。Q3Gemma 4在商业应用方面有什么优势AGemma 4采用宽松的Apache 2.0许可证消除了许多商业限制特别适合企业应用开发。模型原生支持函数调用和JSON输出可直接构建自主智能体。同时支持图像、视频和音频处理上下文窗口最大可达256K能处理大型文档和代码库。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2480293.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！