【AI News | 20250609】每日AI进展

news2025/7/27 1:24:56

AI Repos

1、OpenHands-Versa
OpenHands-Versa 是一个通用型 AI 智能体,通过结合代码编辑与执行、网络搜索、多模态网络浏览和文件访问等通用工具,在软件工程、网络导航和工作流自动化等多个领域展现出卓越性能。它在 SWE-Bench Multimodal、GAIA 和 The Agent Company 等挑战性基准测试中均超越了现有专业智能体,证明了少量通用工具即可实现跨领域的高效泛化。OpenHands-Versa 的成功为开发能够解决多样化任务的通用智能体提供了强有力的基线。
在这里插入图片描述

2、GUI-Actor
GUI-Actor 提出了一种创新的、无坐标的 GUI 视觉定位方法,旨在克服传统基于坐标生成方法的局限性。该方法通过引入一个由动作头增强的 VLM,使智能体能够像人类一样直接感知并与目标元素交互,而不是计算精确的屏幕坐标。GUI-Actor 的注意力机制不仅能生成多个候选区域,还结合了一个接地验证器来选择最合理的动作区域,从而在多个 GUI 动作接地基准测试中实现了最先进的性能,特别是在 ScreenSpot-Pro 上表现出色。
在这里插入图片描述

3、MonkeyOCR
MonkeyOCR 引入了创新的结构-识别-关系(SRR)三元组范式,旨在简化多工具文档处理流程并提高效率。该方法在中文和英文文档处理上表现出色,尤其在公式和表格解析方面相比现有方法有显著提升。MonkeyOCR-3B 模型在处理多页文档时速度更快,且在英文文档上优于 Gemini 2.5 Pro 和 Qwen2.5 VL-72B 等大型模型。目前主要支持 PDF 文档,未来将扩展对拍摄文档的支持。

AI News

1、Google Veo3 FAST/TURBO模式上线,AI视频生成进入“超速”时代!
Google近日推出Veo3旗舰AI视频生成工具的全新FAST/TURBO模式,大幅提升了视频生成效率和性价比。该模式将每段视频成本降低80%,为订阅用户提供五倍的生成量,并首次支持原生音频生成,实现音画同步的沉浸式体验。FAST模式虽在细节上与QUALITY模式有所差异,但凭借其在速度和成本上的优势,非常适合短视频和快速原型创作。此举标志着AI视频生成技术正迈向更高效、普惠的新阶段。

2、文档解析新突破:3B小模型MonkeyOCR性能超越Gemini
文档解析领域迎来重大进展,轻量级模型MonkeyOCR以其仅3B的参数量,在英文文档解析任务中展现出卓越性能,超越了Gemini 2.5 Pro等大型模型。它在公式和表格解析上提升显著,平均性能提升5.1%,并且解析速度高达每秒0.84页。MonkeyOCR采用独特的“结构-识别-关系”三元组范式,提高了准确率并降低了计算资源需求,为企业部署AI文档解析方案提供了高效、经济的选择。

3、小红书开源首个大模型dots.llm1:11.2万亿非合成数据赋能中文性能
小红书近日开源了其首个大规模专家混合模型dots.llm1,该模型拥有1420亿参数,但在推理时仅激活140亿参数,大幅降低了成本。它使用了11.2万亿非合成高质量训练数据,使其在中文测试中表现卓越,平均得分高达91.3,超越了多个竞争对手。dots.llm1采用独特的MoE架构和严格的数据处理流水线,旨在提升模型效率和中文性能,并已开源中间训练检查点以促进学术研究。

4、百度发布金融行业大模型“千帆慧金”,智能体成AI竞争新焦点
在2025智能经济论坛上,百度智能云宣布推出金融行业大模型——千帆慧金,旨在为金融机构提供专业高效的AI解决方案。该模型基于海量金融数据训练,解决通用大模型在金融领域准确性不足的问题。百度执行副总裁沈抖强调,未来AI竞争将聚焦于智能体,百度智能云已推出多行业智能体解决方案,支持轻量化定制,助力企业快速实现数字化转型。

5、面壁智能发布MiniCPM 4.0端侧大模型,实现220倍速度提升
面壁智能于6月6日正式推出MiniCPM 4.0系列端侧大模型,包括8B闪电稀疏版和0.5B轻巧灵动版。该系列模型通过系统级稀疏创新和高效双频换挡技术,实现了极限220倍、常规5倍的速度提升,并大幅减少了端侧存储需求。MiniCPM 4.0在性能上以小成本超越同类竞品,并能通过自研推理框架实现模型瘦身90%及速度极致提升,目前已适配主流芯片和开源框架。

6、Dify智能体打造微信天气助手,轻松实现好友天气信息自动发送
近期,有开发者利用Dify平台结合MCP技术,成功创建了一个微信天气智能助手。该助手通过搭建MCP Server和使用wxauto库,实现了自动向微信好友发送天气信息的功能。用户只需输入地点,助手便能获取实时天气数据,并通过Dify智能体整合语音指令,将天气信息自动发送给指定好友。这一创新应用不仅简化了天气查询与分享,也展现了AI技术在提升日常便利性和降低开发成本方面的潜力。

7、智谱AI推出企业智能助手CoCo:交付导向、个性化服务,助力企业效率飙升
智谱AI近日发布全新企业级智能助手Agent CoCo,旨在显著提升企业工作效率。CoCo以交付为导向,提供全流程辅助,确保任务高质量完成。其独特的记忆机制能根据员工职能提供个性化服务和行业动态追踪。CoCo还能无缝嵌入企业现有系统,融合数据与工具,打造懂企业的智能助手。通过批量上岗Agent,CoCo将助力企业整体工作效能提升,并为员工带来更个性化、支持性的工作体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2406431.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

轻量安全的密码管理工具Vaultwarden

一、Vaultwarden概述 Vaultwarden主要作用是提供一个自托管的密码管理器服务。它是Bitwarden密码管理器的第三方轻量版,由国外开发者在Bitwarden的基础上,采用Rust语言重写而成。 (一)Vaultwarden镜像的作用及特点 轻量级与高性…

SQLSERVER-DB操作记录

在SQL Server中,将查询结果放入一张新表可以通过几种方法实现。 方法1:使用SELECT INTO语句 SELECT INTO 语句可以直接将查询结果作为一个新表创建出来。这个新表的结构(包括列名和数据类型)将与查询结果匹配。 SELECT * INTO 新…

开疆智能Ethernet/IP转Modbus网关连接鸣志步进电机驱动器配置案例

在工业自动化控制系统中,常常会遇到不同品牌和通信协议的设备需要协同工作的情况。本案例中,客户现场采用了 罗克韦尔PLC,但需要控制的变频器仅支持 ModbusRTU 协议。为了实现PLC 对变频器的有效控制与监控,引入了开疆智能Etherne…

NineData数据库DevOps功能全面支持百度智能云向量数据库 VectorDB,助力企业 AI 应用高效落地

NineData 的数据库 DevOps 解决方案已完成对百度智能云向量数据库 VectorDB 的全链路适配,成为国内首批提供 VectorDB 原生操作能力的服务商。此次合作聚焦 AI 开发核心场景,通过标准化 SQL 工作台与细粒度权限管控两大能力,助力企业安全高效…

代理服务器-LVS的3种模式与调度算法

作者介绍:简历上没有一个精通的运维工程师。请点击上方的蓝色《运维小路》关注我,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。 我们上一章介绍了Web服务器,其中以Nginx为主,本章我们来讲解几个代理软件&#xff1a…

解决MybatisPlus使用Druid1.2.11连接池查询PG数据库报Merge sql error的一种办法

目录 前言 一、问题重现 1、环境说明 2、重现步骤 3、错误信息 二、关于LATERAL 1、Lateral作用场景 2、在四至场景中使用 三、问题解决之道 1、源码追踪 2、关闭sql合并 3、改写处理SQL 四、总结 前言 在博客:【写在创作纪念日】基于SpringBoot和PostG…

使用VMware克隆功能快速搭建集群

自己搭建的虚拟机,后续不管是学习java还是大数据,都需要集群,java需要分布式的微服务,大数据Hadoop的计算集群,如果从头开始搭建虚拟机会比较费时费力,这里分享一下如何使用克隆功能快速搭建一个集群 先把…

篇章一 论坛系统——前置知识

目录 1.软件开发 1.1 软件的生命周期 1.2 面向对象 1.3 CS、BS架构 1.CS架构​编辑 2.BS架构 1.4 软件需求 1.需求分类 2.需求获取 1.5 需求分析 1. 工作内容 1.6 面向对象分析 1.OOA的任务 2.统一建模语言UML 3. 用例模型 3.1 用例图的元素 3.2 建立用例模型 …

Qt/C++学习系列之列表使用记录

Qt/C学习系列之列表使用记录 前言列表的初始化界面初始化设置名称获取简单设置 单元格存储总结 前言 列表的使用主要基于QTableWidget控件,同步使用QTableWidgetItem进行单元格的设置,最后可以使用QAxObject进行单元格的数据读出将数据进行存储。接下来…

基于django+vue的健身房管理系统-vue

开发语言:Python框架:djangoPython版本:python3.8数据库:mysql 5.7数据库工具:Navicat12开发软件:PyCharm 系统展示 会员信息管理 员工信息管理 会员卡类型管理 健身项目管理 会员卡管理 摘要 健身房管理…

Yolo11改进策略:Block改进|FCM,特征互补映射模块|AAAI 2025|即插即用

1 论文信息 FBRT-YOLO(Faster and Better for Real-Time Aerial Image Detection)是由北京理工大学团队提出的专用于航拍图像实时目标检测的创新框架,发表于AAAI 2025。论文针对航拍场景中小目标检测的核心难题展开研究,重点解决…

简单聊下阿里云DNS劫持事件

阿里云域名被DNS劫持事件 事件总结 根据ICANN规则,域名注册商(Verisign)认定aliyuncs.com域名下的部分网站被用于非法活动(如传播恶意软件);顶级域名DNS服务器将aliyuncs.com域名的DNS记录统一解析到shado…

循环语句之while

While语句包括一个循环条件和一段代码块&#xff0c;只要条件为真&#xff0c;就不断 循环执行代码块。 1 2 3 while (条件) { 语句 ; } var i 0; while (i < 100) {console.log(i 当前为&#xff1a; i); i i 1; } 下面的例子是一个无限循环&#xff0c;因…

机器学习复习3--模型评估

误差与过拟合 我们将学习器对样本的实际预测结果与样本的真实值之间的差异称为&#xff1a;误差&#xff08;error&#xff09;。 误差定义&#xff1a; ①在训练集上的误差称为训练误差&#xff08;training error&#xff09;或经验误差&#xff08;empirical error&#x…

联邦学习带宽资源分配

带宽资源分配是指在网络中如何合理分配有限的带宽资源&#xff0c;以满足各个通信任务和用户的需求&#xff0c;尤其是在多用户共享带宽的情况下&#xff0c;如何确保各个设备或用户的通信需求得到高效且公平的满足。带宽是网络中的一个重要资源&#xff0c;通常指的是单位时间…

今日行情明日机会——20250609

上证指数放量上涨&#xff0c;接近3400点&#xff0c;个股涨多跌少。 深证放量上涨&#xff0c;但有个小上影线&#xff0c;相对上证走势更弱。 2025年6月9日涨停股主要行业方向分析&#xff08;基于最新图片数据&#xff09; 1. 医药&#xff08;11家涨停&#xff09; 代表标…

GC1808:高性能音频ADC的卓越之选

在音频处理领域&#xff0c;高质量的音频模数转换器&#xff08;ADC&#xff09;是实现精准音频数字化的关键。GC1808&#xff0c;一款96kHz、24bit立体声音频ADC&#xff0c;以其卓越的性能和高性价比脱颖而出&#xff0c;成为众多音频设备制造商的理想选择。 GC1808集成了64倍…

生产管理系统开发:专业软件开发公司的实践与思考

生产管理系统开发的关键点 在当前制造业智能化升级的转型背景下&#xff0c;生产管理系统开发正逐步成为企业优化生产流程的重要技术手段。不同行业、不同规模的企业在推进生产管理数字化转型过程中&#xff0c;面临的挑战存在显著差异。本文结合具体实践案例&#xff0c;分析…

VASP软件在第一性原理计算中的应用-测试GO

VASP软件在第一性原理计算中的应用 VASP是由维也纳大学Hafner小组开发的一款功能强大的第一性原理计算软件&#xff0c;广泛应用于材料科学、凝聚态物理、化学和纳米技术等领域。 VASP的核心功能与应用 1. 电子结构计算 VASP最突出的功能是进行高精度的电子结构计算&#xff…

Centos 7 服务器部署多网站

一、准备工作 安装 Apache bash sudo yum install httpd -y sudo systemctl start httpd sudo systemctl enable httpd创建网站目录 假设部署 2 个网站&#xff0c;目录结构如下&#xff1a; bash sudo mkdir -p /var/www/site1/html sudo mkdir -p /var/www/site2/html添加测试…