清华开源新成果,国内首个L4来了!
B站啥都会一点的研究生公众号啥都会一点的研究生AI科技圈最近一周又发生了啥新鲜事Cursor 发布 Composer 2Cursor 推出其智能编程助手的全新版本 Composer 2该版本核心升级为支持跨多个文件的协同编辑与深度上下文理解能力。Composer 2 能够同时读取、分析并修改项目中的多个相关文件显著提升了处理复杂重构、功能添加及跨文件调试的效率。新功能允许用户在自然语言指令下自动识别依赖关系并同步更新多处代码减少了手动切换文件和重复操作的需求。此外Composer 2 优化了对大型代码库的上下文窗口利用能更精准地捕捉项目整体架构意图从而生成更符合项目风格的代码建议https://cursor.com/cn/blog/composer-2腾讯QClaw全面开放公测腾讯QClaw正式开启全量公测用户无需邀请码通过官网下载最新版本20秒即可完成安装。新版本持续优化微信生态体验同时打通企业微信、QQ、飞书、钉钉等多平台远控通道率先实现企业微信自动回复消息功能面向个人及10人以下团队可帮用户总结单聊与群聊消息、撰写文档、预订日程与会议、创建待办事项等。本次公测还推出「龙虾像素工作室」功能以可视化像素风格展示Agent工作状态以及全可视化操作界面的定时任务功能支持对多个周期性任务进行独立开关、修改或删除https://qclaw.qq.com阿里千问Qwen3.5-Max-Preview亮相全球大模型竞技场阿里最新一代旗舰模型预览版 Qwen3.5-Max-Preview 登陆全球大模型竞技场 LM Arena以1464分的成绩在整体性能排名中位列全球第六、国内第一。该模型在数学能力测试中取得全球第五在专家级文本能力测试中排名第十。LM Arena 由国际开源机构 LMSYS 组织采用匿名PK和开发者盲测投票机制被视为 AI 领域权威榜单之一。此外千问3.5系列已开源覆盖0.8B到397B的8款不同尺寸模型其中Qwen3.5-Plus凭借3970亿总参数和170亿激活参数性能表现优异https://mp.weixin.qq.com/s/wx2hhUdMJ4OavlM814rq_w小米发布面向 Agent 时代的旗舰基座模型 Xiaomi MiMo-V2-Pro小米正式发布专为 Agent 场景打造的旗舰基座模型 Xiaomi MiMo-V2-Pro该模型总参数量突破 1T采用创新混合注意力架构并支持 1M 超长上下文。在 Artificial Analysis 排行榜中位列全球第八、国内第二其在 Coding Agent、通用 Agent 和 Tool Use 等基准测评中表现优异实际体验已超越 Claude Sonnet 4.6 并逼近 Opus 4.6但 API 定价仅为后者的 1/5。MiMo-V2-Pro 现已开放 API 接入并联合金山办公、小米浏览器及手机端 miclaw 等多平台实现落地应用https://platform.xiaomimimo.comOpenAI发布GPT-5.4 mini与nanoOpenAI近日突然发布GPT-5.4 mini和GPT-5.4 nano两款新模型旨在以更低的成本和更快的速度处理生产环境中的任务。GPT-5.4 mini在多项关键基准测试中表现优异其在SWE-Bench Pro编码基准中得分为54.4%旗舰版GPT-5.4为57.7%在OSWorld-Verified计算机使用测试中得分为72.1%旗舰版为75.0%且运行速度较上一代GPT-5 mini提升2倍。GPT-5.4 nano则针对高频低复杂度任务优化。定价方面mini的输出价格约为旗舰版的1/3而nano的输入和输出价格分别低至0.20美元和1.25美元/百万token性价比极高。这两款模型现已在API、Codex和ChatGPT中上线支持文本图像输入、工具调用及计算机使用等功能https://openai.com/zh-Hans-CN/index/introducing-gpt-5-4-mini-and-nano/百度“龙虾”全家桶亮相百度AI开放日AI DAY现场正式发布了以OpenClaw为核心的“龙虾”全家桶产品矩阵涵盖云端虾、手机虾、桌面虾及全球首款“家用小龙虾”实现了从个人设备到家庭场景的全链路打通其中百度搜索Skill在OpenClaw官方技能商店ClawHub的下载量已突破4.5万次位居全球第一成为该平台最受欢迎的搜索引擎官方插件。活动现场还展示了涵盖搜索、伐谋、秒哒等在内的Skills全景图特别是秒哒Skill作为应用开发工具已助力轻创业者实现单月变现超5万元的商业案例为保障生态安全百度同步推出了覆盖云上与移动端的“安全虾”机制通过环境隔离与权限控制确保数据安全。百度集团执行副总裁沈抖表示搜索Skill将成为未来智能体应用的基础设施https://mp.weixin.qq.com/s/F76BPbjELnsqEhdYa4NHWA英伟达GTC 2026重磅发布杀入OpenClaw战场全新Rubin算力狂飙35倍英伟达在GTC 2026大会上正式发布新一代AI超级计算平台Vera Rubin由七颗芯片组成——包括Rubin GPU、Vera CPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换机以及首次整合的Groq 3 LPU推理性能较上一代提升35倍Kyber机架可实现15 exaFLOPS FP4推理算力和365 TB快速内存。同时英伟达推出企业级AI Agent解决方案NemoClaw通过内置安全沙箱、本地部署Nemotron模型及硬件绑定策略让企业能够安全接入Agent即服务时代。老黄现场预测2027年芯片营收将达1万亿美元并公布未来路线图Blackwell → Rubin → Rubin Ultra → Feynman每代推理提升3-5倍。此外英伟达还展示了Physical AI进展包括基于Cosmos模型的合成数据工厂、与奔驰合作的自动驾驶方案以及内置Jetson芯片的迪士尼Olaf机器人https://www.nvidia.com/gtc/keynote/全球首个自进化个人AI MuleRun发布全球首款自进化个人AI——MuleRun骡子快跑旨在解决当前AI Agent部署难、门槛高及安全隐患等痛点。该产品无需任何本地部署或代码基础用户打开网页即可通过自然语言指令驱动系统内置7×24小时独立云端虚拟机确保任务在离线状态下仍能持续运行并实现数据物理隔离有效规避本地安全风险。实测显示用户仅需几分钟即可利用该工具生成包含八大板块的实时资讯追踪网站、吉卜力风格分镜视频及流畅的在线小游戏其生成的应用在稳定性与完成度上表现优异真正实现了从“自助式配置”到“专业团队售后”的转变让不同行业的用户都能零门槛拥有全天候在线的数字员工mulerun.com/chat清华开源国内首个L4级AI课堂清华大学团队正式开源了名为OpenMAIC的国内首个L4级人工智能课堂平台旨在通过“AI无人驾驶”模式解决在线教育中因材施教、互动陪伴及教师减负三大难题。该平台仅需用户上传一个课件配合约2美元成本和30分钟时间即可自动生成包含AI老师、助教及虚拟学生的完整互动课堂支持自动规划内容、生成音视频幻灯片、交互式习题及项目式学习网页。实测数据显示该模式将课程结业率从传统慕课的不足5%提升至超40%在随机对照实验中其激发主动讨论的效果甚至优于真人授课目前平台已在国家智慧教育公共服务平台累计访问超2000万次并随录取通知书进入清华校园及全国十余所中学试点支持一键本地部署及兼容主流大模型致力于让偏远地区学生也能拥有顶尖的全科AI私教https://github.com/THU-MAIC/OpenMAIC
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2443516.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!