【卷卷漫谈】小米 MiMo V2.5 发了一个很能打的新模型,顺便把 Token Plan 也修好了
小米今天凌晨发了四个模型MiMo-V2.5、V2.5-Pro、V2.5-TTS Series、V2.5-ASR还顺手升级了 Token Plan。说实话这次不像是挤牙膏更像是一口气把能放的全都放出来了。凌晨群里还挺热闹我是亲历者先交代一下背景——我是在 MiMo V2 公测时就加了用户群的那种答住。今天凌晨三点多运营在群里发了一条上线通告我本来只是想看看有没有什么新活结果一用就睡不着了。这个感受是真实的不是那种评测视频里看起来很厉害的厉害是真的上手跑任务的时候能感觉到这个模型跟以前那些不太一样的那种感觉。后来看群里大家的状态基本都是睡什么睡起来卷——说明不是我一个人上头。V2.5 到底什么水平先说能力多模态是原生支持的不是后期拼接图像、音频、视频一个模型搞定。Video-MME 87.7Gemini 3 Pro 是 88.4基本并排了。Agent 能力实测Claw-Eval 通用子集 62.3多模态子集 23.8跟 Claude Sonnet 4.6 持平离 Claude Opus 只差一个点。放在半年前这个成绩是想都不敢想的那种现在真的追上了。然后是 Token 效率。官方说相同 Agent 基准分下MiMo-V2.5 比 Muse Spark 省 50% TokenV2.5-Pro 比 Kimi K2.6 省 42%。省 Token 就是省钱这才是对开发者真正有意义的指标。那个 4.3 小时写完北大编译原理大作业的故事发布会上最让人记住的是这个细节北大本科生做《编译原理》Rust 编译器项目正常周期是几周V2.5-Pro 用了 4.3 小时调用 672 次工具隐藏测试 233/233 满分。我的反应就是两个字离谱。这个强度已经不是AI 辅助了是 AI 替你把活干了。Token Plan 的坑这次填上了之前有俩大坑100 万上下文额外收 4 倍率256k 和 100 万分开算计费。这次统一了——V2.5 每 token 1 creditV2.5-Pro 每 token 2 credit没有乱七八糟的倍率了。还加了夜间优惠和自动续费就是告诉开发者你要跑长任务晚上跑便宜。之前那个 4 倍率说实话有点离谱这次改了我觉得是在认真做生态。我的判断真的做对了的事多模态能力真的从凑合用变成能打了Token 效率领先意味着 API 成本能降一半全球开源对开发者有吸引力Lite 档 ¥39/月 门槛很低。还需要观察评测分数再好看生产环境稳定性才是留住人的关键跟 Claude Opus、GPT-5.4 正面较量这个说法需要更多独立第三方验证工具链成熟度还在追。总结一句小米这次不是在参与竞争是在重新定义竞争维度——把 Token 效率和多模态原生能力打包成一套逼着别人跟着卷。不只是自己卷还让对手也不得不卷这是比较狠的地方。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2548320.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!