AI跑分飙升却无人问津,“说人话”才是模型出圈关键!
四月AI新动态四月Anthropic发布Opus 4.7OpenAI发布GPT 5.5DeepSeek更新V4。三家公司发布通稿显示跑分、上下文、推理和代码能力提升但互联网反应平淡社交媒体讨论热度低仅OpenAI的GPT - image出圈且与语言模型跑分赛道不同。出圈模型的特点2025年1月DeepSeek R1发布将思考链暴露给用户互动有趣时值春节在无宣发下霸占社媒平台。此前其推理能力已小范围展露正式推出后能力具象展示。社交媒体上传开的是其犹豫表现体现出“说人话”的特点。Opus 4.6口碑飞升因其句子有独特之处对中文梗运用炉火纯青。新一批模型的问题2026年新一批模型如DeepSeek V4代码写作不错但在Chatbot里人格太甜需改system prompt闭麦。新模型语言特征刻板像过度培训的客服Opus 4.7跑分高但少了4.6时期的特色。模型调教的影响模型通过RLHF调教标注员偏好的特征使语言中最有信息量的部分被取消导致模型从GPT - 4o到5.5、R1到V4、Opus 4.6到4.7体感倒退。恐怖谷的语言版本非人类智能工具不假装是人用工具标准评估。而GPT 5.5和Opus 4.7拟人化但内容空洞处于恐怖谷的语言版本位置。R1显化思考链、GPT - image用图像互动可绕过陷阱。AI模型发展阶段类似手机iPhone早期有质变后期跑分提升但日常使用区别小。AI模型也进入类似阶段从不能聊天到可聊天、聊得不错是质变之后性能提升用户体感不明显。性能过剩后决定用户选择的是benchmark量化不了的东西如语感、人格感等。模型公司的关键目前模型公司靠跑分提升难吸引用户模型变“灵”、“说人话”才是关键。跑分支持进步但说人话面向用户分清两者区别很重要。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2564151.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!