AI理科碾压人类状元,却被这道“文科题”戳中了死穴...
谁敢信日本最难考的顶尖学府——东京大学和京都大学刚刚被AI实现了突破。不仅是考上成绩还大幅领先。在LifePrompt公司和日本老牌补习机构“河合塾”搞的一场闭卷盲测中OpenAI的最新大模型ChatGPT 5.2 Thinking大幅领先人类顶尖考生。但值得注意的是。在翻看这份成绩单时我们发现了一个AI得分率仅为25%的“显著薄弱环节”。这个大坑或许恰好是当代高考生和准大学生们的“核心竞争力所在”。多考50分数学拿满分先来看一眼这份成绩单。这可不是开卷考试。测试全程物理断网AI只能凭自己的“脑力”预训练权重硬做。结果呢在号称日本地狱级难度的东大理科三类医学部考试里满分550分ChatGPT5.2拿了503分。作为参照今年考上这个专业的人类最高分仅仅是453分。整整高了50分更值得注意的是它的数学直接拿了满分英语得分率也稳稳踩在90%的基准线上。京都大学同样取得了突破性成绩。在医学部考试中AI获得1176分把人类状元的1098分远远甩在身后。要知道AI进化速度令人瞩目。回看2024年老前辈GPT-4在这套卷子面前未能通过所有科目连最低录取线都没够到。2025年加了强化学习的o1模型终于首次达到录取合格线。结果才过了一年ChatGPT 5.2以最高分通过考试。得分率25%的短板数学满分英语90%理应是无敌的存在了吧但是在这份优异的成绩单中有一科的成绩明显不足——世界史论述题满分60它只拿了15分得分率仅为25%。为何一个拥有庞大知识储备、数学能力极强的模型会在文科论述题上表现明显不佳阅卷的河合塾老师和技术社区的专家们给出了答案因为这届AI严重缺乏结构化组织能力Structural organization。世界史论述题可不是背年份填空。它需要你把历史长河里的碎片串起来理出政治和经济的因果写出一篇逻辑严密、首尾呼应的大文章。一句话需要人类的“宏大叙事”。而这恰恰是大模型目前的死穴。当让它写上千字长文时它写着写着就偏离了主题。开发者社区做过极端测试如果让现在的AI去维持一个超长文本的“连贯思想主线”往往在几轮逻辑转折后它就开始出现结构性断裂Structural collapse。更要命的是在处理极度复杂的宏大卷宗时它还可能遭遇“长期记忆坍缩”上下文丢失逻辑线瞬间重置。也就是说目前的大模型依然缺乏全局架构能力。它写出来的东西单看每一句辞藻都很华丽但拼在一起整体缺乏逻辑连贯性完全没有人类统领全局的“世界观”。准大学生的“反击指南”看懂了这个25%的软肋高考生和准大学生的破局方向也就清晰了。日本人工智能学会会长Satoshi Kurihara教授说得好人类绝对不该在同一条赛道上与AI直接竞争。打个比方你非要跟计算器比算数快这显然不是明智之举。在AI轻松超越人类顶尖理科考生的时代准大学生们的技能树必须得换个点法了第一减少对“规则内机械做题”的依赖。不管你微积分算得多快法条背得多熟练你都拼不过几美分调用一次的API接口。靠疯狂刷题、机械记忆去换取职场高薪的路线正在急速贬值。果断把你的时间精力从纯粹的“拼记忆、拼算力”里抽离出来。第二将重心转向“宏观架构能力”的培养。AI连世界史大题都统筹不好说明它目前根本当不了“总工程师”。未来的高薪岗位属于那些懂行的“AI项目经理”。你需要重点培养的能力是如何提出直击本质的犀利问题如何把一个庞大模糊的任务精准拆解成十几个AI能听懂的标准指令最后如何用人类的战略眼光把AI生成的一堆碎片拼装成一套能用的系统。第三去那些充满复杂性和不确定性的现实场景中历练。AI喜欢干净、透明、结构化的数据。但在真实的社会里到处是混沌、情绪和谎言。在一场剑拔弩张的商务谈判里怎么察言观色搞定客户在公司不同派系的利益博弈中怎么调解冲突面对一团乱麻的市场反馈谁来顶住压力拍板担责这些需要同理心、信任背书、道德抉择的“高感触High-touch”领域是AI目前无法有效介入的领域。时代真的变了。机器的履带已经越过了知识评估的及格线。与其在AI擅长的规则中过度内卷不如退一步去填补那些技术无法替代的领域。本文首发钛媒体App作者 AGI-Signal编辑林深声明本文所涉数据及推演均严格基于客观原始信息。包括LifePrompt对东京大学与京都大学的录取分数线对比盲测数据、大语言模型在长文本结构上的架构缺陷剖析及相关人工智能专家访谈等。需警示的是AI技术演进属于极速变动的高压领域本文的客观对比与能力推演不构成任何教育、升学或财务投资建议。读者在进行个人能力规划与发展决策时应充分评估技术变迁带来的深远影响。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2584028.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!