对26年LLM发展的一些思考与展望
01对于 LLM 发展的一些思考还是打算努力维持一下过年期间对于自己的思考的一些总结。说起来 25 年过年的时候想着接下来的一年要多写点结果反向突破快要变成年更账号了。到目前这个时间节点个人感觉 LLM 的应用方向越来越明确了最大的价值就是作为生产力变革的工具3 年淘汰 50% 的白领不是危言耸听反而可能是比较保守的预测了至于生活场景感觉让 AI 帮我点奶茶之类的东西似乎吸引力有限。这个判断主要是基于过去两三个月自己在工作中使用 AI 的体验已经看到团队同事业界中各种牛人能用 AI 做的事情。其实直到 25 年七八月份AI 对于我的生产力提效大概是百分之二三十的感觉但最近两三个月会有奇点到来的感觉。所以我其实最近并不是非常关注模型层面的进展了ds 春节出不出新模型我觉得也都不是那么重要现有模型的智能程度已经足够具备生产力爆发的潜力要说关注的话也主要关注推理成本而不是跑分。我会更关注下列问题的技术进展第一是 agent 持续进化的能力有很多方向的技术在为了这个目标而努力。Memorycontinue learningtest-time training 都是为了这个目标服务。现实生产环境中的任务常有各自的复杂特性模型很难从模型厂商发布的那一刻就足够强大。第二是 agent 的 test-time scaling 的能力也就是把更多算力转化为生产力的能力。agent 实现的很多技术比如最常被提到的 context engineering说到底也是为了 test-time scaling 服务。而 test-scaling 的潜能还远远没有被充分挖掘虽然说目前越来越多产品开始使用 parallel thinking但还是一种原始粗暴的逻辑应该还有非常大的提升空间。第三是推理成本大概是去年 6 月这样一些朋友会来问我未来 tokens 消耗量的增长速度能维持吗我就一直说当 agent 成熟之后这东西燃烧 tokens 的速度非常疯狂。应该是说 25 年大家对于推理成本其实还不算特别的敏感但进入 26 年这个敏感程度可能会提升很多。具体来说目前大家的思路整体还是在不影响模型性能的前提下降本比如上量化的前提是对数据集的跑分没有显著影响而随着降本需求的增强大家可能会在产品中尝试更激进的方式。比如上小模型然后想办法用 test-time scaling 把模型掉的能力补回来。test-time scaling 与推理的降本看起来是方向相反的两件事但实际上是互相促进相辅相成的。上面是对于 LLM 怎么发展的一些思考但最近思考很多的其实是对于 LLM 如何影响程序员工作的问题。02LLM 如何影响程序员的工作一个比较确定的前提是LLM 与 agent 对于编程效率的提升是指数级的。最近也发现也不仅是编程这个环节环境部署性能分析bug fixing 也都能有非常大的效率提升。这就让我们需要重新去思考很多问题。首先是工程思路的迭代。很多过去不可能的事都在变得可能。24 年我还在太初的时候和团队同学聊天说也许我们现在做的各种降低 SDAA就是太初的 CUDA开发难度的工作都不重要以后把 CUDA 代码丢给 LLMLLM 就能直接转成 SDAA。当时大家还觉得这个思路挺天方夜谭的现在已经非常可行了做没做我就不知道了。又比如前两天和做硬件设计的朋友聊现在 LLM 写算子很快了我们就想到也许以后硬件设计团队完成一版设计AI 很快就能写出一版新硬件上的算子集可以端到端跑模型那种然后丢给模拟器看瓶颈。第二是软件架构的重构。当代码变成主要由 AI 来写很多软件工程的理念就需要重新思考了。比如测试驱动研发的理念大多数团队应该都是说说而已但让 agent 写代码测试与各种工具就极其重要了未来测试代码与工具代码的占比会比现在高得多。又比如我们需要在不封装与过度封装中找到平衡点而人类与 agent 想要的平衡点是不一样的agent 没那么害怕代码冗余与膨胀但可能会被封装带来的语义模糊而困扰。第三是团队分工的调整。这个比较好理解未来的每个人都是一个小团队了如果只具备某个方面的能力比如只擅长代码实现那生产力就会很受限了。最后感慨一下程序员毫无疑问将成为接下来要首先被 AI 冲击的行业了这当然是挑战但从好处来说程序员也最有可能成为率先充分掌握 AI 工具的一些人。对于不是这个行业的读者可能现在感受还不太强烈但我有两个建议供参考第一是尽早拥抱像 openclaw 这样的可个人定制的 agent。第二是掌握 vibe coding 的能力这其实不难甚至都不用学编程然后能够自己开发一些对自己有用的小工具。祝大家马年能够驾着 AI 起飞。假如你从2026年开始学大模型按这个步骤走准能稳步进阶。接下来告诉你一条最快的邪修路线3个月即可成为模型大师薪资直接起飞。阶段1:大模型基础阶段2:RAG应用开发工程阶段3:大模型Agent应用架构阶段4:大模型微调与私有化部署配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】ert/b08fb7bf908d3faa4310503cd1bae6a2.jpeg)配套文档资源全套AI 大模型 学习资料朋友们如果需要可以微信扫描下方二维码免费领取【保证100%免费】
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2408931.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!