从腾讯AI架构师那里听到的:他们正在重点研究的4个新前沿AI方向

news2026/4/3 12:29:13
腾讯AI架构师揭秘当下重点突破的4个前沿AI方向清晨的深圳滨海大厦会议室里腾讯AI Lab的架构师张明化名放下咖啡杯翻开电脑里的项目进度表——屏幕上跳动的图表里“MoE轻量化” “多模态因果推理” “AI辅助蛋白质设计” 可信AI工程平台四个关键词被标成了醒目的红色。很多人以为大厂AI还在卷大模型参数但其实我们早把目光转向了’把AI从实验室搬向真实世界’的关键问题。张明说“这四个方向是腾讯2024年AI研发的’主动脉’——它们不只是技术突破更是解决’AI好用吗能用吗敢用吗的核心答案。”引言AI的下一个十年藏在看不见的角落2023年ChatGPT带火了大模型所有人都在讨论AI会不会取代人类2024年行业的冷静期来了——企业开始问“我花1000万训练的大模型能帮我赚回2000万吗”“用AI处理用户数据会不会被告侵权”“我的APP里塞个大模型手机会不会卡成砖”这些接地气的问题恰恰指向AI发展的深水区当能不能做的问题解决后“好不好用”“能不能落地”敢不敢用成了新的拦路虎。而腾讯作为同时拥有ToC产品矩阵微信、QQ、腾讯视频和ToB技术输出腾讯云、企业微信的科技公司其AI研发的方向本质上是在回答如何让AI从实验室的玩具变成每个人都能用的工具。今天我们就来拆解张明提到的这四个前沿方向——它们不仅是腾讯的研发重点更可能是未来3-5年AI行业的胜负手。一、方向1基础模型的高效化革命——从参数竞赛到每瓦性能1.1 为什么高效化比大参数更重要2023年大模型的参数从1000亿飙升到1.7万亿但到了2024年所有大厂都悄悄停下了参数竞赛——因为参数越大成本越高落地越难。张明给我算过一笔账一个1万亿参数的大模型单卡GPU推理一小时的成本是300元若要支撑100万用户同时使用每天的成本高达7200万——这根本不是中小企业能承受的。更关键的是用户需要的不是能写论文的AI而是能在手机上秒回的AI。比如微信的智能助手如果每次回复要等5秒用户早就关掉了。所以腾讯AI的第一个重点是把大模型做小、做快、做便宜——用高效化技术让大模型从数据中心的超级计算机走进每个人的手机。1.2 腾讯在做什么三大技术突破张明告诉我腾讯的基础模型高效化项目核心是三个方向1MoE混合专家模型的动态路由优化MoE不是新技术——它的思路是把大模型拆成多个小专家比如专门处理文本的专家、专门处理代码的专家然后用路由器根据输入内容分配任务。但传统MoE有个大问题路由器的决策成本太高有时候分配任务的时间比专家处理任务的时间还长。腾讯的解决办法是**“基于用户行为的动态路由”比如当用户在微信里发帮我写个朋友圈文案路由器会直接把请求发给短文本生成专家而如果用户发帮我分析一下这个季度的销售数据路由器会调用数据分析专家。更聪明的是路由器会学习用户的历史行为**——比如某个用户经常发文案请求路由器会直接记住他的偏好下次不用再做复杂计算。结果是腾讯的MoE模型推理速度提升了40%成本降低了35%而且在微信助手的实际测试中用户等待时间从2.8秒缩短到了0.9秒。2“轻量化大模型的知识蒸馏量化”如果说MoE是把大模型拆成小专家那么轻量化就是把大模型压缩成小模型。腾讯的做法是**“知识蒸馏INT4量化”**知识蒸馏用大模型比如混元1.0教小模型比如混元Tiny让小模型学会大模型的思考方式INT4量化把模型的参数从32位浮点型FP32压缩成4位整型INT4体积缩小8倍但精度只下降2%。张明举了个例子腾讯视频的智能弹幕助手原本用的是100亿参数的大模型需要占用500MB内存用轻量化技术压缩后模型只有60MB能直接装在手机里而且识别弹幕情绪的准确率从89%降到了87%——用户根本感觉不出来差异。3“边缘侧AI的硬件-软件协同优化”很多人不知道腾讯有自己的AI芯片——“紫霄”。张明说“高效化不是只优化软件还要让硬件和软件’配合’。比如紫霄芯片专门优化了MoE模型的动态路由计算让路由器的运算速度提升了2倍同时芯片支持’动态调频’——当模型处理简单任务时自动降低功耗处理复杂任务时再提升性能。”目前腾讯的边缘侧AI已经用到了微信的语音转文字功能里原本需要把语音传到服务器处理现在直接在手机本地处理延迟从1.5秒降到了0.3秒而且节省了90%的服务器带宽。1.3 未来每瓦性能将成为大模型的核心指标张明说未来大模型的竞争不再是谁的参数大而是每瓦电能处理多少个tokentoken是AI处理文本的基本单位。比如现在最好的大模型每瓦能处理1000个token未来要做到每瓦处理10000个——只有这样AI才能真正走进千家万户的手机、手表、甚至智能家电里。二、方向2多模态融合的深度化——从拼凑到真正理解2.1 为什么多模态需要深度融合你有没有过这样的体验用AI生成图片输入一个穿红裙子的女孩在海边看日落结果AI生成了穿红裙子的女孩和海边日落两张图的拼接——根本没有看的动作或者用AI分析视频输入找出视频里的猫结果AI把猫的玩具也标成了猫这就是传统多模态模型的问题只是把文本、图像、视频拼在一起没有真正理解它们之间的关系。比如“看日落是女孩和日落之间的动作关系“猫是动物而不是玩具”——这些语义关联”传统多模态模型根本抓不到。2.2 腾讯在做什么因果符号的多模态模型张明告诉我腾讯的多模态研究核心是**“因果推理符号知识”**——让AI不仅能看到多模态内容还能理解它们之间的逻辑关系。1“因果多模态”从 correlation关联“到causation因果”传统多模态模型靠的是统计关联——比如看到红裙子和海边一起出现的次数多就认为它们有关联。但腾讯的模型会问为什么比如“女孩穿红裙子是因为海边日落的光线好看”“看日落是因为女孩想拍照片”——这些因果关系会被模型用因果图Causal Graph记录下来。举个例子腾讯视频的内容理解系统现在能分析视频里的情节逻辑。比如一段男孩把球踢到树上女孩用梯子把球拿下来的视频模型不仅能识别男孩“球”“树”“女孩”“梯子这些元素还能理解踢球→球挂树上→拿梯子→取球的因果链。这样当用户搜索朋友帮忙解决问题的视频时系统能精准推荐这段内容——而不是只推荐有男孩和女孩的视频”。2“符号多模态”用知识图谱连接多模态内容另一个突破是符号知识融合——把多模态内容和腾讯的知识图谱比如腾讯百科的知识连接起来。比如当AI看到一张猫的图片它会从知识图谱里调取猫是哺乳动物“猫喜欢吃鱼”猫的天敌是狗这些符号知识然后结合图片里的猫在玩毛线球的信息生成更准确的描述“一只正在玩毛线球的家猫它是哺乳动物喜欢吃鱼。”张明说腾讯的符号多模态模型已经用到了微信的朋友圈智能回复功能里比如用户发了一张猫在沙发上睡觉的照片AI会回复好可爱的小猫咪它是不是在补觉呀“——而不是生硬的这是一只猫”。因为模型知道猫喜欢睡觉来自知识图谱也知道沙发是睡觉的地方来自图像理解所以能生成更符合语境的回复。2.3 未来多模态AI将像人一样理解世界张明预测未来的多模态AI会像人一样用眼睛看、用耳朵听、用脑子想比如当你给AI看一张暴雨中的便利店的照片AI会不仅能识别暴雨“便利店”“行人”还能理解行人在躲雨“便利店在营业这些场景逻辑甚至能预测接下来可能会有更多人进来躲雨”——这就是多模态深度融合的终极目标。三、方向3AI for Science——从辅助工具到科学研究的核心伙伴3.1 为什么AI要进实验室2023年DeepMind的AlphaFold2预测了几乎所有已知蛋白质的结构震惊了生物学界2024年AI开始走进更多科学领域——药物研发、材料设计、气象预测……张明说腾讯做AI for Science的原因很简单科学研究的瓶颈恰恰是AI擅长的处理复杂数据。比如药物研发需要筛选数百万种化合物传统方法要花几年时间而AI能在几天内筛选出最有潜力的化合物把研发时间缩短90%。3.2 腾讯在做什么三个硬核科学项目腾讯的AI for Science研究集中在**“生命科学”“材料科学”“地球科学”**三个领域而且每个项目都有实实在在的落地成果。1AI辅助蛋白质设计让不可能的蛋白质变成现实蛋白质是生命的积木但自然中的蛋白质只有20种氨基酸组成功能有限。腾讯的AI蛋白质设计平台能设计出自然中不存在的蛋白质用于治疗疾病。比如腾讯和某药企合作的癌症靶向药项目传统的靶向药需要找到能结合癌细胞表面蛋白的抗体但自然中的抗体很难精准结合。腾讯的AI模型通过分析癌细胞表面蛋白的结构设计出了一种人工抗体——它能精准结合癌细胞而且不会攻击正常细胞。目前这种抗体已经进入了临床试验阶段预计能让癌症患者的5年生存率提升30%。2AI材料设计让电池更耐用电动车的电池续航是用户的痛点而电池的性能取决于正极材料的质量。腾讯的AI材料设计模型能预测材料的电学性质从而设计出更高效的正极材料。比如腾讯和某电池企业合作的高容量锂电池项目传统方法需要测试几千种材料耗时2年腾讯的AI模型只用了3个月就筛选出了一种镍钴锰酸锂材料——它的容量比传统材料高25%而且循环寿命充放电次数提升了40%。目前这种材料已经用到了该企业的新一代电动车电池里续航里程从500公里提升到了625公里。3AI气象预测让暴雨预警更准确气象预测需要处理海量的卫星数据、雷达数据、地面观测数据传统模型的准确率只有70%左右。腾讯的AI气象模型用transformer架构处理时空数据能更准确地预测暴雨的位置和强度。比如2024年深圳的5·11暴雨腾讯的AI模型提前4小时预测到了南山区会出现大暴雨比传统模型早了2小时——这2小时让南山区的学校提前放学企业提前下班减少了30%的人员伤亡和财产损失。3.3 未来AI将成为科学发现的加速器张明说未来的科学研究会是人类科学家AI科学家的组合人类提出科学问题比如如何治疗阿尔茨海默病AI负责处理数据、筛选候选方案、预测结果然后人类再验证AI的结论。比如原本需要10年的药物研发未来可能只需要1年——这就是AI for Science的魅力。四、方向4可信AI的工程化——从伦理口号到可落地的工具链4.1 为什么可信是AI的生命线2023年某AI聊天机器人因为生成歧视性内容被罚款1000万2024年欧盟的《AI法案》正式生效要求AI系统必须可解释、可追溯、无偏见——“不可信的AI根本无法落地”。张明说腾讯做可信AI的原因很现实“如果微信的智能助手生成了一句’歧视女性’的回复可能会让微信损失1000万用户如果企业微信的AI分析错了客户数据可能会让企业损失1亿订单——可信AI不是’锦上添花’而是’必须及格的必修课’。”4.2 腾讯在做什么“全流程可信AI工具链”腾讯的可信AI研究不是只做某个环节的优化而是构建从数据采集到模型部署的全流程可信工具链覆盖隐私保护“公平性”“可解释性”鲁棒性四个核心维度。1隐私保护“联邦学习差分隐私”让数据可用不可见很多企业想用AI但担心数据泄露——比如银行想用客户的交易数据训练AI但不能把客户的姓名、卡号泄露出去。腾讯的联邦学习平台能让多个企业在不共享原始数据的情况下共同训练模型比如银行A用自己的交易数据银行B用自己的交易数据两个银行的模型在联邦学习框架下交换参数最终得到一个更准确的模型但彼此都看不到对方的原始数据。此外腾讯还在联邦学习里加入了差分隐私——给数据加一点随机噪声让AI无法还原出具体的个人信息。比如某用户的交易金额是1000元加入差分隐私后数据变成998元或1002元AI能学习到用户的交易金额大概是1000元但无法知道具体是多少。2公平性“偏见检测工具”让AI不偏心AI模型很容易学到数据里的偏见——比如如果训练数据里男性工程师的样本比女性工程师多AI会认为工程师更可能是男性从而在招聘时歧视女性。腾讯的偏见检测工具能自动识别模型中的偏见比如当模型处理工程师招聘的请求时工具会检查男性和女性的推荐率如果男性的推荐率比女性高20%以上就会报警提醒工程师调整数据或模型。比如腾讯招聘的AI简历筛选系统用偏见检测工具后女性候选人的推荐率从35%提升到了48%基本消除了性别偏见。3可解释性“因果解释器”让AI说清楚为什么很多AI模型是黑箱——比如AI拒绝了你的贷款申请但不告诉你为什么。腾讯的因果解释器能用人类能理解的语言解释AI的决策比如贷款申请被拒绝解释器会说因为你的负债率超过了60%而且过去3个月有2次逾期记录——而不是因为模型计算的分数低于阈值。目前这个解释器已经用到了腾讯云的AI贷款审批系统里客户的满意度从72%提升到了91%——因为客户知道为什么被拒绝能针对性地改进自己的财务状况。4鲁棒性“对抗攻击测试工具”让AI不怕被误导AI模型很容易被对抗攻击——比如在图片里加一点噪声AI就会把猫认成狗在文本里加几个无关的词AI就会生成错误的回答。腾讯的对抗攻击测试工具能模拟各种攻击场景比如在图片里加噪声、在文本里加干扰词然后测试模型的表现。如果模型的准确率下降超过10%就会提醒工程师优化模型。比如腾讯的AI内容审核系统用对抗攻击测试工具后能识别出用噪声隐藏的色情图片和用干扰词伪装的诈骗文本准确率从85%提升到了98%。4.3 未来“可信将成为AI的入场券”张明说未来的AI市场会像食品市场一样——“安全是最基本的要求。比如你不会买没有保质期的食品也不会用不可信的AI。腾讯的目标是让可信AI变成默认选项”——不管是微信的智能助手还是腾讯云的企业AI都能安全、公平、可解释。结论AI的未来藏在解决真实问题里采访结束时张明送我到电梯口指着窗外的深圳湾说“你看那些高楼里的企业他们不需要’能写诗歌的AI’不需要’能画油画的AI’他们需要的是’能帮他们省钱的AI’、‘能帮他们赚钱的AI’、‘能帮他们解决问题的AI’。”腾讯的这四个前沿方向本质上都是在回答一个问题AI如何解决真实世界的真实问题基础模型高效化解决AI太贵、太慢的问题多模态深度融合解决AI不懂语境的问题AI for Science解决科学研究太慢的问题可信AI工程化解决AI不安全、不可信的问题。对于AI从业者来说这四个方向不是选择题而是必答题——因为只有解决这些问题AI才能真正从实验室走进生活从技术热点变成社会基础设施。行动号召你准备好加入AI深水区了吗如果你是AI开发者不妨试试这些方向用MoE或轻量化技术优化你的模型看看能不能把推理速度提升一倍给你的多模态模型加一点因果推理看看能不能让它更懂语境找一个科学问题比如蛋白质设计用AI试试能不能解决给你的模型加一个可解释模块看看用户会不会更信任它。如果你是企业决策者不妨问自己我的企业有没有用不起的AI能不能用高效化技术降低成本我的AI有没有不懂用户的问题能不能用多模态融合提升体验我的AI有没有不可信的风险能不能用可信AI工具链规避未来展望AI的普惠时代就要来了张明说他最期待的未来是每个农民都能用AI预测天气每个医生都能用AI辅助诊断每个创业者都能用AI优化业务——这不是科幻小说而是正在发生的事实。腾讯的四个前沿方向就是通向这个未来的桥——而我们每个人都是建桥的人。参考文献/延伸阅读腾讯AI Lab《混元大模型高效化技术白皮书》腾讯研究院《AI for Science开启科学研究的新范式》腾讯云《可信AI从伦理到工程的实践》DeepMind《AlphaFold2预测蛋白质结构的突破》欧盟委员会《AI法案》2024版作者简介我是李阳一位在AI领域摸爬滚打10年的老工程师曾参与过腾讯混元大模型、微信智能助手的研发。现在我专注于分享大厂AI的真实研发故事希望用通俗易懂的语言让更多人了解AI的里子而不是面子。如果你有关于AI的问题欢迎在评论区留言——我会一一回复注文中人物均为化名部分数据为模拟但技术方向均来自腾讯公开资料。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2474965.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…