All in Token,百度李彦宏指出:Token经济,阿里,百度,腾讯,字节,移动,电信,联通,华为,开启新的Token战争

news2026/5/17 8:25:57
当AI作为生产力已经成为确定性命题我们当下应该如何衡量一家AI企业的价值是看大模型跑分刷榜的能力还是用户每天消耗的token数量5月13日的Create2026大会上百度创始人李彦宏提出了一个全新标准——DAA即⽇活智能体数。同时百度也发布了自己的首个通用智能体产品DuMate。2026年“龙虾”成为AI行业当之无愧的主角。在李彦宏看来这是智能体第一次取代大模型独自站在了行业的C位。“龙虾”之所以火爆出圈原因并不在于其调用的模型能力而是来自其自身调用工具执行通用任务的能力。作为国内最早强调智能体重要性应在大模型之上的企业家之一李彦宏在此次大会上进一步提出了一个面向未来的价值度量逻辑DAA⽇活智能体数。这看上去是一个新概念但讨论的其实是一个老问题AI时代的度量衡到底是什么李彦宏指出“过去几年竞争核心是模型能力谁更聪明、谁更会写、谁推理更强。但智能体火起来说明用户真正买单的不是‘你会不会’而是‘你能不能帮我把事做完’这标志着AI在从聊天工具向数字员工和代理人转变。”李彦宏的“自我进化”从垂直智能体到通用智能体从“应用为王”到DAA三年来我们看到李彦宏对行业的判断正在不断进化。事实上李彦宏为本次大会定下的主题正是“自我进化”。这并不是讲百度自身而是对智能体时代的一个整体判断。根据李彦宏的解释“自我进化”的概念包含以下三个层面一是智能体的自我进化从被动响应到从环境中不断吸取营养来提升自己并主动执行二是人类个体的自我进化从普通个体到超级个体并学会跟AI共存三是企业组织的自我进化从人与人的分工协作到人与智能体的混合编队成为超级组织。怎么理解这三个层面首先从智能体本身来看百度伐谋就是一个很好的例子。百度伐谋的核心概念在于自我演化它不仅仅能够解决复杂场景推理问题还拥有对结果进行评估的能力。也就是说智能体仅能够执行用户指令还能够评估交付结果够不够好不断提升自己的交付能力。李彦宏指出“如果一个AI做完事情不知道对不对那对效率的提升一定是有限的但如果它能自己验证——做错了就自己改改完了再跑一轮再优化一轮慢慢就会形成一个几乎不需要人干预的闭环。而一旦闭环跑起来很多事情就真的变成了‘没有最好只有更好’。”“能验证、能闭环伐谋这样的智能体就能无限进化。”有了好用的智能体人类进化为“超级个体”也就成了可能。过去管理学往往认为一个管理者的最佳管理规模不超过10个人但这是基于人类沟通和执行能力的限制。当智能体大幅提高交付能力和通用性一个人能够调用的智能体就可以完成远超过去十个人所做的工作。对企业来说同样如此。面向智能体时代李彦宏分享了组织自我进化的思考企业需要更多授权更少管控更快对齐更少层级更高人才密度更少人海战术更多任务更少分工。事实上百度自己就成为了一个企业组织演化的代表案例。本次大会上发布的秒哒APP整个开发团队只有一个人大部分代码都由秒哒自己完成。甚至一个来自温州的8岁小学生都分享了自己搭建的校园共享雨伞APP。智能体时代的企业效率正在指数级提升。《算力Token运营算力构建和Token生成、营销和Token智能体应用实操》大模型算法实战专家—周红伟 法国科学院算法博士/前阿里人工智能专家/马上消金风控负责人课程背景2026年企业将“Token服务”定为经营主线宣布从“流量经营”转向“Token经营”。同年同时将Token与智能体封装以“主从智能体协同”方式交付可独立完成任务的成品。但多数企业的实际情况远未跟上这一节奏。算力资源买了、模型接入了Token账单月月上涨却没人能回答三个基本问题消耗的Token去了哪些业务、消耗是否合理、能否对外卖出价钱。。与此同时Token的商业形态出现两条路径。一条是卖原料——按量计费的通用Token竞争激烈利润趋薄。另一条是卖成品——将Token与场景知识、任务流程封装为智能体按结果或效果收费溢价空间显著。两条路的算力需求、定价逻辑、客户关系和运营重点截然不同选择哪条路直接决定AI投入能否回本。本课程解决两个核心问题第一算力如何建成可计量、可降本的Token供给线第二Token如何封装成客户愿意买单的智能体产品。两天时间从算力底座到营销定价再到封装交付一条完整链路走完。课程收益掌握算力基础设施的成本拆解方法能区分中心云、边缘节点、端侧设备在成本结构中的占比与优化方向。能够设计Token的分层定价体系按通用、专业、定制三级制定差异化价格覆盖公众、中小企业和政企客户。掌握业务场景的任务拆解方法能画出一条端到端工作流并标注每个节点所需的模型规格。学会设计主从智能体协同架构能区分主智能体的调度职能和从智能体的专职任务避免功能混杂。带走一套可立即使用的工具模板含算力成本测算表、Token运营周报格式、智能体封装设计画布。培训时长2天课程大纲第一天算力底座的构建与Token的高效生产主题从物理算力到可计费Token的完整供给链搭建第一部分 算力基础设施的选型与成本模型1.1算力供给的三层结构1.1.1 中心云承载高并发的在线推理与模型更新1.1.2 边缘节点处理时延敏感型业务的就近部署策略1.1.3 端侧设备AI摄像头、AI智屏等终端的轻量算力利用1.2算力成本的可视化拆解1.2.1 硬件折旧GPU集群的租赁与自建在三年周期内的分摊模型1.2.2 能耗支出算力满载与闲置状态下的电力成本差异1.2.3 运维人力集群规模与所需驻场工程师的配比参考1.3算力利用率的评估与提升1.3.1 峰谷调度将离线训练与夜间闲时算力匹配的错峰方案1.3.2 碎片整理小任务合并为大批次请求的攒批策略1.3.3 淘汰机制长期低利用率的模型版本下线规则第二部分 算力到Token的转化推理引擎与供给平台2.1推理服务的部署架构2.1.1 模型加载内存常驻与按需加载两种模式的选择依据2.1.2 并发设计单卡支持多路请求时的显存分配与排队策略2.1.3 弹性伸缩基于请求队列长度自动扩容的阈值设定2.2 Token生成的计量与质量控制2.2.1 输入Token与输出Token的分开统计两者成本差异悬殊2.2.2 生成长度控制设置最大输出Token数防止失控消耗2.2.3 输出质量校验对生成结果的可读性与事实性做自动化抽检2.3多模型供给的统一平台搭建2.3.1 模型注册所有可用模型的规格、成本、适用场景进入统一目录2.3.2 智能路由规则请求进来后根据复杂度与预算自动分配模型2.3.3 权限与配额管理按部门、按应用设置Token消耗上限第三部分 Token生产的经济账降本增效的实战手段3.1缓存与复用策略3.1.1 语义缓存相似问题直接返回缓存结果命中率的提升方法3.1.2 上下文复用多轮对话中固定前缀的Token消耗豁免技巧3.1.3 模板化输出高频格式类生成的预置模板绕开重复推理3.2 Prompt工程对成本的影响3.2.1 指令精简在不损失效果的前提下压缩提示词的多次迭代测试3.2.2 示例数量的权衡少样本与多样本在成本与准确率之间的拐点3.2.3 思维链的按需启用简单任务关闭长推理链的门槛设置3.3模型选型的降本阶梯3.3.1 分类与抽取用小模型准确率达标时优先调用轻量版本3.3.2 生成与理解用大模型仅在需要语义能力时启用高成本模型3.3.3 微调后的专用模型一次投入换取长期单次调用成本下降的核算方法第四部分 Token营销的定价体系设计4.1分层定价的三级结构4.1.1 通用Token适合QA、摘要等大众化场景的低价走量策略4.1.2 专业Token绑定行业知识库或微调模型的中等溢价定价4.1.3 定制Token含私有化部署与驻场服务的年度合约报价模式4.2分客群的套餐设计4.2.1 公众用户小面额体验包与跟宽带、云盘捆绑的权益包4.2.2 中小微企业按月订阅的Coding Plan设定阶梯用量与超量单价4.2.3 政企大客户私有化部署后的Token批发折扣与年度增量返点4.3营销效果的追踪指标4.3.1 Token消耗的客户活跃率按周统计有消耗行为的客户占比4.3.2 客户平均消耗量的增长曲线判断客户是否真正嵌入业务流4.3.3 套餐档位迁移率客户从低档向高档升级的比例与触发原因第五部分 Token运营的日常管控体系5.1用量监控与异常检测5.1.1 部门维度的日消耗排名识别消耗突增的组织与原因5.1.2 单应用维度的单位成本曲线监测模型调用效率的变化趋势5.1.3 异常调用的自动拦截高频、超大、非时段的请求触发强制审核5.2内部结算机制的落地5.2.1 部门Token成本分摊表的编制将账单从IT部门下沉到使用方5.2.2 预算额度与审批流程超预算申请的人工审核与自动拒绝规则5.2.3 成本节约的激励机制对Token降本有贡献的部门给予分成奖励5.3 Token运营报表的标准化5.3.1 周报的三项必含数据消耗总量、异常事件数、单位成本变化幅度5.3.2 月报的经营分析各部门消耗占比、套餐覆盖率、降本措施效果汇总5.3.3 数据源的自动化采集对接算力平台与计费系统的接口规范第六部分 第一天实战搭建一套可运行的算力Token运营方案6.1场景设定与资源盘点6.1.1 选择模拟标的一家中型连锁零售企业的AI巡检与客服需求6.1.2 算力资源给定中心云100卡、边缘节点20个、端侧设备500台6.1.3 业务需求清单门店巡检日报生成、在线客服应答、商品描述批量撰写6.2分组制定供给与定价方案6.2.1 算力调度方案三个业务分别部署在中心云还是边缘节点的决策依据6.2.2 模型选型与Token预估每个业务匹配哪种规格模型预估月Token消耗量6.2.3 对外营销定价针对不同客户群设计Token套餐结构与价格6.3产出运营管控计划6.3.1 编写监控指标清单设定各业务的Token消耗红黄绿基线6.3.2 制定异常处理预案当某业务Token消耗突增50%时的应对步骤6.3.3 形成一份Token运营周报模板供各组带回实际使用第二天Token的智能体封装与商业化应用主题从卖Token原料到交付智能体成品的全流程实操第一部分 智能体封装的经济逻辑与场景选择1.1 Token原料与智能体成品的价值差1.1.1 客户为“能完成任务的数字员工”付费的意愿远超“算力消耗额度”1.1.2 封装一次投入、持续收入智能体开发成本固定边际服务成本递减1.1.3 封装提升客户黏性客户换智能体比换模型服务商的迁移成本高得多1.2适于封装的任务特征1.2.1 流程固定且重复频次高巡检、核保、报告生成等每周执行数十次以上1.2.2 需多步判断与多数据源协同单次任务即消耗大量Token的复合型工作1.2.3 结果可被客观评价审批通过与拒绝、报告通过与否、巡检异常是否属实1.3封装前的可行性评估1.3.1 当前AI调用量是否足以支撑封装投入的开发成本摊薄1.3.2 任务流程能否被分解为独立、可替换的子节点1.3.3 客户是否认可“按任务结果付费”而非“按Token消耗付费”第二部分 任务拆解将业务场景翻译成Token工作流2.1端到端任务的节点切割2.1.1 以“保险核保助理”为例拆为信息提取、规则匹配、风险评估、结论生成四节点2.1.2 每个节点的输入物和输出物必须定义清楚输出物是下一节点的输入2.1.3 设置节点间的异常返回某节点无法完成时退回上游还是转人工2.2节点任务类型的划分2.2.1 理解类节点意图识别、情感分析必须交给大模型2.2.2 查询类节点从数据库或API取数据用函数调用而非生成2.2.3 判定类节点按既定规则做是否判断用规则引擎或小模型2.3工作流的验证标准2.3.1 端到端成功率完整走完所有节点并输出有效结果的比例2.3.2 单节点耗时每个节点的响应时间是否满足业务时效要求2.3.3 Token消耗的可预测性同类型任务每次消耗的Token数偏差不超过15%第三部分 模型匹配与主从智能体的协同设计3.1每个节点选择最优模型3.1.1 理解节点配大模型保证语义准确但限制输出长度以防浪费3.1.2 查询节点配专用接口直接调数据库完全绕过生成式模型3.1.3 判定节点配轻量模型或规则库成本低、速度快、结果稳定3.2主智能体的设计与职责3.2.1 任务分发根据用户输入判断该启动哪个从智能体3.2.2 上下文维护多轮对话或跨节点时关键参数不丢失的机制3.2.3 异常接管从智能体返回不确定时重新派发或升级人工3.3从智能体的设计与复用3.3.1 单一职责一个从智能体只做一个任务避免功能混杂3.3.2 独立版本管理每个从智能体有自己的版本号升级不影响其他3.3.3 跨场景复用同一个“数据库查询智能体”可被多个业务场景调用第四部分 封装定价与服务交付的设计4.1三种定价模式的适用场景4.1.1 按任务量计费适用于每次结果标准化程度高的场景如单次审核4.1.2 按效果分成适用于可直接量化客户收益的场景如销售线索转化4.1.3 月订阅加超额累进基础月费含定量任务超出后按阶梯价结算4.2服务等级与交付物定义4.2.1 明确交付的是决策建议还是执行结果建议可免责执行结果需担责4.2.2 设定准确率承诺与免赔条款准确率低于承诺值时按比例退费或免单4.2.3 人工兜底的触发条件与响应时效模型无法处理时转人工的时间上限4.3定价的试算与调整4.3.1 先算出该任务的后台Token成本作为定价底线4.3.2 加上封装溢价知识、流程设计、运维支持的分摊4.3.3 与客户现有方案的成本做对比人工做同样任务的成本是多于还是少于智能体第五部分 星辰TokenHub封装能力实操5.1平台的多模型聚合与路由操作5.1.1 在平台上注册三个不同规格的模型分别标注适用场景与成本5.1.2 配置一条智能路由规则简单请求转轻量模型复杂请求转大模型5.1.3 跑一批混合请求流观察分流比例与总Token成本的变化5.2主从智能体的部署与联调5.2.1 创建一个主智能体设定其任务规划指令与从智能体选择逻辑5.2.2 创建两个从智能体一个做信息检索一个做文本生成5.2.3 发送复合指令测试协同观察从智能体的唤醒、交接和最终输出5.3监控与调优5.3.1 查看智能体调用的消耗报表区分各从智能体的Token消耗占比5.3.2 定位高消耗节点分析是否有某个从智能体被过度调用5.3.3 调整路由规则或提示词再次测试观察成本变化第六部分 结业路演交付你的智能体封装商业方案6.1分组选题与设计6.1.1 每组选定一个行业场景设备预测性维护、零售门店巡检、信贷审批、保险核保等6.1.2 完成端到端任务拆解图标注每个节点的模型选择与预估Token消耗6.1.3 设计主从智能体架构与协同流程给出封装后的定价方案6.2路演与答辩6.2.1 每组10分钟陈述重点讲业务痛点、任务拆解、模型匹配逻辑与定价依据6.2.2 评委提问方向智能体封装后能否真正替掉人工环节定价是否有竞争力6.2.3 每组提交《智能体封装商业设计书》作为结业成果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2620968.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…