为什么工业 AI 必须引入本体论?
如果你只用大语言模型LLM写周报、画插图、做视频你只需要关心它聪不聪明。但如果你要用它去设计一座造价上亿的芯片工厂、去控制百万集群算力中心的液冷系统。你就必须回答AI 凭什么保证绝对不出错大模型的数学本质今天基于 Transformer 架构的大模型其底层数学本质是什么是连接主义Connectionism。是基于海量数据的联合概率分布预测。它像一个黑盒其本质是经验主义。计算相关性而非因果。例如大模型不知道水到了 100℃ 会沸腾的物理学原理。它只是通过计算得出在训练它的万亿级语料中“水”、“100℃”和“沸腾”这几个词同时出现的概率最高。另外它没有绝对边界。因为是算概率所以哪怕概率极低大模型依然有可能输出“水在 -10℃ 沸腾”。这在 AI 术语里叫幻觉Hallucination。工业的本质是什么是确定性。是力学、热力学、光学这样的物理定律。是严密的工程逻辑。工业世界不相信大概率只接受绝对真理。99% 的准确率在工业界等于 0因为那 1% 的错误可能带来毁灭性后果。例如在 C 端娱乐场景AI 答错一个问题用户只会笑笑。在工业场景如果 AI 输出“洁净室压差可以为 -5Pa”。这就意味着外部污染空气会倒灌进无菌室导致千万级的芯片或药品报废甚至引发安全事故。底层矛盾AI 的概率性基因与工业的确定性要求存在不可调和的底层矛盾。如果把大模型直接落地到工业时将不可避免爆发激烈的冲突。增加训练数据、外挂传统 RAG 知识库这样的解法有用吗没用你只是给一个不懂物理的文科生塞了一本厚厚的工程手册然后让他根据字面意思去找答案。他依然没有建立起物理直觉依然会把相似但截然相反的数据拼凑在一起。本体论的引入为了解决这个底层冲突在 HVAC-KG-RAG 项目中我引入了计算机科学中的本体论Ontology。根据 Tom Gruber 在 1993 年提出的经典定义本体是对共享概念模型的形式化、明确的规范说明。An ontology is a formal, explicit specification of a shared conceptualization.不过别被这个高大上的词吓到。用第一性原理来解释本体论就是对现实世界的一种建模。大模型眼里的世界是一堆乱码般的词向量。而在本体论眼里的世界一切事物都有清晰的因果关系。它代表了古典 AI 的另一大流派符号主义Symbolism。本体论做了三件触及本质的事1. 从数据驱动转变为先验约束AI 从海量数据中归纳出经验如果语料里有脏数据AI 就会学进去并输出。本体论是领域专家在 AI 运行之前自上向下写死一套规则。例如本体公理规定了设备的温度 100℃。当大模型因为幻觉算出一个 150℃ 时系统根本不理会大模型的概率有多高直接在底层触发物理硬熔断将其拦截。本体论用先验的物理知识封死了大模型胡说八道的空间。2. 将模糊语义升维成离散符号大模型眼里的世界是连续的向量空间边界模糊。例如“风机”和“风机盘管”在多维空间里距离很近AI 极容易把它们混为一谈或随意拆分。本体论建立了一套由类Classes和关系Relations组成的网格。“风机盘管”被强制定义为一个不可分割的 Equipment设备 实例。本体论用经典的符号主义在 AI 模糊的神经网络之上盖了一张有着清晰网格坐标的滤网。把大模型一团乱麻的语意强行收敛成了非黑即白的结构消除了模棱两可。3. 从黑盒相关性计算走向白盒因果律推理工业界极其厌恶黑盒。如果 AI 建议关闭某个阀门工程师必须知道为什么。纯大模型无法解释只能说神经元权重如此。本体论定义了合法的有向关系如 REQUIRES, HAS_PARAMETER。推理变成了严密的数学图论遍历。可以给出一条类似 A - 引起 B - 超出 C阈值 - 因此关阀 的完整、可溯源的证据链。补齐了大模型最欠缺的因果逻辑链条使得每一次输出都具备了白盒可解释性。成功案例Palantir 公司深度使用了本体论思想并取得了现象级商业成功。从 2022 年底 ChatGPT 横空出世到现在短短三年多时间其股价涨幅超过 20 倍。根最新财报数据季度总营收同比增长依然高达 70%美国商业市场收入实现了令人震惊的 137% 同比增长。在财报电话会议上Palantir 的高管对外直言不讳地揭开了底牌。本体论是我们的秘密武器市场上没有任何其他东西能与之接近。Palantir 的技术体系在 Palantir 的技术体系中本体论是其两大核心旗舰产品 Foundry 和 AIP 的系统基石。它将本体论落地为三个层面。1. 语义层用来定义企业世界观。Palantir 拒绝让 AI 直接去读取底层杂乱无章的 SQL 数据库或数据湖。相反它构建了一个企业数字孪生。在这一层数据被强制映射为对象Objects、属性Properties和关系Links。2. 动态与动作层用来定义边界规则。Palantir 的本体不仅仅是静态图谱它还包含动作Actions和业务逻辑或函数Functions。例如批准采购或调度技术员。本体层会对所有的动作实施严格的权限管控和逻辑校验防止 AI 做出越权或违反常识的操作。3. AI 的翻译官这是 AIP 的核心。Palantir 在部署大模型时大语言模型不直接接触底层数据而是直接与本体进行对话。因为本体拥有清晰的商业逻辑和因果关系大模型就可以直接用自然语言进行无幻觉的逻辑推理。Palantir 的成功无可辩驳地证明。在 B 端和工业 AI 领域得本体论者得天下。只有将概率的 AI 关进本体论的规则牢笼才能创造出真正具备商业变现能力和工程安全性的工业大模型。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2490628.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!