简单聊聊现在的AI

news2025/7/19 15:13:26

简单聊聊现在的AI

  • 前言
  • 主要的AI模型和形式
    • LLM - Large Language Model(大语言模型)
    • BOT(机器人)
    • LAM - Large Action Models(大行动模型)
    • Agent(智能体)
  • 结尾

前言

好久没回来写博客,这次回来。主要是身份的转变,在产品领域深耕了一些日子,目前的互联网变更的真的太快了。chatGPT才爆火多久? 一下子就行业爆了,传统互联网遭受到了前所未有的冲击。我们就简单聊聊 AI 吧。

主要的AI模型和形式

现在 AI 这个词语很火,各家互联网都在 AI 上造势,那 AI 是什么?
常见 AI主要的模型和形式是:

  1. LLM - Large Language Model(大语言模型)
  2. BOT - 机器人

目前新型出现的是:

  1. LAM - Large Action Models(大行动模型)
  2. Agent - 智能体

LAM 可以被认为是LLM的升级和衍生。
Agent 也可以被认为是BOT的衍生和升级版本。当然也有一些人也认为BOT和Agent就是一个东西。但在博主看来:Agent 比 BOT有更强的记忆能力和API工具使用。

下面我们一个一个简单了解一下。

LLM - Large Language Model(大语言模型)

LLM 是最目前最常见的 AI 的主体和形态,也称大型语言模型,是一种人工智能模型。
通过人类 和 AI 进行自然语言对话,智能理解人类自然语言并作出反应。
可以执行广泛的任务,包括文本总结、翻译、情感分析等等。
目前各手机厂家发布的 助手 使用的大多以LLM作为内部核心,是一种对话式的流程。
LLM现在已经发展的很厉害了,Chat GPT就是很好的例子。网上很多信息都完善了。

LLM发展路径LLM的发展路径

但 纯正的 LLM 仅能支持语音对话,无法做其他更多的事情,比如生图等其他生成式的能力。
那现在的 助手 里的生图或其他技能是怎么做到的呢?
那就是我们接下来所说的BOT

BOT(机器人)

BOT 这个形态在 AI 的形式和传统的BOT是有区别的。
传统的BOT 我们可以理解为:客服机器人这种,通过传统的产品形式去回答,交互。有一种呆呆的感觉。
而 AI 下的BOT是一种全新的形态。它是以 LLM 作为 BOT灵魂。
BOT的回答和能力是由LLM + 其他插件去完成的。
一个BOT主要包含:

  1. Prompt(提示词)
  2. 数据库 - 用户巩固这个LLM的人设和上下文信息
  3. 知识库 - 这个BOT垂类的知识
  4. 工作流 - 可以卸载PROMPT也可以额外处理,一般看平台
  5. 用户变量 - 用户可用于替换prompt的关键部分
  6. 技能或插件 - 这里的技能和prompt的工作能力不一样,这样更主要是插件的使用。

Prompt(提示词)主要包含:

  1. 机器人的人设 - 这就是给 LLM 大模型一个专项的角色
  2. 工作任务 - LLM需要进行怎样的专项知识
  3. 工作能力 - LLM需要怎样专项的技术和能力
  4. 工作流程 - LLM如何一步一步进行工作
  5. 注意事项 - 一些限制词
  6. 其他

快递查询助手BOT
这是一个BOT创建平台上的一个快递查询助手BOT的示例

在这个平台例子里,左边就是prompt。右边有用到快递查询的插件和必应搜索的插件。
另外我们还可以加入生图的模型加在插件上,那么这个BOT就有了生图的能力了。

插件功能

LAM - Large Action Models(大行动模型)

什么是LAM,可以简单理解是LLM的升级版本或者说是衍生,LLM是意图识别后的文本回复。,而LAM是意图识别后的行为执行。
举个例子:我需要AI帮我写一个 小红书 文本并发送
LLM能做到的是:写一个小红书 文本
而LAM能做到的是:打开小红书 - 点击笔记创建 - 生成一篇小红书 文本 - 然后点击发送。
这就是LLM和LAM最本质的区别。
区别

哎,大家有发现这个流程是不是很像:按键精灵。
没错工作流程上,很像一个配置好的按键精灵一步一步去执行任务。
但LAM高级在:他是以LLM为基底的。有理解人类自然语言的能力,所以他就有了一句话完成多个任务的活动。

当然你肯定发现了:现在很多车机的语言助手也能完成啊,一句话完成多个任务。
但不同的是:这些语音指令是人为预设好的,描述词没靠上的话就无法完成这个任务了。
而 LAM 只需要 这个应用的知识库,他就能帮你完成这个应用里的所有任务。这是 AI 自学习完成的。

LAM由一个值得注意的例子:Rabbit R1 和其的Rabbit OS,有兴趣的同学可以去看一下。这是LAM较为有参考和学习的例子。

Agent(智能体)

Agent 是目前 AI 发展的一个重要分支,网上可以找到很多AIPC、AIOS、AIXXX的,都会提到Agent这个概念。

Agent 是一种能够感知环境、进行决策和执行动作的智能实体。
它是AIOS里应用程序体现。我们可以将其类比成:Android OS里的APP程序。
它结合了(LLM + LAM + 记忆能力 + API或工具使用)
在这里插入图片描述
上文也讲到博主认为Agent 和 BOT 不同
主要是博主Agent 比 BOT 不同的地方 和强悍的点:

  1. 记忆能力 -
    记忆能力在于Agent有长期记忆的能力,能够长久记忆活动和上下文。这是BOT无法做到的,BOT只能完成单次对话的短时记忆,一般10轮对话后就会忘记前面的内容。

  2. 执行能力 -
    执行能力在于灵魂的不同,即LAM和LLM的不同。Agent的执行逻辑遵循着:P(感知)—> P(规划)—>A(行动)类似人类「做事情」的过程,Agent的核心功能,可以归纳为三个步骤的循环:感知(Perception)、规划(Planning)和行动(Action)。哪怕是对话式的 虚拟女友 这种,也有LAM的能力。

  3. 容器 -
    容器的不同在于:BOT的容器更倾向传统的GUI的开发,即还是有传统APP的方式进行开发,然后将AI 功能内嵌和调用。
    而Agent采用的是 AI 自我生成GUI、按钮逻辑和业务API逻辑调用等。

Agent 还有单Agent 、多代理Agent、多模态Agent等不同的Agent组合和内容。

目前Agent 被认为是AGI(智能机器人)的必经之路。这又是另一个高深的话题了,挖个坑先吧。
另外Agent 和 LLM 应用知识库和自动化执行 是一个更复杂的逻辑,我们后面开专门篇章再细说。

结尾

好了,以上就本篇内容的所有内容。
本文将的比较简略和简单,每一部分其实都可以继续深挖信息。
当然还有文生文、文生图、文生视频、图生图、图生视频其他类型的模型。
AI 是对我来说也是一个全新的知识领域,文中如果有不对的地方,希望各位大佬能提提,我继续学习。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1473965.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java 通过 microsoft graph 调用outlook

废话不多说 一 官方文档 先看一下官方文档,https://learn.microsoft.com/zh-cn/graph/tutorials/java?contextoutlook%2Fcontext&tabsaad&tutorial-step1 其中的代码,可以通过地址下载:https://developer.microsoft.com/en-us/gra…

基于uniapp框架的古汉语学习考试系统 微信小程序python+java+node.js+php

1、一般用户的功能及权限 所谓一般用户就是指还没有注册的过客,他们可以浏览主页面上的信息。但如果需要其它操作时,要登录注册,只有注册成功才有的权限。 2、管理员的功能及权限 用户信息的添加和管理,古汉语信息加和管理和学习视频添加和管…

下载 axios.js 文件到本地【linux】

方式一 npm install axios在$NODE_PATH/node_modules/axios/dist路径下即可找到axios.js。 方式二 1、百度搜索 GitHub 官网:https://github.com/ 2、搜索 axios 3、点击 axios/axios 4、下载到本地 5、解压,进入到 dist 文件夹** 参考&#x…

代码随想录算法训练营第四天

● 自己看到题目的第一想法 24.两两交换链表中的节点 方法:虚拟头节点 思路: 设置虚拟头节点dummyhead 设置临时指针cur dummyhead; cur每次向前移动两步 循环条件: cur ! nullptr && cur->next ! nullptr && cur->…

springBoot整合Redis(一、Jedis操作Redis)

在springboot环境下连接redis的方法有很多,首先最简单的就是直接通过jedis类来连接,jedis类就相当于是redis的客户端表示。 但是因为现在比较常用的是:StringRedisTemplate和RedisTemplate,所以jedis只做简单的介绍。 一、Jedis…

3D生成式AI模型与工具

当谈到技术炒作时,人工智能正在超越虚拟世界,吸引世界各地企业和消费者的注意力。 但人工智能可以进一步增强虚拟世界,至少在某种意义上:资产创造。 AI 有潜力扩大用于虚拟环境的 3D 资产的创建。 AI 3D生成使用人工智能生成3D模…

【pytorch】常用便捷代码

文章目录 条件与概率torch.tensor()torch.rand()torch.randn()torch.randint()torch.multinominal() 逻辑运算torch.argmax()torch.max()torch.sum()torch.tanh()torch.pow() 功能性操作 torch.nn.functionalF.normalize()F.elu()F.relu()F.softmax() 张量计算torch.zeros()tor…

CentOS7 Hive2.3.8安装

CentOS7 Hive2.3.8 安装 建议从头用我的博客,如果用外教的文件到 一、9)步骤了,就用他的弄完,数据库不一样,在9步骤前还能继续看我的 一、 安装MySQL 0.0)查询mariadb,有就去0.1),没有就不管…

kuka协作机器人LBR系列 issy15R930导入到ros2_rviz(带外观文件)

kuka协作机器人LBR系列 issy15R930导入到ros2_rviz(带外观文件)外观文件未调整好,外观仍需进一步研究,外观文件dae与轮廓(碰撞)文件STL并未完全对应起来。在blender里面看了一下UR机器人的文件,是对应的&am…

Springboot教程(二)——过滤器、拦截器

过滤器 过滤器可以在调用控制器方法之前进行一些操作,过滤器类一般放在filter包下。 配置类注册 使用过滤器时,要实现Filter接口,并重写doFilter方法: class TestFilter : Filter {override fun doFilter(request: ServletReq…

苹果发布iPhone 16:革命性创新重新定义智能手机体验

(苹果总部,加利福尼亚州,2024年2月23日)——今天,全球领先的科技公司苹果公司再次震撼世界,宣布推出iPhone 16,这款革命性的智能手机重新定义了人们对于手机的期望和体验。 iPhone 16的发布代表…

数字孪生的技术开发平台

数字孪生的开发平台可以基于各种软件和硬件工具来实现,这些平台提供了丰富的功能和工具,帮助开发人员构建、部署和管理数字孪生系统,根据具体的需求和技术要求,开发人员可以选择合适的平台进行开发工作。以下列举了一些常见的数字…

再探二分法

推荐阅读 智能化校园:深入探讨云端管理系统设计与实现(一) 智能化校园:深入探讨云端管理系统设计与实现(二) 文章目录 推荐阅读二分查找题目思路解法左闭右闭式写法左闭右开式写法 二分查找 题目 给定一个…

十六:网络编程

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 01、网络编程概述02、网络通信要素概述03、通信要素1:IP和端口号3.1、IP的理解与InetAddress类的实例化3.2、端口号的理解 04、通信要素2:网…

主从复制实现Redis集群

主从复制实现Redis集群实验 (一主二从): 实验环境: 使用Docker 搭建 Redis 版本 5.0.5 打开一个终端窗口,在其中运行如下命令创建一个名为redis-master的Redis容器。注意,它的端口是6379 (本地的端口:映射到容器的端口) docker run -itd--name redis-m…

【wails】(6):使用wails做桌面应用开发,使用gin+go-chatglm.cpp进行本地模型运行,在windows上运行成功

1,整体架构说明 主要使用,参考的开源项目是: https://github.com/wailsapp/wails 前端项目: https://github.com/Chanzhaoyu/chatgpt-web 运行模型: https://github.com/Weaxs/go-chatglm.cpp 参考代码: h…

【VSCode】SSH Remote 通过跳板机连开发机提示“bash行1 powershell未找到命令”

需求背景 因为需要,在家我需要挂上公司VPN然后SSH连到跳板机,然后再从跳板机SSH进开发机。 问题背景 跳板机进开发机输入完密码显示 bash行1 powershell未找到命令VSCode SSH Remote跳板机配置请自行搜素其他文章config配置 注意其中ssh.exe地址请根据…

消息中间件篇之RabbitMQ-延时队列

一、延时队列 延迟队列:进入队列的消息会被延迟消费的队列。 场景:超时订单、限时优惠、定时发布。 延迟队列死信交换机TTL(生存时间)。 二、死信交换机 当一个队列中的消息满足下列情况之一时,可以成为死信&#xf…

React Hooks概述及常用的React Hooks介绍

Hook可以让你在不编写class的情况下使用state以及其他React特性 useState ● useState就是一个Hook ● 通过在函数组件里调用它来给组件添加一些内部state,React会在重复渲染时保留这个state 纯函数组件没有状态,useState()用于设置和使用组件的状态属性。语法如下…

Yolov8有效涨点:YOLOv8-AM,添加多种注意力模块提高检测精度,含代码,超详细

前言 2023 年,Ultralytics 推出了最新版本的 YOLO 模型。注意力机制是提高模型性能最热门的方法之一。 本次介绍的是YOLOv8-AM,它将注意力机制融入到原始的YOLOv8架构中。具体来说,我们分别采用四个注意力模块:卷积块注意力模块…