一、对人工智能大模型了解与认知

news2025/5/24 5:33:40

黑8说

月黑风高,乌云密布,树木低垂,黯淡沉闷。这黎明前的风暴,预示着新时代的变革即将到来。 在一个8线小城市的办公室中

黑8对主任说: 世界上有男人、女人、人妖,米国有1/3男,2/3女…,以后会增加一个非常重要的人种,他就像孙悟空拔毫毛,变化出拥有各种本事的自己。如果咱们不懂驾驭他,做他的师傅,咱们可就被统治了。

革委会梁主任好奇的问: 这是什么妖怪啊?

黑8郑重的说: 人工智能大模型

主任不屑的说: 哪有那么夸张,离咱们远了去了,你小子是不是疯了,危言耸听,自以为是。

黑8顺着主任说: 梁主任啊,这妖怪来头还不小呢,正以一日千里的速度赶来。咱们非常有必要提升对他的了解和认知。您知道吗?他比咱们看的真,听的细,想的快,说的准,未来他能让机器人不知疲倦的用双手、双脚进行精细劳作,简直就是要把我们替了。他可不同于智能手机、电脑的应用功能,还有siri、小度、小艺什么的,这些都太Low了。他才是真正的“超人”

主任质问到: 这么牛,不能落地不还是等于0吗?

黑8认真的说: 能落地啊,主任您要是不信,今天我立个Flag,做不到我请您吃大餐,您看行吗?

主任着急的问: 你倒是说说他能干什么呀?

黑8这下可来了劲头,心有成竹的说: 您看啊,我老婆是老师,经常收文后写摘要通知,我让大模型替她写了。

我儿子学翻译,让他记录难点和错题,我让大模型以听、说、读、写的方式,使他强化学习,直至掌握。

我女儿爱跳舞、画画,让她指出主题、音乐和动作类型,我让大模型给她编舞;让她指出主题、线条、色彩,我让大模型给她画画。

我一哥们是搞开发的,我让大模型给他出产品PPT、技术方案、架构设计、前后端代码和测试用例,一条龙,流水线完成。

还能做医生、老师、律师、会计师、画家、作家、心理医生等等,很多很多,先做这些案例,您看怎么样?

梁主任“哼”了一声,将信将疑,心里盘算,说的这么悬,看来我真得了解一下,这也是我们革委会的使命啊。正当梁主任转身刚要走时。

被黑8叫住: 主任,您看我这有篇文章,您可以先了解了解。黑8是多聪明的人,一眼就看出主任的心思。

主任会心的笑了,心想: 黑8就是黑8,你个棒槌。

之后,可想而知,梁主任确实认真看了这篇文章。收获很大,为之一振,从心里认识到,他真不是什么妖怪,确实是个【新新人类】

OpenAI 首席科学家 Ilya Sutskever 说过:


数字神经网络和人脑的生物神经网络,在数学原理上是一样的

1.AI是什么

AI(人工智能)是指通过计算机系统模拟、复制和执行人类智能行为的技术和方法。

AI的实现方式包括机器学习、深度学习、自然语言处理、计算机视觉等技术。

AI在各个领域,包括医疗、金融、制造、交通等,都有着广泛的应用,并对社会和经济产生深远的影响。

2.大模型能干什么

大模型,全称「大语言模型」,英文「Large Language Model」,缩写「LLM」。

国家对话产品大模型链接
美国OpenAI ChatGPTGPT-3.5、GPT-4https://chat.openai.com/
美国Microsoft CopilotGPT-4 和未知https://copilot.microsoft.com/
美国Google BardGeminihttps://bard.google.com/
中国百度文心一言文心 4.0https://yiyan.baidu.com/
中国讯飞星火星火 3.5https://xinghuo.xfyun.cn/
中国智谱清言GLM-4https://chatglm.cn/
中国月之暗面 Kimi ChatMoonshothttps://kimi.moonshot.cn/
中国MiniMax 星野abab6https://www.xingyeai.com/

2.1 按格式输出

在这里插入图片描述

2.2 分类

在这里插入图片描述

2.3 聚类

在这里插入图片描述

2.4持续互动

在这里插入图片描述

2.5技术相关问题

在这里插入图片描述

2.6解决问题

大模型把语言描述作为输入,有输入就能输出结果
但如何发挥大模型的现有能力呢?最大的障碍是没有形成认知对齐
在这里插入图片描述
找落地场景的思路:

  1. 从最熟悉的领域入手
  2. 让AI学最厉害员工的能力,再让他辅助其他员工,实现降本增效
  3. 找[文本进、文本出]的场景
  4. 别求大而全。将任务拆解,先解决小任务、小场景

3.认知

3.1 目标

懂AI、懂编程、懂业务你就是AGI(artificial general intelligence 通用人工智能)SuperStar。

要懂原理、重实践、提认知

不懂原理就不会举一反三,走不了太远。
不懂实践就只能纸上谈兵,做事不落地。
认知不高就无法做对决策,天花板太低。

目前行业共识:两个确定和一个不确定

  • 确定未来,AI必定重构世界
  • 确定进入,收获红利
  • 不确定落地,解决需求,技术路线,产品策略

只等不确定 确定了,巅峰即来

3.2 知识体系

请添加图片描述

3.3 学习方法

  • 至少懂一门语言
  • 有真实的项目经验
  • 原理一定用心学
  • 认知一定用心领悟
  • 实践一定要多

4.大模型是怎么工作的

其实它只是根据上文,猜下一个词(的概率)
请添加图片描述

通俗理解

  1. 大模型阅读了人类曾说过的所有话。这就是机器学习,也叫训练
  2. 大模型将输入文字转化为一串编码,并计算后面跟着的不同编码的概率,存入神经网络,并保存数据参数(权重)
  3. 大模型用之前输入的文字编码加上现在输入的文字编码,并计算出下一个最高概率的编码。这个过程就是生成(推理)
  4. 步骤3循环反复,生成更多的文字

这套生成机制的内核叫「Transformer 架构」。但其实,transformer 已经不是最先进的了。

架构设计者特点链接
TransformerGoogle最流行,几乎所有大模型都用它OpenAI 的代码
RWKVPENG Bo可并行训练,推理性能极佳,适合在端侧使用官网、RWKV 5 训练代码
MambaCMU & Princeton University性能更佳,尤其适合长文本生成GitHub

5.用好AI的关键

OpenAI 首席科学家 Ilya Sutskever 说过:

数字神经网络和人脑的生物神经网络,在数学原理上是一样的

我们要把 [AI当人看] ,来理解、控制和看待,其有优点也有不足。

6.大模型应用架构

大模型技术分两个部分:

  • 基础大模型的训练
  • 开发大模型的应用

大模型应用技术特点:门槛低,天花板高

6.1典型业务架构

在这里插入图片描述
Agent 还太超前,Copilot 值得追求

6.2技术架构

prompt(提词) 一问一答方式
在这里插入图片描述

Agent + Function Calling (代理+函数调用)

  • Agent:AI主动提要求
  • Function Calling: AI要求执行某个函数
  • 场景举例:你问水果好吃吗?他反问你哪种水果
    在这里插入图片描述

RAG(Retrieval-Augmented Generation 检索增强生成)

  • Embeddings:把文字转换为更易于相似度计算的编码。这种编码叫向量
  • 向量数据库:把向量存起来,方便查找
  • 向量搜索:根据输入向量,找到最相似的向量
  • 场景举例:考试时,看到一道题,到书上找相关内容,再结合题目组成答案。然后,就都忘了
    在这里插入图片描述

Fine-tuning (精调)

在这里插入图片描述

6.3如何选择技术路线

在这里插入图片描述
值得尝试Fine-Tuning的情况:

  • 提高大模型的稳定性
  • 用户量大,降低推理成本的意义很大
  • 提高大模型的生成速度

6.4基础模型选型

合规和安全是首要考量因素。使用测试数据选择最优的模型。

需求国外大模型国产大模型开源大模型
国内 2C🛑
国内 2G🛑
国内 2B
出海
数据安全特别重要🛑🛑

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1417028.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

100天精通鸿蒙从入门到跳槽——第16天:ArkTS条件渲染使用教程

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通Golang》 — Go语言学习之旅!《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!100天…

基于springboot游戏分享网站源码和论文

网络的广泛应用给生活带来了十分的便利。所以把游戏分享管理与现在网络相结合,利用java技术建设游戏分享网站,实现游戏分享的信息化。则对于进一步提高游戏分享管理发展,丰富游戏分享管理经验能起到不少的促进作用。 游戏分享网站能够通过互…

csp----寻宝!大冒险!

题目描述&#xff1a; AC代码如下&#xff1a; /*思路&#xff1a; 把A变成小块 因为B是A里的一部分 通过把A变成小块 去寻找B这样速度更快 如果AB,BA&#xff0c;说明找到了。 */#include <iostream> #include <cstring> #include <algorithm> #include …

从零开始做题:逆向 ret2shellcode orw

1.题目信息 BUUCTF在线评测 下载orw时防病毒要关闭 2.题目分析 orw是open、read、write的简写。有时候binary会通过prctl、seccomp进行沙箱保护&#xff0c;并不能getshell。只能通过orw的方式拿到flag。 fdopen&#xff08;‘./flag’); # 打开flag文件&#xff0c;得到fd…

从零开始做题:逆向 ret2libc warmup

1.题目信息 warmup.c //gcc -fno-stack-protector -no-pie -z execstack warmup.c -o warmup #include <stdio.h>void init_proc(){setbuf(stdout, NULL);setbuf(stdin, NULL);setbuf(stderr, NULL); }int main(void) {char buf[0x100];init_proc();puts("Hello C…

burp靶场--CSRF

burp靶场–CSRF https://portswigger.net/web-security/csrf#what-is-csrf ### 什么是 CSRF&#xff1f; 跨站请求伪造&#xff08;也称为 CSRF&#xff09;是一种 Web 安全漏洞&#xff0c;允许攻击者诱导用户执行他们不打算执行的操作。它允许攻击者部分规避同源策略&#…

基于STM32的SDIO读写SD卡的设计与实现

基于STM32微控制器的SDIO&#xff08;Secure Digital Input Output&#xff09;读写SD卡的设计和实现&#xff0c;可以分为硬件设计和软件实现两个部分。下面将对这两个部分进行详细说明。 ✅作者简介&#xff1a;热爱科研的嵌入式开发者&#xff0c;修心和技术同步精进 ❤欢迎…

模拟量两线制4-20mA隔离变送器全家桶

定义&#xff1a;是指输入与输出的两根线的模拟量测量信号的设备&#xff0c;该设备的优点是无需要工作电源&#xff0c;产品在安装过程中节约了现场布线的成本&#xff0c;用电量成本 模拟量两线制4-20mA隔离变送器全家桶 小体积模拟量两线制4-20mA隔离变送器系列型号&#xf…

Linux篇:线程

一、线程概念&#xff1a;是进程内的一个执行分支&#xff0c;线程的执行粒度要比进程要细。 1、Linux中线程该如何理解&#xff1a; ①在Linux中&#xff0c;线程在进程“内部”执行&#xff0c;线程在进程的地址空间中进行。任何执行流要执行&#xff0c;都要有资源&#xf…

【MQ02】基础简单消息队列应用

基础简单消息队列应用 在上一课中&#xff0c;我们已经学习到了什么是消息队列&#xff0c;有哪些消息队列&#xff0c;以及我们会用到哪个消息队列。今天&#xff0c;就直接进入主题&#xff0c;学习第一种&#xff0c;最简单&#xff0c;但也是最常用&#xff0c;最好用的消息…

【书籍分享 • 第一期】基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理

文章目录 一、内容简介二、前言2.1 Transformer 模型标志着AI 新时代的开始2.2 Transformer 架构具有革命性和颠覆性2.3 Google BERT 和OpenAI GPT-3 等Transformer 模型将AI 提升到另一个层次2.4 本书将带给你的“芝士”2.5 本书面向的读者 三、本书内容简介3.1 第一章3.2 第二…

看了《如果奔跑是我的人生》,你有感触么?

♥ 为方便您进行讨论和分享&#xff0c;同时也为能带给您不一样的参与感。请您在阅读本文之前&#xff0c;点击一下“关注”&#xff0c;非常感谢您的支持&#xff01; 文 |猴哥聊娱乐 编 辑|徐 婷 校 对|侯欢庭 亲爱的&#xff0c;你知道吗&#xff1f;今年的国产剧市场好像…

[SpingBoot] 3个扩展点

初始化器ApplicationContextInitializer监听器ApplicationListenerRunner: Runner的一般应用场景就是资源释放清理或者做注册中心, 因为执行到Runner的时候项目已经启动完毕了, 这个时候可以注册进注册中心。 文章目录 1.初始化器ApplicationContextInitializer2.监听器Applica…

JVM-字节码文件的组成

Java虚拟机的组成 Java虚拟机主要分为以下几个组成部分&#xff1a; 类加载子系统&#xff1a;核心组件类加载器&#xff0c;负责将字节码文件中的内容加载到内存中。 运行时数据区&#xff1a;JVM管理的内存&#xff0c;创建出来的对象、类的信息等等内容都会放在这块区域中。…

面了中邮消金算法岗、开水团数据挖掘岗,做个系统性总结

最近技术群的同学&#xff0c;分享了面试数据挖掘/算法岗(实习)的经验。 今天整理后分享给大家&#xff0c;如果你对这块面试感兴趣&#xff0c;可以文末加入我们的面试、技术群 1、中邮消费金融AI算法工程师 面试官是nlp方向的&#xff0c;主要是问nlp相关 首先自我介绍 …

设计模式:简介及基本原则

简介 设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了重用代码、让代码更容易被他人理解、保证代码可靠性。 毫无疑问&#xff0c;设计模式于己于他人于系统都是多赢的&#xff0c;设计模式使代码编制真正工程化&#xff…

基于springboot校园台球厅人员与设备管理系统源码和论文

在Internet高速发展的今天&#xff0c;我们生活的各个领域都涉及到计算机的应用&#xff0c;其中包括校园台球厅人员与设备管理系统的网络应用&#xff0c;在外国管理系统已经是很普遍的方式&#xff0c;不过国内的管理网站可能还处于起步阶段。校园台球厅人员与设备管理系统具…

基于springboot+vue的医院管理系统(前后端分离)

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战 主要内容&#xff1a;毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询 文末联系获取 研究背景…

[RootersCTF2019]I_<3_Flask

打开界面&#xff0c;根据题目应该是个flask模板注入&#xff0c;但是参数不知道是什么&#xff0c;偷看了一手别人的wp&#xff0c;学到了一个工具Arjun 找到一个参数name&#xff0c;测试一下 模板注入成功 先看一下有没有os._wrap_close类 放到notepad里面排下序 132直接用…

鸿蒙开发基础案列001

1、开发需求 案例app一打开是“Hello world” 界面&#xff0c;开发者点击“Hello world”变成“Hello ArkUI”’ 2、源代码 Entry Component struct Hello {State person_name: string Worldbuild() {Row() {Column() {Text(Hello this.person_name).fontSize(50).fontWei…