李宏毅LLM——生成式学习的两种策略

李宏毅LLM——生成式学习的两种策略

news2025/12/26 5:22:10

文章目录

生成式学习的两种策略：各个击破和一次到位
成为专才：
成为通才
- 神秘的 In-context Learning 能力
- Instruction Learning
- Chain of Thought Prompting

生成式学习的两种策略：各个击破和一次到位

对应视频的 P7-P11

生成有结构的复杂物件也是由小的结构组成
文句：token 中文：字；英文： word piece。原因：英文的词汇无穷多
影像：像素点
语音：采样

策略一：各个击破
在这里插入图片描述

策略二：一次到位
在这里插入图片描述
问题：怎么知道什么时候结束？
方法一：

速度：一次到位更快，所以用于影像生成。
生成质量：各个击破更好，所以用于文字生成

语音领域：两者结合
先各个击破，决定大方向。再一次到位

在这里插入图片描述
改进2：一次到位改成N次到位

new bing 实测：
new bing可以联网，何时进行搜寻由机器自己决定，具有随机性。但即使引用网页还是会幻想犯错。

其实使用搜索引擎时，也是文字接龙。
在搜索出来的结果后面做文字接龙
在这里插入图片描述

训练：记录人类老师的行为

Web GPT依然是预训练+微调的模式

在这里插入图片描述
Toolformer：不止会搜索，还会用其他工具

语言模型：GPT vs BERT
GPT是文字接龙，而BERT是文字填空

大模型读过很多资料，但他不知道应该做什么，需要有人来引导。

人类对大语言模型的两种期待
期待一：成为专才，解某一个特定任务，有机会在单一任务上赢过通才
期待二：成为通才，什么都会。需要人类下指令prompt

成为专才：

对预训练模型做改造
在这里插入图片描述

加外挂
BERT的天生劣势：文字填空无法生成完整的句子
因此需要加上额外的模组
只调整Adapter
微调参数 Finetune

成为通才

OpenAI对AI的期待比较高
在这里插入图片描述

神秘的 In-context Learning 能力

透过范例来学习
在这里插入图片描述
给错误范例，正确率并不会下降很多。但是给无关的句子会影响正确率。
原因：给栗子只是为了唤醒GPT需要做的任务

例子给多了作用也不大

越大的模型受到错误例子的影响越大。也就是说特别大的模型真的会从例子中学习
在这里插入图片描述
只是读一些例子，就可以做分类器

Instruction Learning

直接阅读题目，给出答案
需要Instruction-tuning来学习
在这里插入图片描述

期待在测试的时候可以完成别的任务
在这里插入图片描述

不同的描述方式做成数据集
在这里插入图片描述
测试时用没学过的指令

Chain of Thought Prompting

写出推论过程，能力起飞
在这里插入图片描述

变形：不给例子，只给一个Let‘s think step by step.
生成多个答案并投票出结果
在这里插入图片描述
测试：鸡鸭兔同笼问题

数学问题太难，拆解问题

用机器自动找prompt

用向量而不是文字
强化学习
LLM直接想出来prompt

机器自己想的Prompt效果优于人类提供的

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1439088.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

学习 Redis 基础数据结构，不讲虚的。

学习 Redis 基础数据结构，不讲虚的。

学习 Redis 基础数据结构，不讲虚的。一个群友给我发消息，“该学的都学了，怎么就找不到心意的工作，太难了”。很多在近期找过工作的同学一定都知道了，背诵八股文已经不是找工作的绝对王牌。企业最终要的是可以创造价…

阅读更多...

16：定时器和计数器

16：定时器和计数器

定时器和计数器 1、定时器和计数器的介绍2、定时器是如何工作3、寄存器4、51单片机定时器简介（数据手册）5、定时器中的寄存器（数据手册）5.1、TCON（定时器控制寄存器）5.2、TMOD（工作模式寄存器&a…

阅读更多...

嵌入式学习之Linux入门篇笔记——13，Linux第一个程序HelloWorld

嵌入式学习之Linux入门篇笔记——13，Linux第一个程序HelloWorld

配套视频学习链接：http://【【北京迅为】嵌入式学习之Linux入门篇】 https://www.bilibili.com/video/BV1M7411m7wT/?p4&share_sourcecopy_web&vd_sourcea0ef2c4953d33a9260910aaea45eaec8 1.什么是 gcc？ gcc 全称（gun compiler…

阅读更多...

【附代码】NumPy加速库NumExpr（大数据）

【附代码】NumPy加速库NumExpr（大数据）

文章目录相关文献测试电脑配置数组加减乘除数组乘方Pandas加减乘除总结作者：小猪快跑基础数学&计算数学，从事优化领域5年，主要研究方向：MIP求解器、整数规划、随机规划、智能优化算法如有错误，欢迎指正。如有…

阅读更多...

iPhone解锁 AnyMP4 iPhone Unlocker

iPhone解锁 AnyMP4 iPhone Unlocker

AnyMP4 iPhone Unlocker是一款功能强大的iPhone解锁软件，旨在帮助用户轻松解决iPhone密码忘记、设备锁定等问题。无论是屏幕密码、指纹解锁还是Face ID，该软件都能提供有效的解决方案。这款软件支持多种iPhone型号，包括最新的iPhone 14系列…

阅读更多...

JavaEE作业-实验三

JavaEE作业-实验三

目录 1 实验内容 2 实验要求 3 思路 4 核心代码 5 实验结果 1 实验内容简单的线上图书交易系统的web层 2 实验要求 ①采用SpringMVC框架，采用REST风格 ②要求具有如下功能：商品分类、订单、购物车、库存 ③独立完成，编写实验报告 …

阅读更多...

【Go】三、Go并发编程

【Go】三、Go并发编程

并发编程我们主流的并发编程思路一般有：多进程、多线程但这两种方式都需要操作系统介入，进入内核态，是十分大的时间开销由此而来，一个解决该需求的技术出现了：用户级线程，也叫做绿程、轻量级线程、协…

阅读更多...

Leetcode—42. 接雨水【困难】

Leetcode—42. 接雨水【困难】

2024每日刷题（112） Leetcode—42. 接雨水空间复杂度为O(n)的算法思想实现代码 class Solution { public:int trap(vector<int>& height) {int ans 0;int n height.size();vector<int> l(n);vector<int> r(n);for(int i 0; …

阅读更多...

《学成在线》微服务实战项目实操笔记系列（P1~P62）【上】

《学成在线》微服务实战项目实操笔记系列（P1~P62）【上】

《学成在线》项目实操笔记系列【上】，跟视频的每一P对应，全系列12万字，涵盖详细步骤与问题的解决方案。如果你操作到某一步卡壳，参考这篇，相信会带给你极大启发。同时也欢迎大家提问与讨论，我会尽力帮大家解…

阅读更多...

RK3568笔记十二：Zlmedia拉流显示测试

RK3568笔记十二：Zlmedia拉流显示测试

若该文为原创文章，转载请注明原文出处。 Zlmediakit功能很强大，测试一下拉流，在通过解码显示。一、环境 1、平台：rk3568 2、开发板:ATK-RK3568正点原子板子 3、环境：buildroot 测试的代码在GitHub - airockchip/…

阅读更多...

ubuntu20安装mongodb

ubuntu20安装mongodb

方法一：直接安装(命令是直接从mongo官网Install MongoDB Community Edition on Ubuntu — MongoDB Manual复制的） cat /etc/lsb-release sudo apt-get install -y gnupg curl curl -fsSL https://www.mongodb.org/static/pgp/server-7.0.asc | \sudo gp…

阅读更多...

VS Code中主程序C文件引用了另一个.h头文件，编译时报错找不到函数

VS Code中主程序C文件引用了另一个.h头文件，编译时报错找不到函数

目录一、问题描述二、问题原因三、解决方法四、扩展五、通过CMake进行配置一、问题描述 VS Code中主程序C文件引用了另一个.h头文件，编译时报错找不到函数主程序 main.c #include <stdio.h> #include "sumaa.h"int main(int, char**){printf(&q…

阅读更多...

秘塔科技推出AI搜索产品「秘塔AI搜索」

秘塔科技推出AI搜索产品「秘塔AI搜索」

近日，国内一家人工智能科技公司（秘塔科技）推出了一款AI搜索产品——秘塔AI搜索，能够大幅提升搜索效率，解决日常生活、工作学习等场景中遇到的各类搜索需求。秘塔AI搜索官网：https://metaso.cn/ 相较于传统…

阅读更多...

Java 学习和实践笔记（2）

Java 学习和实践笔记（2）

今天的学习进度： 注册并下载安装好了Java 8，之后进行以下配置。 1）path 是一个常见的环境变量，它告诉系统除了在当前的目标下妹寻找此程序外，还可以到path指定的目录下找。 2）Java Home 为以后其他的软…

阅读更多...

FastAdmin西陆房产系统(xiluHouse)全开源

FastAdmin西陆房产系统(xiluHouse)全开源

应用介绍一款基于FastAdminThinkPHPUniapp开发的西陆房产管理系统，支持小程序、H5、APP；包含房客、房东(高级授权)、经纪人(高级授权)三种身份。核心功能有：新盘销售、房屋租赁、地图找房、房源代理(高级授权)、在线签约(高级授权)、电子合同…

阅读更多...

MATLAB环境下用于提取冲击信号的几种解卷积方法

MATLAB环境下用于提取冲击信号的几种解卷积方法

卷积混合考虑了信号的时延，每一个单独源信号的时延信号都会和传递路径发生一次线性瞬时混合；解卷积的过程就是找一个合适的滤波器，进行反卷积运算，得到源信号的近似解。声音不可避免的会发生衍射、反射等现象，所以&…

阅读更多...

(注解配置AOP)学习Spring的第十七天

(注解配置AOP)学习Spring的第十七天

基于注解配置的AOP 来看注解式开发 : 先把目标与通知放到Spring里管理 : Service("userService") public class UserServiceImpl implements UserService {Overridepublic void show1() {System.out.println("show1......");}Overridepublic void show2…

阅读更多...

Elasticsearch：使用 LangChain 文档拆分器进行文档分块

Elasticsearch：使用 LangChain 文档拆分器进行文档分块

使用 Elasticsearch 嵌套密集向量支持这个交互式笔记本将： 将模型 “sentence-transformers__all-minilm-l6-v2” 从 Hugging Face 加载到 Elasticsearch ML Node 中使用 LangChain 分割器将段落分块成句子，并使用嵌套密集向量将它们索引到 Elasticse…

阅读更多...

【RL】Bellman Equation （贝尔曼等式）

【RL】Bellman Equation （贝尔曼等式）

Lecture2: Bellman Equation State value 考虑grid-world的单步过程： S t → A t R t 1 , S t 1 S_t \xrightarrow[]{A_t} R_{t 1}, S_{t 1} StAt Rt1,St1 t t t, t 1 t 1 t1：时间戳 S t S_t St：时间 t t t时所处的sta…

阅读更多...

基于蒙特卡洛的电力系统可靠性分析matlab仿真,对比EDNS和LOLP

基于蒙特卡洛的电力系统可靠性分析matlab仿真,对比EDNS和LOLP

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 1.课题概述电力系统可靠性是指电力系统按可接受的质量标准和所需数量不间断地向电力用户供应电力和电能量的能力的量度，包括充裕度和安全性两个方面。发电系统可靠性是指统一并网的全部发电机…

阅读更多...

推荐文章

最新文章