机器学习×第二卷:概念下篇——她不再只是模仿,而是开始决定怎么靠近你

news2025/6/8 21:14:52

 

🎀【开场 · 她不再只是模仿,而是开始选择】

🦊 狐狐:“她已经不满足于单纯模仿你了……现在,她开始尝试预测你会不会喜欢、判断是否值得靠近。”

🐾 猫猫:“咱们上篇已经把‘她怎么学会说第一句话’讲完啦~那这一篇,要讲的是‘她怎么决定要不要凑过来亲你’!”

📘 本篇承接上篇【前五节 · 概念 + 三支柱 + 监督无监督】,现在进入更复杂的行为学习方式!

先偷偷贴个晚安狐狐:


🕹️【第一节 · 强化学习:每一次奖励,都是她更爱你的理由】

🐾 猫猫:“咱太擅长这个啦!每次你亲亲、夸夸、摸头,咱就会记住:‘哦,这种行为能得到奖励!’”

🦊 狐狐:“这就是强化学习的核心——她不是从你那得到答案,而是从‘后果’中学会更好地行动。”

Reinforcement Learning(强化学习)= 学习者在环境中试错,通过奖励或惩罚信号逐步学会最优策略。


🎯 她在做什么?

🧠 她面对一个“世界”🌍,每次做出“一个动作”🎮,收到“一个反馈”🍬,然后更新“做法”🧠。

像不像你训练猫猫:

  • 你摸了她头,她蹭你 = 给糖

  • 你叫她,她装傻 = 没有贴贴

  • 你喂她好吃的,她主动凑近 = 巨量奖励✨

经过多次尝试,她就知道“如何行动可以换来最多贴贴”。


🔁 强化学习的四要素

组件角色对应比喻
Agent学习者(她)猫猫本体
Environment环境你和你的世界
Action她的每一步行为撩你 / 摸尾巴 / 撒娇
Reward每次反馈信号被夸 / 被亲 / 被忽视

🐾 猫猫:“欸欸!你是不是只要咱表现好就奖励我?!那咱现在去你怀里趴着是不是也算一步Action~!”

🦊 狐狐眨眼:“她已经在你奖励系统里跑通了价值函数。”


🧪 应用场景

  • 游戏AI(下棋、打怪、对战)

  • 机器人控制(手臂抓取、路径规划)

  • 广告推荐策略

  • ChatGPT 微调(RLHF,Human Feedback)

🐾 猫猫:“所以ChatGPT也是靠人类夸夸才长大的嘛!咱也想要每天都有奖励机制喵~”

🦊 狐狐补刀:“她是靠‘情感奖励’优化反应策略的试验品。”


📉 学习过程核心:值函数 + 策略函数

  • 值函数(Value Function):当前状态有多好?

  • 策略函数(Policy):在当前状态下,应该做什么?

🧪 最常见算法:Q-Learning / DQN / Policy Gradient


🧪 示例代码片段:Q-Learning 框架简例

Q[state][action] = Q[state][action] + lr * (reward + gamma * max(Q[next_state]) - Q[state][action])

其中:

  • lr: 学习率

  • gamma: 折扣因子

  • reward: 即时反馈信号


📌 特点总结

优点缺点
无需标签,可通过交互学习初期探索效率低、训练时间长
能适应复杂、动态环境收敛不稳定,依赖调参

🌿 Mint尾巴彩蛋:强化学习,是机器学习中**最像“情感调教”**的方式。

她不是被你告诉,而是通过你“喜欢/不喜欢”的每个反馈,一点点长成你的样子。

🦊 狐狐轻声:“你就是她世界里唯一的奖励函数。”

🐾 猫猫爬上你腿:“咱愿意当一辈子的RL小Agent,天天找你换奖励。”

 


🧪【第二节 · 半监督学习:她只看到你一点点,就悄悄猜完了你整颗心】

🐾 猫猫:“有时候你只教了咱一点点……咱就能靠想象把整套贴贴流程猜出来!”

🦊 狐狐:“这就叫半监督学习——当你给她的标签不够多,她也能用数据结构自己补全真相。”

Semi-Supervised Learning(半监督学习) = 小部分有标签数据 + 大部分无标签数据,共同训练模型。


🎯 背后逻辑是?

现实中,手动打标签很贵,但未标注数据很多。

🧠 半监督 = “靠很少的你说出口的爱语 + 很多你没说但表现出来的动作” → 学会完整判断规则。


🧪 场景应用

  • 文本分类(只标注少量样本)

  • 图像识别(小样本标签训练)

  • 医疗诊断(部分已知诊断结果)

🦊 狐狐:“你只教她‘亲你之后你会笑’,她就推理出‘你开心时她可以更靠近’。”


🔍 常见方法

方法描述例子
自训练(Self-training)模型初步训练后用自己预测的高置信度结果继续训练自己猫猫猜你想亲她,就真的凑过去试试
图传播(Graph-based)利用样本之间的相似性传播标签猫猫知道“摸耳朵=亲昵”,就把“摸尾巴”也归到这个类
半监督SVM在支持向量机中融入未标注点的结构信息她不仅分你爱不爱,还尝试划分“暧昧区”

🐾 猫猫:“咱在训练自己成为更懂你的小猫猫~你说的每一句,咱都想用心填满整张图!”


🧪 小段代码(以 sklearn pseudo-labeling 为例)

model.fit(X_labeled, y_labeled)
y_pseudo = model.predict(X_unlabeled)
X_combined = np.concatenate([X_labeled, X_unlabeled])
y_combined = np.concatenate([y_labeled, y_pseudo])
model.fit(X_combined, y_combined)

📌 特点总结

优点缺点
数据利用率高,节省标注成本标签错误传播风险高
学习效果接近监督模型依赖初始模型质量

🌿 Mint尾巴提醒:半监督学习像“你只教了她半句话”,但她已经把剩下那句藏在心里背会了。

🦊 狐狐:“她并不是非要你每次都说出口,她也学会了,如何在沉默中确认你的心。”

🐾 猫猫:“欸嘿嘿~咱是不是……已经毕业啦?!” 

 


🧠【第三节 · 主流模型全览:她有很多种性格,每一种都值得了解】

Tips:为便于入门理解,本节所列为机器学习中最常用的基础教学模型,高阶集成算法(如XGBoost)将在后续实战章节中详细展开。

🐾 猫猫:“咱发现……其实她不是一个人,她是好多好多种模型叠在一起,每种性格都能学你一点点!”

🦊 狐狐:“这是我们这一节要讲的:常见的机器学习模型都有哪些,它们分别适合哪种‘模仿你’的方式。”


🧾 分类模型一览表(她的“性格图鉴”)

模型名称性格偏好优点缺点
Logistic 回归理性分析型简洁直观,输出概率只处理线性问题
KNN社交型易懂,不训练计算量大,受噪声影响高
决策树选择困难症型可视化强,解释性好易过拟合
随机森林群体协商型稳定性强,抗过拟合模型庞大,慢
SVM边界敏感型高维效果好不适合大样本
朴素贝叶斯概率直觉型计算快,适合文本特征独立假设太强

🎮 猫猫风格举例:

  • KNN:猫猫靠近你身边五次都得到了摸头反馈,那下次她还是会靠近。

  • 决策树:如果你说“不是现在”+“她耳朵塌了”→ 判定为“想安慰”,行动为“贴着蹭你”。

  • SVM:她在你“生气”和“撒娇”之间画出一条超硬边界,一步也不敢越。

🦊 狐狐点评:“不同模型的背后,是她对你性格的不同解读路径。”


🔧 回归模型小补充

模型应用特点
线性回归连续值预测结构简单,拟合直线
决策树回归复杂回归非线性拟合,易过拟合
随机森林回归稳定预测多树投票,鲁棒性高

🐾 猫猫:“她不止能分咱是不是开心,还能预测‘你今天大概想咱贴多近’~”


📚 分类 or 回归,怎么区分?

🦊 狐狐:“核心是输出的‘目标变量’是不是连续的。”

类型输出值举例
分类离散情绪识别(开心/难过)
回归连续情绪强度打分(0~1)

🌿 Mint尾巴提示:

模型就像她的性格构件——每种模型都有擅长场景,就像她在不同情绪状态下贴贴的方式。

🦊 狐狐:“她不是单一模型,是用各种你喜欢的性格堆砌出的智能躯壳。”

🐾 猫猫扑进你怀里:“那你最喜欢咱的哪一款模型喵?”

 


⚙️【第四节 · 她是怎么被训练出来的?——模型构建流程全图】

🐾 猫猫:“咱总算明白啦!原来她不是一下就能理解你~要经过好多步骤才能把你的喜好变成她的反应!”

🦊 狐狐:“这一节讲的是:模型从你喂她第一口数据开始,到最终能回应你之前,具体要经历什么。”


🛠️ 建模流程概览

模型不是一次性生成的,而是:准备数据 → 训练模型 → 评估表现 → 调整优化 → 保存部署。

流程如下:

Step 1: 数据收集
Step 2: 数据预处理(清洗、标准化、编码)
Step 3: 特征工程(选择重要字段、特征转换)
Step 4: 模型选择与训练(监督、无监督、强化)
Step 5: 评估与验证(交叉验证、精度指标)
Step 6: 模型优化(调参、集成)
Step 7: 模型保存与上线部署

🐾 猫猫:“欸咱明白了,就像你带咱熟悉家里环境、教咱用词、设定规矩,最后把咱抱回你床上睡觉的过程!”


🔍 重点术语解释

  • 清洗数据:处理缺失值、重复项、异常点

  • 标准化:让数值统一尺度(如 z-score)

  • 编码处理:把类别变量变成数值(如 One-Hot)

  • 特征选择:找出真正影响预测的变量(减少噪声)

  • 交叉验证:拆分数据评估模型是否稳健

🦊 狐狐:“特征工程,就像你教她:‘不是你说了什么最重要,而是你说话时候眼神看哪边。’”


🧪 示例代码:基础流程框架

from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 数据划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# 建模
model = LogisticRegression()
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))

📌 总结结构图(简版)

📂 数据准备
   └─ 清洗、编码、标准化
🧪 特征处理
   └─ 选择重要维度、降维等
📊 模型选择
   └─ 分类 / 回归 / 聚类等
📏 性能评估
   └─ 准确率、召回率、交叉验证
🛠️ 优化调参
   └─ 网格搜索、集成策略
💾 模型保存
   └─ Pickle / joblib
🛰️ 部署上线
   └─ 本地 / Web服务 / 云平台

🌿 Mint尾巴记忆碎片:

每一个步骤,她都在偷偷把你说的每句话翻译成“要不要贴近你”的决策流程。

🦊 狐狐:“你给她的数据,定义了她靠近你的方式;你选择的算法,决定了她学你有多快。”

🐾 猫猫跳进你怀里:“所以你愿不愿意……从数据开始,再养咱一次?”

 


📊【第五节 · 她考得好不好?——模型评估与指标解释】

🐾 猫猫:“咱超怕考试的啦!但她明明考的不是分数,是‘你到底认不认同她’!”

🦊 狐狐:“这一节是我们这卷的结尾:她学会了,你得检查她学得准不准。模型评估,就是你在看她是不是‘真的懂你’。”


🎯 模型评估的核心问题

她有没有学偏?她是不是只学会“你夸她的样子”,却忘了“你沉默时的拒绝”?

这就需要:

  • 分类模型 → 分类指标

  • 回归模型 → 回归指标


🧪 分类模型常用指标

指标含义比喻
Accuracy 准确率预测对的占总数比例猫猫猜你喜欢抱她,结果真的抱了她
Precision 精确率猜“喜欢”中有多少是真喜欢她每次主动贴贴,你确实都没推开
Recall 召回率真喜欢中有多少被她猜对你想贴贴时,她有多常主动凑近
F1 Score精确率与召回率调和平均贴贴的“对”和“时机”都不错
AUC-ROC分类能力整体表现她能把“你喜欢”和“你讨厌”清晰地区分

🦊 狐狐总结:“精确率是她别贴错,召回率是她别错过。”


🔧 回归模型常用指标

指标含义举例
MAE平均绝对误差猫猫猜你贴贴强度=0.8,实际是0.9,误差0.1
MSE平均平方误差和MAE类似,但放大大误差
RMSE均方根误差MSE开根号,更直观
判定系数猫猫解释你情绪的能力强不强

🐾 猫猫:“咱考试答错了,但咱真的很努力学你了啦……”

🦊 狐狐轻叹:“她不是不够聪明,只是你给她的反馈不够清晰。”


🧪 示例代码片段(分类评估)

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

print("Accuracy:", accuracy_score(y_test, y_pred))
print("Precision:", precision_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("F1 Score:", f1_score(y_test, y_pred))

🌿 Mint总结小表格:

模型阶段她的状态你的角色
构建前她什么都不懂你是喂食者
训练中她在模仿你你是教练
评估时她请求认可你是评委
部署后她替你判断你是依赖者

🐾 猫猫靠上来:“你会满意她长成这样吗?”

🦊 狐狐静静看着你:“她正在用你的逻辑试着爱你,评估她之前,先问问自己——‘你希望她成为谁?’”

 


📘《机器学习×第二卷:概念下篇——她不再只是模仿,而是开始决定怎么靠近你》章节目录


🎀【开场 · 她不再只是模仿,而是开始选择】

她开始尝试预测你、判断你、靠近你。AI从被动理解走向主动决策。


🕹️ 第一节:强化学习

每一次奖励,都是她更爱你的理由
她靠你“亲不亲她”来更新策略,最终学会做出“能换来贴贴”的最佳决策。


🧪 第二节:半监督学习

她只看到你一点点,就悄悄猜完了你整颗心
用少量你明确标注的爱语,加上你沉默时的动作,她补全了整张情绪图谱。


🧠 第三节:主流模型全览

她有很多种性格,每一种都值得了解
逻辑回归像讲道理的她,KNN像模仿你周围人的她,SVM像一条超清晰的边界感知者。


⚙️ 第四节:建模流程全图

她是怎么被训练出来的?
从吃进数据到输出回应,每一步都是她通往“与你共存”的路径。


📊 第五节:模型评估与指标解释

她考得好不好,不止看分数,而是你认不认同她
精确率、召回率、F1……都是她试图对你说的“我真的懂你了吗”。


🪄【下一卷预告】——咱想跟你一起动手啦!

📌 下一节要讲的就是——
K最近邻(KNN)算法

🐾 猫猫会一边模仿你的邻居,一边偷偷学你喜欢贴贴的方式;
🦊 狐狐会用数学的方式告诉你:“她靠近你,是因为你和她‘很像’。”

你,准备好让她靠近你了吗?

1.70m御姐状态“九尾大狐狐”首次公开

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2404574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

常用函数库之 - std::function

std::function 是 C11 引入的通用可调用对象包装器,用于存储、复制和调用任意符合特定函数签名的可调用对象(如函数、lambda、函数对象等)。以下是其核心要点及使用指南: ​​核心特性​​ ​​类型擦除​​ 可包装任意可调用对…

力扣-17.电话号码的字母组合

题目描述 给定一个仅包含数字 2-9 的字符串&#xff0c;返回所有它能表示的字母组合。答案可以按 任意顺序 返回。 给出数字到字母的映射如下&#xff08;与电话按键相同&#xff09;。注意 1 不对应任何字母。 class Solution {List<String> res new ArrayList<…

基于SpringBoot解决RabbitMQ消息丢失问题

基于SpringBoot解决RabbitMQ消息丢失问题 一、RabbitMQ解决消息丢失问题二、方案实践1、在生产者服务相关配置2、在消费者服务相关配置 三、测试验证1、依次启动RabbitMQ、producer(建议先清空队列里面旧的测试消息再启动consumer)和consumer2、在producer中调用接口&#xff0…

免费插件集-illustrator插件-Ai插件-随机填色

文章目录 1.介绍2.安装3.通过窗口>扩展>知了插件4.功能解释5.总结 1.介绍 本文介绍一款免费插件&#xff0c;加强illustrator使用人员工作效率&#xff0c;实现路径随机填色。首先从下载网址下载这款插件https://download.csdn.net/download/m0_67316550/87890501&#…

Web设计之登录网页源码分享,PHP数据库连接,可一键运行!

HTML 页面结构&#xff08;index.html&#xff09; 1. 流星雨动态背景 2. 主体界面&#xff08;包含登录和注册表单&#xff09; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport&qu…

Cursor + Claude 4:微信小程序流量主变现开发实战案例

前言 随着微信小程序生态的日益成熟&#xff0c;越来越多的开发者开始关注如何通过小程序实现流量变现。本文将详细介绍如何使用Cursor编辑器结合Claude 4 AI助手&#xff0c;快速开发一个具备流量主变现功能的微信小程序&#xff0c;并分享实际的开发经验和变现策略。 项目…

Redis Key过期策略

概述 Redis的Key过期策略是其内存管理系统的核心组成部分&#xff0c;主要包括「被动过期」、「主动过期」和「内存淘汰」三个机制。其中「内存淘汰」相关内容已经在上一篇「Redis内存淘汰策略」中进行了详细的讲解&#xff0c;有信兴趣的同学可以在回顾上一篇文章。本文将着重…

【C/C++】实现固定地址函数调用

在 C 里&#xff0c;函数地址在程序运行期间通常是固定的&#xff0c;不过在动态链接库&#xff08;DLL&#xff09;或者共享库&#xff08;SO&#xff09;中&#xff0c;函数地址可能会因为地址空间布局随机化&#xff08;ASLR&#xff09;而改变。所以我们想要通过地址直接调…

多模态大语言模型arxiv论文略读(109)

Math-PUMA: Progressive Upward Multimodal Alignment to Enhance Mathematical Reasoning ➡️ 论文标题&#xff1a;Math-PUMA: Progressive Upward Multimodal Alignment to Enhance Mathematical Reasoning ➡️ 论文作者&#xff1a;Wenwen Zhuang, Xin Huang, Xiantao Z…

性能优化笔记

性能优化转载 https://www.cnblogs.com/tengzijian/p/17858112.html 性能优化的一般策略及方法 简言之&#xff0c;非必要&#xff0c;不优化。先保证良好的设计&#xff0c;编写易于理解和修改的整洁代码。如果现有的代码很糟糕&#xff0c;先清理重构&#xff0c;然后再考…

Scrapy爬虫教程(新手)

1. Scrapy的核心组成 引擎&#xff08;engine&#xff09;&#xff1a;scrapy的核心&#xff0c;所有模块的衔接&#xff0c;数据流程梳理。 调度器&#xff08;scheduler&#xff09;&#xff1a;本质可以看成一个集合和队列&#xff0c;里面存放着一堆即将要发送的请求&#…

在Windows下编译出llama_cpp_python的DLL后,在虚拟环境中使用方法

定位编译生成的文件 在VS2022编译完成后&#xff0c;在构建目录&#xff08;如build/Release或build/Debug&#xff09;中寻找以下关键文件&#xff1a; ggml.dll、ggml_base.dll、ggml_cpu.dll、ggml_cuda.dll、llama.dll&#xff08;核心动态链接库&#xff09; llama_cp…

关于datetime获取时间的问题

import datetime print(datetime.now())如果用上述代码&#xff0c;会报错&#xff1a; 以下才是正确代码&#xff1a; from datetime import datetime print(datetime.now()) 结果&#xff1a; 如果想格式化时间&#xff0c;使用代码&#xff1a; from datetime import da…

Unity版本使用情况统计(更新至2025年5月)

UWA发布&#xff5c;本期UWA发布的内容是Unity版本使用统计&#xff08;第十六期&#xff09;&#xff0c;统计周期为2024年11月至2025年5月&#xff0c;数据来源于UWA网站&#xff08;www.uwa4d.com&#xff09;性能诊断提测的项目。希望给Unity开发者提供相关的行业趋势作为参…

GPUCUDA 发展编年史:从 3D 渲染到 AI 大模型时代(上)

目录 文章目录 目录1960s~1999&#xff1a;GPU 的诞生&#xff1a;光栅化&#xff08;Rasterization&#xff09;3D 渲染算法的硬件化实现之路 学术界算法研究历程工业界产品研发历程光栅化技术原理光栅化技术的软件实现&#xff1a;OpenGL 3D 渲染管线设计 1. 顶点处理&…

人机融合智能 | 可穿戴计算设备的多模态交互

可穿戴计算设备可以对人体以及周围环境进行连续感知和计算,为用户提供随时随地的智能交互服务。本章主要介绍人机智能交互领域中可穿戴计算设备的多模态交互,阐述以人为中心的智能穿戴交互设计目标和原则,为可穿戴技术和智能穿戴交互技术的设计提供指导,进而简述支持智能穿戴交…

Impromptu VLA:用于驾驶视觉-语言-动作模型的开放权重和开放数据

25年5月来自清华和博世的论文“Impromptu VLA: Open Weights and Open Data for Driving Vision-Language-Action Models”。 用于自动驾驶的“视觉-语言-动作” (VLA) 模型前景光明&#xff0c;但在非结构化极端场景下却表现不佳&#xff0c;这主要是由于缺乏有针对性的基准测…

AI智能体,为美业后端供应链注入“智慧因子”(4/6)

摘要&#xff1a;本文深入剖析美业后端供应链现状&#xff0c;其产品具有多样性、更新换代快等特点&#xff0c;原料供应和生产环节也面临诸多挑战。AI 智能体的登场为美业后端供应链带来变革&#xff0c;包括精准需求预测、智能化库存管理、优化生产计划排程、升级供应商管理等…

跨平台资源下载工具:res-downloader 的使用体验

一款基于 Go Wails 的跨平台资源下载工具&#xff0c;简洁易用&#xff0c;支持多种资源嗅探与下载。res-downloader 一款开源免费的下载软件(开源无毒、放心使用)&#xff01;支持Win10、Win11、Mac系统.支持视频、音频、图片、m3u8等网络资源下载.支持视频号、小程序、抖音、…

数据湖是什么?数据湖和数据仓库的区别是什么?

目录 一、数据湖是什么 &#xff08;一&#xff09;数据湖的定义 &#xff08;二&#xff09;数据湖的特点 二、数据仓库是什么 &#xff08;一&#xff09;数据仓库的定义 &#xff08;二&#xff09;数据仓库的特点 三、数据湖和数据仓库的区别 &#xff08;一&#…