机器学习第二十六讲:官方示例 → 跟着菜谱学做经典菜肴

news2025/5/25 6:40:36

机器学习第二十六讲:官方示例 → 跟着菜谱学做经典菜肴

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


以跟着菜谱学做经典菜肴为例的机器学习全流程🌶️

准备食材-数据集
清洗食材-数据预处理
配料加工-特征工程
选择炊具-算法模型
控温调味-参数调节
品鉴评分-模型评估
一、备菜阶段:数据预处理

食材加工四部曲

  1. 获取配方 → 构建数据集

    # 模拟菜品数据集(口味:酸甜苦辣/火候/口感评分)
    import pandas as pd
    ingredients = {
        '盐(克)': [3,5,2,4,1],
        '糖(克)': [10,8,15,5,12],
        '火候档位': [2,3,4,2,3],
        '耗时(分钟)': [25,30,20,40,35],
        '口味评分': [8,7,9,6,8]  # 目标标签
    }
    df = pd.DataFrame(ingredients)  # 构建特征矩阵 [^3-1]
    
  2. 挑拣次品 → 异常值过滤1

    # 过滤异常火候档位(正常范围1-5)
    df = df[(df['火候档位']>=1) & (df['火候档位']<=5)]
    
  3. 补充遗漏 → 缺失值填充2

    from sklearn.impute import SimpleImputer
    imputer = SimpleImputer(strategy='most_frequent')  # 用众数填充分类特征
    df_filled = imputer.fit_transform(df)
    
  4. 统一计量 → 特征规格化3

    from sklearn.preprocessing import MinMaxScaler
    scaler = MinMaxScaler()  # 将盐/糖单位换算成0-1范围
    scaled_data = scaler.fit_transform(df_filled)
    
二、烹饪阶段:模型训练

智能调控三步法

决策树/随机森林
火候/盐量
交叉验证
  1. 分割试吃组 → 数据集划分

    from sklearn.model_selection import train_test_split
    X = df.drop('口味评分', axis=1)
    y = df['口味评分']
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)  # 保留20%试菜[^8-2]
    
  2. 选定厨艺 → 初始化模型

    # 决策树(像菜谱的分步操作指南)
    from sklearn.tree import DecisionTreeRegressor
    chef = DecisionTreeRegressor(max_depth=3)  # 最多分3个步骤判断[^5-2]
    
  3. 自动调味 → 参数优化4

    from sklearn.model_selection import GridSearchCV
    param_grid = {
        'max_depth': [2,3,4],       # 菜谱步骤深度
        'min_samples_split': [2,3]  # 每次调味最小分量
    }
    grid_search = GridSearchCV(chef, param_grid, cv=5)  # 5轮盲测试吃[^8-2]
    grid_search.fit(X_train, y_train)
    
三、品鉴阶段:模型评估
40% 60% 味觉测评指标 口感误差 风味匹配度
  1. 口感检验 → 平均绝对误差

    from sklearn.metrics import mean_absolute_error
    pred_score = grid_search.predict(X_test)
    print(f"菜品口味误差:{mean_absolute_error(y_test, pred_score):.1f}分")[^8-1]
    
  2. 风味检测 → 决策树可视化

    from sklearn.tree import plot_tree
    best_model = grid_search.best_estimator_
    plt.figure(figsize=(15,10))
    plot_tree(best_model, feature_names=X.columns)  # 生成烹饪决策流程图[^5-2]
    
  3. 秘方破解 → 输出最佳参数

    print(f"最优步骤深度:{grid_search.best_params_['max_depth']}")
    print(f"最小调味分量:{grid_search.best_params_['min_samples_split']}")
    
四、厨艺提升策略

风味增强技巧

  1. 复合调料 → 特征组合[^4章]

    # 添加甜咸比特征
    df['甜咸比'] = df['糖(克)']/(df['盐(克)']+1)  # 防止除零
    
  2. 换锅实验 → 模型对比

    基础锅
    砂锅_决策树
    进阶锅
    高压锅_随机森林
    高阶锅
    分子料理机_XGBoost
  3. 火候控制 → 正则化调整5

    from sklearn.ensemble import RandomForestRegressor
    rf = RandomForestRegressor(n_estimators=100, max_depth=5)  # 控制翻炒次数
    

实验对比结果

烹饪方法平均误差稳定性操作复杂度
基础决策树0.75★★★☆★★
随机森林0.62★★★★★★★
梯度提升树0.58★★★★☆★★★★

目录:总目录
上篇文章:机器学习第二十五讲:TensorFlow → 乐高式搭建深度学习模型
下篇文章:机器学习第二十七讲:Kaggle → 参加机器学习界的奥林匹克



  1. 《零基础学机器学习》第三章第三节 异常值检测 ↩︎

  2. 《零基础学机器学习》第三章第一节 缺失值处理 ↩︎

  3. 《零基础学机器学习》第四章第二节 数据标准化 ↩︎

  4. 《零基础学机器学习》第八章第四节 网格搜索策略 ↩︎

  5. 《零基础学机器学习》第八章第五节 正则化应用 ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2385153.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

功能强大且易于使用的 JavaScript 音频库howler.js 和AI里如何同时文字跟音频构思想法

howler.js 是一个功能强大且易于使用的 JavaScript 音频库&#xff0c;它提供了跨浏览器的音频播放功能&#xff0c;支持多种音频格式&#xff0c;并且具有丰富的 API&#xff0c;可以方便地控制音频的播放、暂停、循环、音量等。下面是如何在 Vue 项目中使用 howler.js 实现音…

如何使用patch-package给npm包打补丁

一、背景 在移动应用开发中,轮播是一种很常见的效果,我们项目采用的是RN跨平台技术,RN的轮播我们直接使用的是第三方插件:react-native-snap-carousel。不过,当我们在项目中使用的时候却发现Android和iOS的表现不一致:https://stackoverflow.com/questions/60711611/rea…

maxkey单点登录系统

github地址 https://github.com/MaxKeyTop/MaxKey/blob/master/README_zh.md 1、官方镜像 https://hub.docker.com/u/maxkeytop 2、MaxKey:Docker快速部署 参考地址&#xff1a; Docker部署 | MaxKey单点登录认证系统 拉取docker脚本MaxKey: Dromara &#x1f5dd;️MaxK…

windows bat 在目录下(包括子目录)搜索批量指定文件名称复制到另一个文件夹内

windows bat 在目录下(包括子目录)搜索批量指定文件名称复制到另一个文件夹内 前言&#xff1a;最近遇到一个需求&#xff0c;我有15个文件夹(可能包含子文件夹) &#xff0c;目前我有一批文件名称&#xff0c;需要在这15个文件夹中查找出来&#xff0c;并拷贝到一个新的文件夹…

Notepad++ 下载与安装教程(小白专属)

文章目录 Notepad下载渠道的专业选择1. 官方网站下载&#xff08;海外用户或网络条件优越者首选&#xff09;2. 国内优化下载地址&#xff08;国内用户高效选择&#xff09; Notepad精细化安装流程解析总结与后续建议 在当前的开发与文本处理工作中&#xff0c;Notepad无疑是一…

Spring Cloud Gateway 微服务网关实战指南

上篇文章简单介绍了SpringCloud系列OpenFeign的基本用法以及Demo搭建&#xff08;Spring Cloud实战&#xff1a;OpenFeign远程调用与服务治理-CSDN博客&#xff09;&#xff0c;今天继续讲解下SpringCloud Gateway实战指南&#xff01;在分享之前继续回顾下本次SpringCloud的专…

微服务架构实战:Eureka服务注册发现与Ribbon负载均衡详解

微服务架构实战&#xff1a;Eureka服务注册发现与Ribbon负载均衡详解 一 . 服务调用出现的问题二 . EureKa 的作用三 . 服务注册3.1 搭建 EureKaServer① 创建项目 , 引入 spring-cloud-starter-netflix-eureka-server 的依赖② 编写启动类 , 添加 EnableEurekaServer 注解③ 添…

采用多维计算策略(分子动力学模拟+机器学习),显著提升 α-半乳糖苷酶热稳定性

字数 978&#xff0c;阅读大约需 5 分钟 在工业应用领域&#xff0c;α-半乳糖苷酶在食品加工、动物营养及医疗等方面发挥着重要作用。然而&#xff0c;微生物来源的该酶往往存在热稳定性不足的问题&#xff0c;限制了其在工业场景中的高效应用。近日&#xff0c;来自江南大学的…

【java】小练习--零钱通

文章目录 前言一、项目开发流程说明二、功能实现2.1 菜单2.2 零钱通明细2.3 零钱通收益2.4 零钱通消费2.5 零钱通退出确认2.6 零钱通金额校验2.7 完整代码 三、零钱通OOP版 前言 本文是我跟着B站韩顺平老师的 Java 教程学习时动手实现“零钱通”项目的学习笔记&#xff0c;主要…

Docker-mongodb

拉取 MongoDB 镜像: docker pull mongo 创建容器并设置用户&#xff1a; 要挂载本地数据目录&#xff0c;请替换此路径: /Users/Allen/Env/AllenDocker/mongodb/data/db docker run -d --name local-mongodb \-e MONGO_INITDB_ROOT_USERNAMEadmin \-e MONGO_INITDB_ROOT_PA…

Gartner《Optimize GenAI Strategy for 4 Key ConsumerMindsets》学习心得

一、引言 在当今数字化营销浪潮中,生成式人工智能(GenAI)正以前所未有的速度重塑着市场格局。GenAI 既是一场充满机遇的变革,也是一场潜在风险的挑战。一方面,绝大多数 B2C 营销领导者对 GenAI 赋能营销抱有极高期待,他们看到了 GenAI 在提升时间与成本效率方面的巨大潜…

达梦数据库-学习-22-库级物理备份恢复(超详细版)

目录 一、环境信息 二、说点什么 三、概念 1、备份恢复 2、重做日志 3、归档日志 4、LSN 5、检查点 四、语法 1、BACKUP DATABASE 2、DMRMAN RESTORE DATABASE 3、DMRMAN RECOVER DATABASE 4、DMRMAN UPDATE DB_MAGIC 五、实验 1、开归档 &#xff08;1&#xf…

python网络爬虫的基本使用

各位帅哥美女点点关注&#xff0c;有关注才有动力啊 网络爬虫 引言 我们平时都说Python爬虫&#xff0c;其实这里可能有个误解&#xff0c;爬虫并不是Python独有的&#xff0c;可以做爬虫的语言有很多例如&#xff1a;PHP、JAVA、C#、C、Python。 为什么Python的爬虫技术会…

AI Agent开发第74课-解构AI伪需求的魔幻现实主义

开篇 🚀在之前的系列中我们狂炫了AI Agent的各种高端操作(向量数据库联动、多模态感知、动态工作流等…),仿佛每个程序员都能用LLM魔法点石成金✨。 但今天咱们要泼一盆透心凉的冷水——当企业把AI当成万能胶水强行粘合所有需求时,连电风扇都能被玩出量子纠缠的魔幻现实…

【卫星通信】通信卫星链路预算计算及其在3GPP NTN中的应用

引言 卫星通信是现代信息传播的重要手段&#xff0c;广泛应用于电信、广播、气象监测、导航等领域。卫星链路预算计算是设计和优化卫星通信系统的重要步骤&#xff0c;它帮助工程师评估信号在传输过程中的衰减和增益&#xff0c;从而确保系统在预定条件下可靠地工作。 1. 链路…

c++命名空间的作用及命名改编

c命名空间的作用及命名改编 命名空间 namespace的作用&#xff1a; std::命名空间&#xff0c;命名空间&#xff08;namespace&#xff09;是 C 中用于解决标识符命名冲突问题的机制。在大型程序开发中&#xff0c;不同模块可能会使用相同名称的变量、函数或类等标识符&…

echarts实现项目进度甘特图

描述 echarts并无甘特图配置项&#xff0c;我们可以使用柱状图模拟&#xff0c;具体配置项如下&#xff0c;可以在echarts直接运行 var option {backgroundColor: "#fff",legend: {data: ["计划时间","实际时间"],align: "right",…

2025深圳国际无人机展深度解析:看点、厂商与创新亮点

2025深圳国际无人机展深度解析&#xff1a;看点、厂商与创新亮点 1.背景2.核心看点&#xff1a;技术突破与场景创新2.1 eVTOL&#xff08;飞行汽车&#xff09;的规模化展示2.2 智能无人机与无人值守平台2.3 新材料与核心零部件革新2.4 动态演示与赛事活动 3.头部无人机厂商4.核…

人形机器人通过观看视频学习人类动作的技术可行性与前景展望

摘要 本文深入探讨人形机器人通过观看视频学习人类动作这一技术路线的正确性与深远潜力。首先阐述该技术路线在模仿人类学习过程方面的优势&#xff0c;包括对人类动作、表情、发音及情感模仿的可行性与实现路径。接着从技术原理、大数据训练基础、与人类学习速度对比等角度论证…

第三十四天打卡

DAY 34 GPU训练及类的call方法 知识点回归&#xff1a; CPU性能的查看&#xff1a;看架构代际、核心数、线程数 GPU性能的查看&#xff1a;看显存、看级别、看架构代际 GPU训练的方法&#xff1a;数据和模型移动到GPU device上 类的call方法&#xff1a;为什么定义前向传播时可…