机器学习第六讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列

news2025/5/13 16:45:09

机器学习第六讲:向量/矩阵 → 数据表格的数学表达,如Excel表格转数字阵列

资料取自《零基础学机器学习》。
查看总目录:学习大纲

关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南


一、生活化比喻:数据世界的乐高积木 🧱

比喻场景1
假设学校图书馆有三种数据记录方式:

单本书信息
向量→书架单层(1行数据)
整排书架
矩阵→整个书库(多行多列)
温度记录表
列向量→周气温走势(单列测量值)

二、Excel表格转化演示 💻(教材第六章经典案例2

例:3月电子产品销售表

产品销量单价(元)
手机1202999
耳机85599
充电宝200129

转化为矩阵表示

Excel表格
数字阵列
矩阵内容:
[[120, 2999],
[85, 599],
[200, 129]]

数学表示
M = [ 120 2999 85 599 200 129 ] M = \begin{bmatrix} 120 & 2999 \\ 85 & 599 \\ 200 & 129 \\ \end{bmatrix} M= 120852002999599129


三、核心运算规则解析 ⚡️

  1. 加法运算:要求同维度矩阵
矩阵 A:
[[1,2],
[3,4]]
矩阵 A + 矩阵 B = 矩阵 C:
[[6,8],
[10,12]]
矩阵 B:
[[5,6],
[7,8]]
  1. 标量乘法:数乘每个元素
# 如数据整体涨价10%
价格矩阵 = [[2999],[599],[129]]
新价格 = 1.1 * 价格矩阵  # [[3298.9],[658.9],[141.9]]
  1. 矩阵乘法:行乘列的奇妙规则3
2x3
3x1
总收入矩阵:2x1
产品矩阵
计算
价格矩阵
结果
展示

四、数据科学中的现实价值 📊

数据形态向量/矩阵形式应用场景
学生成绩单行向量班级平均分计算
医院化验报告列向量健康指标趋势分析
电商用户画像用户×商品矩阵推荐系统构建
城市交通流量时间×路口流量矩阵智能信号灯控制

五、图像处理的魔法揭秘 🖼️

原理
每个图片本质上都是像素值矩阵,例如:

原图
红蓝绿三通道矩阵
红色矩阵(数值0-255)
绿色矩阵
蓝色矩阵

代码示例(教材第六章代码片段4):

import numpy as np
# 创建100x100像素的红色方块矩阵 
red_block = np.ones((100,100)) * 255
green_block = np.zeros((100,100))
blue_block = np.zeros((100,100))

六、易犯错误警示牌 🚨(注意事项5

  1. 尺寸错误:试图相加3×2和2×3矩阵
3x2 + 2x3
错误加法
程序报错
  1. 空值污染:Excel中的N/A未处理直接运算
原始数据:[120, null, 200]
错误计算:sum = 120 + null + 200 → NaN
  1. 内存爆炸:处理100万×100万维度的超大型矩阵时需要先做数据分块

七、核心要义总结 💎

向量与矩阵是用数学语言精确描述多维数据的基础工具,如同建筑的砖瓦构成数据科学大厦(教材第六章核心结论1

(典型案例:Netflix用户-影片评分矩阵是推荐算法的关键输入数据🎬)

目录:总目录
上篇文章:机器学习第五讲:强化学习 → 电子宠物狗试错学习,做对给虚拟奖励
下篇文章:机器学习第七讲:概率统计 → 预测可能性,下雨概率70%就是典型应用



  1. 《零基础学机器学习》第六章第一节"数据矩阵表达",P.265 ↩︎ ↩︎

  2. 《零基础学机器学习》第六章案例6-2"零售数据转化",P.278-280 ↩︎

  3. 《零基础学机器学习》第六章运算规则推导,P.289-293 ↩︎

  4. 《零基础学机器学习》第六章代码附录,P.317 ↩︎

  5. 《零基础学机器学习》第六章注意事项,P.308 ↩︎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2374791.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[docker基础二]NameSpace隔离实战

目录 一 实战目的 二 基础知识 1)dd 命令详解 2)mkfs命令详解 3)df命令详解 4)mount 命令详解 5)unshare命令详解 三 实战操作一(PID隔离) 四 实战操作二(MOunt隔离) 1)创建 Mount 隔离进程 2)在新进程里边,创建空白文件&#…

Day22打卡-复习

复习日 仔细回顾一下之前21天的内容,没跟上进度的同学补一下进度。 作业: 自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码 泰坦尼克号人员生还预测https://www.kaggle.com/competitions/titanic/overview K…

uniapp + vue3 + 京东Nut动作面板组件:实现登录弹框组件(含代码、案例、小程序截图)

uniapp + vue3 + 京东Nut动作面板组件:实现登录弹框组件(含代码、案例、小程序截图) 代码示下,不再赘述。 动作面板组件:https://nutui-uniapp.netlify.app/components/feedback/actionsheet.html 项目背景 业务需求 描述: uniapp + vue3 + 京东Nut框架:实现登录弹框组…

C++类和对象--中阶

C类和对象中阶 01. 类的6个默认成员函数 在 C 中,类有 6 个特殊的默认成员函数(不是 6 个构造函数),它们会在特定情况下由编译器自动生成。包括构造函数,析构函数,拷贝构造和赋值运算符重载,取…

数据签名在区块链中的独特应用与挑战

随着信息技术的飞速发展,分布式系统因其高效、可靠、可扩展等显著优点,在众多领域得到了极为广泛的应用。分布式系统通过网络将多个独立的计算节点连接在一起,协同完成复杂的任务,这种架构使得系统具备了强大的容错能力和负载均衡…

数据可视化大屏——物流大数据服务平台(二)

代码分析: 物流大数据平台代码分析 这是一个基于 Bootstrap 和 ECharts 构建的物流大数据平台前端页面,设计采用了经典的三栏布局,主要展示河南省及全国的物流数据可视化内容。下面从多个维度进行分析: 1. 页面结构分析 整体采…

Maven 处理依赖冲突

Maven处理依赖冲突 什么是依赖冲突?如何解决?Maven自动处理依赖冲突的规则路径优先原则第一声明优先原则注意 子模块覆盖父模块父模块声明dependency子模块覆盖dependency父模块声明dependencyManagement 子模块覆盖dependency父模块声明dependencyManag…

5.12第四次作业

实验要求:完成上图内容,要求五台路由器的环回地址均可以相互访问 AR1 AR2 AR3 AR4 AR5 AS 200 ospf配置 AR2 AR3 AR4 BGP配置 AR1(AS100) AR2(AS200) AR4 AR5(AS300) 结果

【Lattice FPGA 开发】Diamond在线调试Reveal逻辑乱跳的解决

在Vivado中在always块中写逻辑时如果出现always块中的异步复位敏感词在块内部未使用的情况&#xff0c;如下例的rst&#xff1a; always (posedge clk or posedge rst) begin if(~tx_sense_flag)o_rd_adr < d1;else if((o_rd_adr d94) & (bit_cnt d7))o_rd_adr <…

Go语言——kratos微服务框架使用

文章目录 一、安装依赖二、创建项目三、初始化项目四、使用git_bash命令终端运行命令五、创建自己的项目1、修改app.proto3、internal/service/app.go4、修改internal/service/service.go文件5、创建internal/biz/content.go文件6、修改internal/biz/biz.go文件7、创建internal…

hiveserver2与beeline进行远程连接hive配置及遇到的问题

1、hiveserver2 参与用户模拟功能&#xff0c;因为开启后才能保证各用户之间的权限隔离。 1.1、配置 $HADOOP_HOME/etc/hadoop/core-site.xml <!--配置所有节点的root用户都可作为代理用户--> <property><name>hadoop.proxyuser.root.hosts</name>&…

Stable Diffusion进阶之Controlnet插件使用

前面已经对Stable Diffusion的文生图和图生图的操作界面做了详细的介绍&#xff0c;接下来会介绍Stable Diffusion的进阶部分Controlnet插件的使用。往期文章详见&#xff1a; 爆肝整理&#xff01;Stable Diffusion的完全使用手册&#xff08;一&#xff09;爆肝整理&#xff…

Multisim14使用教程详尽版--(2025最新版)

一、Multisim14前言 1.1、主流电路仿真软件 1. Multisim&#xff1a;NI开发的SPICE标准仿真工具&#xff0c;支持模拟/数字电路混合仿真&#xff0c;内置丰富的元件库和虚拟仪器&#xff08;示波器、频谱仪等&#xff09;&#xff0c;适合教学和竞赛设计。官网&#xff1a;艾…

使用Stable Diffusion(SD)中,步数(Steps)指的是什么?该如何使用?

Ⅰ定义&#xff1a; 在Stable Diffusion&#xff08;SD&#xff09;中&#xff0c;步数&#xff08;Steps&#xff09; 指的是采样过程中的迭代次数&#xff0c;也就是模型从纯噪声一步步“清晰化”图像的次数。你可以理解为模型在画这张图时“润色”的轮数。 Ⅱ步数的具体作…

【se-res模块学习】结合CIFAR-10分类任务学习

继CIFAR-10图像分类&#xff1a;【Res残差连接学习】结合CIFAR-10任务学习-CSDN博客 再优化 本次训练结果在测试集上的准确率表现可达到90%以上 1.训练模型&#xff08;MyModel.py&#xff09; import torch import torch.nn as nnclass SENet(nn.Module): # SE-Net模块def…

【C++设计模式之Template Method Pattern】

C设计模式之Template Method Pattern 模式定义核心思想动机(Motivation)结构&#xff08;Structure&#xff09;实现步骤应用场景要点总结 模式定义 模式定义&#xff1a; 定义一个操作中的算法的骨架(稳定)&#xff0c;而将一些步骤延迟(变化)到子类中。Template Method使得子…

英伟达Blackwell架构重构未来:AI算力革命背后的技术逻辑与产业变革

——从芯片暴力美学到分布式智能体网络&#xff0c;解析英伟达如何定义AI基础设施新范式 开篇&#xff1a;当算力成为“新石油”&#xff0c;英伟达的“炼油厂”如何升级&#xff1f; 2025年3月&#xff0c;英伟达GTC大会上&#xff0c;黄仁勋身披标志性皮衣&#xff0c;宣布了…

深度拆解!MES如何重构生产计划与排产调度全流程?

☂引言 在制造业数字化转型浪潮中&#xff0c;生产计划与排产调度的精准性直接决定企业竞争力。深蓝易网MES系统通过智能化调度与全流程管控&#xff0c;帮助企业破解排产难题&#xff0c;实现资源高效协同与生产透明化管理&#xff0c;为制造企业打造柔性化、敏捷化的生产体系…

信息系统项目管理师-软考高级(软考高项)​​​​​​​​​​​2025最新(十八)

个人笔记整理---仅供参考 第十八章项目绩效域 18.1干系人绩效域 18.2团队绩效域 18.3开发方法和生命周期绩效域 18.5项目工作绩效域 18.6交付绩效域 18.7度量绩效域 18.8不确定绩效域

UniDevTools - UniApp(前端app)调试工具使用

使用介绍 | UniDevTools 兼容框架&#xff1a; Vue2jsvuexVue3tsvuex(pinia)√√ 兼容平台&#xff1a; H5APP微信小程序APP-NVUE其他小程序UniAppX√√√√(大部分功能支持)未测试 (待办中) 下载安装 将下载好的源码解压至项目根目录&#xff0c;文件夹命名为 devTools …