标量/向量/矩阵/张量/范数详解及其在机器学习中的应用

news2025/5/13 5:11:38

标量(Scalar)、向量(Vector)、矩阵(Matrix)、张量(Tensor)与范数(Norm)详解及其在机器学习中的应用

1. 标量(Scalar)
  • 定义:标量是单个数字,仅具有大小(Magnitude),没有方向。

    • 数学表示:如 a = 5 a = 5 a=5, b = − 3.2 b = -3.2 b=3.2
    • 特点:零维数据(0D Tensor)。
  • 机器学习中的应用

    • 模型参数:如线性回归中的偏置项(Bias)。
    • 损失函数输出:如均方误差(MSE)的结果是一个标量。
    • 超参数:学习率(Learning Rate)、正则化系数(Regularization Coefficient)等。
2. 向量(Vector)
  • 定义:向量是一维数组,既有大小又有方向,表示空间中的点或变化量。

    • 数学表示:如 v = [ v 1 , v 2 , … , v n ] T \mathbf{v} = [v_1, v_2, \dots, v_n]^T v=[v1,v2,,vn]T
    • 特点:一维数据(1D Tensor),可看作标量的有序集合。
  • 机器学习中的应用

    • 特征向量(Feature Vector):数据样本的数值化表示(如图像的像素值、文本的词频统计)。
    • 嵌入(Embedding):将离散数据(如单词、类别)映射为低维向量(如Word2Vec、GloVe)。
    • 梯度(Gradient):优化算法中参数更新的方向(如随机梯度下降SGD)。
    • 输出结果:分类任务中概率分布的输出(如Softmax后的向量)。
3. 矩阵(Matrix)
  • 定义:矩阵是二维数组,由行和列组成,可表示线性变换或数据关系。

    • 数学表示:如 A = [ a 11 a 12 a 21 a 22 ] \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} A=[a11a21a12a22]
    • 特点:二维数据(2D Tensor),矩阵运算(乘法、逆、特征分解)是核心工具。
  • 机器学习中的应用

    • 数据集表示:每行代表样本,每列代表特征(如表格型数据)。
    • 权重矩阵(Weight Matrix):神经网络中层与层之间的连接参数。
    • 核方法(Kernel Methods):支持向量机(SVM)中通过核矩阵计算高维相似性。
    • 矩阵分解:推荐系统(协同过滤)中将用户-物品评分矩阵分解为低秩矩阵。
4. 张量(Tensor)
  • 定义:张量是向量和矩阵的高维推广,表示多维数组。

    • 数学表示:三维张量 T ∈ R n × m × k \mathcal{T} \in \mathbb{R}^{n \times m \times k} TRn×m×k
    • 特点:N维数据(ND Tensor),如图像(3D:高×宽×通道)、视频(4D:帧×高×宽×通道)。
  • 机器学习中的应用

    • 图像处理:RGB图像表示为三维张量(如 224 × 224 × 3 224 \times 224 \times 3 224×224×3
    • 深度学习输入/输出:卷积神经网络(CNN)中张量在层间流动(如特征图Feature Maps)。
    • 自然语言处理(NLP):词嵌入矩阵(如 句子长度 × 词向量维度 \text{句子长度} \times \text{词向量维度} 句子长度×词向量维度
    • 高阶关系建模:张量分解用于知识图谱(如TransE模型)。
5. 范数(Norm)
  • 定义:范数是向量或矩阵的“长度”度量,用于量化大小、距离或复杂度。

    • 常见类型
      • L0范数:非零元素个数(常用于稀疏性约束)。
      • L1范数:绝对值之和( ∣ ∣ x ∣ ∣ 1 = ∑ ∣ x i ∣ ||\mathbf{x}||_1 = \sum |x_i| ∣∣x1=xi,稀疏性正则化。
      • L2范数:欧几里得范数( ∣ ∣ x ∣ ∣ 2 = ∑ x i 2 ||\mathbf{x}||_2 = \sqrt{\sum x_i^2} ∣∣x2=xi2 ,防止过拟合。
      • L∞范数:最大绝对值( ∣ ∣ x ∣ ∣ ∞ = max ⁡ ∣ x i ∣ ||\mathbf{x}||_\infty = \max |x_i| ∣∣x=maxxi
      • Frobenius范数:矩阵版本的L2范数( ∣ ∣ A ∣ ∣ F = ∑ a i j 2 ||\mathbf{A}||_F = \sqrt{\sum a_{ij}^2} ∣∣AF=aij2
  • 机器学习中的应用

    • 正则化(Regularization)
      • L1正则化(Lasso):使模型参数稀疏化,选择重要特征。
      • L2正则化(Ridge):限制参数大小,防止过拟合。
    • 优化算法
      • 梯度裁剪(Gradient Clipping):用L2范数限制梯度爆炸。
      • 距离计算:K近邻(KNN)中的欧氏距离(L2)或曼哈顿距离(L1)。
    • 模型评估
      • 均方误差(MSE)等价于预测值与真实值差向量的L2范数平方。
    • 嵌入学习:对比学习(Contrastive Learning)中用余弦相似度(基于L2归一化)。
总结:机器学习中的核心角色
概念核心作用典型应用
标量参数、超参数、损失值学习率、损失函数输出
向量特征表示、梯度更新特征向量、嵌入向量
矩阵数据存储、线性变换权重矩阵、协方差矩阵
张量高维数据建模图像、视频、特征图
范数正则化、距离度量L1/L2正则化、KNN
扩展思考
  • 张量与深度学习框架:PyTorch/TensorFlow中所有数据均以张量形式处理,支持GPU加速。
  • 范数选择的影响:L1稀疏性适合特征选择,L2稳定性适合参数约束。
  • 高阶应用:张量网络(Tensor Networks)用于压缩模型或建模复杂关系。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2373597.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PySide6 GUI 学习笔记——常用类及控件使用方法(常用类边距QMarginsF)

文章目录 类简介方法总览关键说明示例代码 类简介 QMarginsF 用于定义四个浮点型边距(左、上、右、下),描述围绕矩形的边框尺寸。所有边距接近零时 isNull() 返回 True,支持运算符重载和数学运算。 方法总览 方法名/运算符参数返…

STM32实现九轴IMU的卡尔曼滤波

在嵌入式系统中,精确的姿态估计对于无人机、机器人和虚拟现实等应用至关重要。九轴惯性测量单元(IMU)通过三轴加速度计、陀螺仪和磁力计提供全面的运动数据。然而,这些传感器数据常伴随噪声和漂移,单独使用无法满足高精…

机器学习-简要与数据集加载

一.机器学习简要 1.1 概念 机器学习即计算机在数据中总结规律并预测未来结果,这一过程仿照人类的学习过程进行。 深度学习是机器学习中的重要算法的其中之一,是一种偏近现代的算法。 1.2 机器学习发展历史 从上世纪50年代的图灵测试提出、塞缪尔开发…

算法训练营第十三天|226.翻转二叉树、101. 对称二叉树、 104.二叉树的最大深度、111.二叉树的最小深度

递归 递归三部曲: 1.确定参数和返回值2.确定终止条件3.确定单层逻辑 226.翻转二叉树 题目 思路与解法 第一想法: 递归,对每个结点进行反转 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, le…

二叉树的遍历与构造

好想回家,我想回家跟馒头酱玩,想老爸老妈。如果上天再给我一次选择的机会,我会选择当一只小动物,或者当棵大树也好,或者我希望自己不要有那么多多余的情绪,不要太被别人影响,开心点,…

MYSQL服务的使用流程

MYSQL是一个单进程多线程,支持多用户,基于客户机/服务器的关系数据库管理系统。与其他数据库管理系统相比,MYSQL具有体积小,易于安装,运行速度快,功能齐全,成本低廉以及开源等特点。MYSQL可运行…

【java】使用iText实现pdf文件增加水印功能

maven依赖 <dependencies><dependency><groupId>com.itextpdf</groupId><artifactId>itext7-core</artifactId><version>7.2.5</version><type>pom</type></dependency> </dependencies>实现代码 前…

socket套接字-TCP

上一篇&#xff1a;socket套接字-UDP&#xff08;下&#xff09;https://blog.csdn.net/Small_entreprene/article/details/147569071?fromshareblogdetail&sharetypeblogdetail&sharerId147569071&sharereferPC&sharesourceSmall_entreprene&sharefromfr…

MiM: Mask in Mask Self-SupervisedPre-Training for 3D Medical Image Analysis

Abstract Vision Transformer在3D医学图像分析的自监督学习&#xff08;Self-Supervised Learning&#xff0c;SSL&#xff09;中展现了卓越的性能。掩码自编码器&#xff08;Masked Auto-Encoder&#xff0c;MAE&#xff09;用于特征预训练&#xff0c;可以进一步释放ViT在各…

【STM32 学习笔记】I2C通信协议

注&#xff1a;通信协议的设计背景 3:00~10:13 I2C 通讯协议(Inter&#xff0d;Integrated Circuit)是由Phiilps公司开发的&#xff0c;由于它引脚少&#xff0c;硬件实现简单&#xff0c;可扩展性强&#xff0c; 不需要USART、CAN等通讯协议的外部收发设备&#xff0c;现在被广…

深入理解卷积神经网络的输入层:数据的起点与预处理核心

内容摘要 本文围绕卷积神经网络输入层展开&#xff0c;详细介绍其在网络中的重要作用&#xff0c;包括接收不同领域数据的形式及传递数据的过程。深入解读数据预处理的关键操作&#xff0c;如去均值、归一化和PCA/白化。助力读者透彻理解输入层&#xff0c;为构建高效卷积神经…

redis bitmap数据类型调研

一、bitmap是什么&#xff1f; redis原文&#xff1a; Bitmaps are not an actual data type, but a set of bit-oriented operations defined on the String type . This means that bitmaps can be used with string commands, and most importantly with SET and GET. 翻…

LabVIEW 2019 与 NI VISA 20.0 安装及报错处理

在使用 Windows 11 操作系统的电脑上&#xff0c;同时安装了 LabVIEW 2019 32 位和 64 位版本的软件。此前安装的 NI VISA 2024 Q1 版&#xff0c;该版本与 LabVIEW 2019 32 位和 64 位不兼容&#xff0c;之后重新安装了 NI VISA 20.0。从说明书来看&#xff0c;NI VISA 20.0 …

探索 JWT(JSON Web Token):原理、结构与实践应用对比

目录 前言1. 什么是 JWT&#xff1f;2. JWT 的组成结构详解2.1 Header&#xff08;头部&#xff09;2.2 Payload&#xff08;负载&#xff09;2.3 Signature&#xff08;签名&#xff09; 3. JWT 的实际作用3.1 身份认证3.2 信息传递与授权 4. JWT 与 Cookie、API Key 的比较4.…

[docker基础一]docker简介

目录 一 消除恐惧 1) 什么是虚拟化&#xff0c;容器化 2)案例 3)为什么需要虚拟化&#xff0c;容器化 二 虚拟化实现方式 1)应用程序执行环境分层 2)虚拟化常见类别 3)常见虚拟化实现 一&#xff09;主机虚拟化(虚拟机)实现 二&#xff09;容器虚拟化实现 一 消除恐…

Texify - 数学公式OCR转换工具

文章目录 一、项目概览相关资源核心特性 二、安装指南三、使用示例1、命令行转换2、Python API调用3、交互式应用 四、性能基准运行你自己的基准测试 五、局限性 一、项目概览 Texify 是一个OCR模型&#xff0c;可将包含数学公式的图片或PDF转换为Markdown和LaTeX格式&#xf…

RISC-V CLINT、PLIC及芯来ECLIC中断机制分析 —— RISC-V中断机制(一)

在长期的嵌入式开发实践中&#xff0c;对中断机制的理解始终停留在表面层次&#xff0c;特别当开发者长期局限于纯软件抽象层面时&#xff0c;对中断机制的理解极易陷入"知其然而不知其所以然"的困境&#xff0c;这种认知的局限更为明显&#xff1b;随着工作需要不断…

开源与商业:图形化编程工具的博弈与共生

一、开源生态的破局之路&#xff1a;从技术实验到行业标准 在 2025 年全球开发者生态大会上&#xff0c;iVX 凭借 “全栈代码生成 AI 驱动开发” 的技术架构&#xff0c;被行业权威机构评选为 “年度技术创新典范”。作为 2012 年启动的开源项目&#xff0c;iVX 历经 17 年技…

(二)Linux下基本指令 2

【知识预告】 16. date 指令 17. cal 指令 18. find 指令 19. which指令 20. whereis 指令 21. alias 指令 22. grep 指令 23. zip/unzip 指令 24. tar 指令 25. bc 指令 26. uname ‒r 指令 27. 重要的⼏个热键 28. 关机 16 date 指令 指定格式显⽰时间&#xff1a;date %Y-…

无线网络设备中AP和AC是什么?有什么区别?

无线网络设备中AP和AC是什么&#xff1f;有什么区别&#xff1f; 一. 什么是AP&#xff1f;二. 什么是AC&#xff1f;三. AP与AC的关系 前言 肝文不易&#xff0c;点个免费的赞和关注&#xff0c;有错误的地方请指出&#xff0c;看个人主页有惊喜。 作者&#xff1a;神的孩子都…