学习笔记(26):线性代数-张量的降维求和,简单示例

news2025/6/8 7:42:00

学习笔记(26):线性代数-张量的降维求和,简单示例

1.先理解 “轴(Axis)” 的含义

张量的 “轴” 可以理解为 维度的方向索引 。对于形状为 (2, 3, 4) 的张量,3 个轴的含义是:

  • 轴 0(axis=0):最外层维度,控制 “块” 的数量,长度为 2(即有 2 个 “子张量” 叠在这个维度上 )。
  • 轴 1(axis=1):中间维度,控制每个 “块” 里 “行” 的数量,长度为 3(每个子张量有 3 行 )。
  • 轴 2(axis=2):最内层维度,控制每行里 “列” 的数量,长度为 4(每行有 4 列 )。

可以类比成 “2 摞书,每摞有 3 页,每页有 4 个字”,3 个轴对应 “摞 → 页 → 字” 的层级。

2. 求和操作的本质:“压缩” 目标轴

求和(sum)的核心逻辑是 对目标轴上的所有元素做聚合(相加),这会让该轴的 “长度坍缩为 1”,最终在形状里直接 “去掉该轴” 。

本质上,“轴” 只是维度的索引,求和操作通过 压缩目标轴的长度 改变形状,这是张量维度操作的基础逻辑,也和 “广播(Broadcasting)”、“降维(Reduce)” 等操作的原理相通。

一、降维概念

沿轴求和属于降维操作,核心是通过 “压缩一个维度” 减少张量的维度数量或某一维度的长度,概念结合的角度解释:

1.1、从维度数量看降维

原始张量X3 维(形状(2, 3, 4) ),沿任意轴求和后:

  • 沿轴 0 求和,结果是2 维(形状(3, 4) )
  • 沿轴 1 求和,结果是2 维(形状(2, 4) )
  • 沿轴 2 求和,结果是2 维(形状(2, 3) )

直观体现:3 维→2 维,维度数量减少了 1,这是典型的降维(从更高维数变为更低维数 )。

1.2、从维度长度看 “局部降维”

即使维度数量没变(比如 4 维张量沿中间轴求和),某一维度的长度会 “坍缩”:
假设张量形状是(2, 3, 4, 5),沿轴 1 求和后:

  • 原轴 1 长度是 3,求和后该轴长度消失(形状变为(2, 4, 5) )
  • 整体维度数量从 4→3,也是降维;若从 “维度长度组合” 看,轴 1 的长度被压缩掉,相当于该维度的 “信息被聚合”,也属于降维的一种表现(压缩特定维度,减少数据在该维度的分布 )。

1.3、降维的本质:信息聚合

沿轴求和时,把该轴上多个元素的信息聚合为 1 个(通过相加),导致该轴 “失去独立存在的意义”:

  • 原始轴 0 有 2 个子张量(2 条独立信息 ),求和后合并成 1 组,这 2 条信息被聚合了→轴 0 被 “降维”
  • 可以类比:把多本 “书”(轴 0 的子张量 )的内容按页、按行相加,相当于 “减少了书的数量” 这个维度的独立性。

1.4、和其他降维操作的对比

除了sum,常见的降维操作还有:

  • mean(沿轴求平均 ):同样压缩轴,维度数量 / 长度减少
  • max/min(沿轴取最大 / 最小 ):也是聚合信息,降维
  • flatten(展平 ):直接把高维张量压成 1 维,是更极端的降维

sum的特殊点在于通过加法聚合信息,本质上和这些操作一样,都是让张量的维度变少 / 某维度长度缩短,所以属于降维。

简单说:只要操作后,张量的维度数量减少,或者某一维度的长度从N>1变成1(甚至消失 ),都属于降维,沿轴求和完美符合这个特征,所以是降维操作。

二、示例:一个具有形状(2,3,4)的张量,在轴0、1、2上的求和输出是什么形状?

2.1、代码示例

import torch

# 创建一个形状为 (2, 3, 4) 的张量,每个元素是 1 到 24 的整数
X = torch.arange(1, 25).reshape(2, 3, 4)
print("原始张量 X 的形状:", X.shape)
print("X 的内容:\n", X)

# 沿轴 0 求和(压缩轴 0)
sum_axis0 = X.sum(axis=0)
print("\n沿轴 0 求和后的形状:", sum_axis0.shape)
print("沿轴 0 求和后的结果:\n", sum_axis0)

# 沿轴 1 求和(压缩轴 1)
sum_axis1 = X.sum(axis=1)
print("\n沿轴 1 求和后的形状:", sum_axis1.shape)
print("沿轴 1 求和后的结果:\n", sum_axis1)

# 沿轴 2 求和(压缩轴 2)
sum_axis2 = X.sum(axis=2)
print("\n沿轴 2 求和后的形状:", sum_axis2.shape)
print("沿轴 2 求和后的结果:\n", sum_axis2)

2.2、输出结果与解释

2.2.1. 原始张量 X
原始张量 X 的形状: torch.Size([2, 3, 4])
X 的内容:
 tensor([[[ 1,  2,  3,  4],
         [ 5,  6,  7,  8],
         [ 9, 10, 11, 12]],

        [[13, 14, 15, 16],
         [17, 18, 19, 20],
         [21, 22, 23, 24]]])
  • 形状解读
    • 轴 0(长度 2):2 个 “子张量”(用外层中括号分隔)。
    • 轴 1(长度 3):每个子张量有 3 行。
    • 轴 2(长度 4):每行有 4 列。
2.2.2. 沿轴 0 求和(axis=0
沿轴 0 求和后的形状: torch.Size([3, 4])
沿轴 0 求和后的结果:
 tensor([[14, 16, 18, 20],
        [22, 24, 26, 28],
        [30, 32, 34, 36]])
  • 操作逻辑
    将轴 0 的 2 个子张量 对应位置相加(例如 X[0,0,0] + X[1,0,0] = 1+13=14)。
  • 形状变化
    轴 0(长度 2)被压缩,结果形状变为 (3, 4)
2.2.3. 沿轴 1 求和(axis=1
沿轴 1 求和后的形状: torch.Size([2, 4])
沿轴 1 求和后的结果:
 tensor([[15, 18, 21, 24],
        [51, 54, 57, 60]])
  • 操作逻辑
    对每个子张量的 3 行分别求和(例如第一行 [1,2,3,4] 与第二行 [5,6,7,8]、第三行 [9,10,11,12] 按列相加,得到 [15,18,21,24])。
  • 形状变化
    轴 1(长度 3)被压缩,结果形状变为 (2, 4)
2.2.4. 沿轴 2 求和(axis=2
沿轴 2 求和后的形状: torch.Size([2, 3])
沿轴 2 求和后的结果:
 tensor([[10, 26, 42],
        [58, 74, 90]])
  • 操作逻辑
    对每行的 4 个元素分别求和(例如 X[0,0] = [1,2,3,4] 求和得 10,X[0,1] = [5,6,7,8] 求和得 26)。
  • 形状变化
    轴 2(长度 4)被压缩,结果形状变为 (2, 3)

2.3、可视化理解

用表格形式更直观地展示求和过程:

2.3.1、原始张量 X
子张量 0:
┌───────┬───────┬───────┬───────┐
│ 1     │ 2     │ 3     │ 4     │
├───────┼───────┼───────┼───────┤
│ 5     │ 6     │ 7     │ 8     │
├───────┼───────┼───────┼───────┤
│ 9     │ 10    │ 11    │ 12    │
└───────┴───────┴───────┴───────┘

子张量 1:
┌───────┬───────┬───────┬───────┐
│ 13    │ 14    │ 15    │ 16    │
├───────┼───────┼───────┼───────┤
│ 17    │ 18    │ 19    │ 20    │
├───────┼───────┼───────┼───────┤
│ 21    │ 22    │ 23    │ 24    │
└───────┴───────┴───────┴───────┘
2.3.2、沿轴 0 求和(压缩子张量)
结果:
┌───────┬───────┬───────┬───────┐
│ 1+13  │ 2+14  │ 3+15  │ 4+16  │
├───────┼───────┼───────┼───────┤
│ 5+17  │ 6+18  │ 7+19  │ 8+20  │
├───────┼───────┼───────┼───────┤
│ 9+21  │ 10+22 │ 11+23 │ 12+24 │
└───────┴───────┴───────┴───────┘
2.3.3、沿轴 1 求和(压缩行)
子张量 0 结果:
┌───────────────────┐
│ 1+5+9 │ 2+6+10 │
├───────────────────┤
│ 3+7+11│ 4+8+12 │
└───────────────────┘

子张量 1 结果:
┌───────────────────┐
│ 13+17+21 │ 14+18+22 │
├───────────────────┤
│ 15+19+23 │ 16+20+24 │
└───────────────────┘
2.3.4、沿轴 2 求和(压缩列)
子张量 0 结果:
┌───────────┐
│ 1+2+3+4   │
├───────────┤
│ 5+6+7+8   │
├───────────┤
│ 9+10+11+12│
└───────────┘

子张量 1 结果:
┌──────────────┐
│ 13+14+15+16  │
├──────────────┤
│ 17+18+19+20  │
├──────────────┤
│ 21+22+23+24  │
└──────────────┘
  • 沿轴 k 求和:将该轴上的所有元素相加,导致该轴的长度 从 N 坍缩为 1,最终形状中 去掉轴 k

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2403886.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

以智能管理为基础,楼宇自控打造建筑碳中和新路径

在全球气候变化的严峻形势下,“碳中和”已成为各国发展的重要战略目标。建筑行业作为能源消耗与碳排放的“大户”,其运行阶段的能耗占全社会总能耗近40%,碳排放占比与之相当,实现建筑碳中和迫在眉睫。传统建筑管理模式下&#xff…

day029-Shell自动化编程-计算与while循环

文章目录 1. read 交互式初始化变量1.1 案例-安装不同的软件1.2 案例-比较大小 2. 计算2.1 bc2.2 awk2.3 expr2.4 let2.5 案例-计算内存的空闲率2.6 案例-检查域名过期时间和https整数过期时间 3. 循环3.1 循环控制语句3.2 for循环-c语言格式3.3 while循环3.3.1 案例-猜数字3.3…

Linux命令基础(2)

su和exit命令 可以通过su命令切换到root账户 语法:su [-] 用户名 -符号是可选的,表示是否在切换用户后加载环境变量,建议带上 参数:用户名,表示要切换的用户,用户名可以省略,省略表示切换到ro…

vue3 + vite实现动态路由,并进行vuex持久化设计

在后台管理系统中,如何根据后端返回的接口,来动态的设计路由呢,今天一片文章带你们解 1、在vuex中设置一个方法 拿到完整的路由数据 const state {routerList: []}; const mutations { dynameicMenu(state, payload) {// 第一步 通过glob…

学习路之php--性能优化

一、php周边优化 二、代码级优化 变量管理‌ 及时unset()释放大数组/对象,减少内存占用局部变量访问速度比全局变量快约2倍,优先使用局部变量大数组采用引用传递(&$var)避免内存 循环优化‌ 预计算循环次数: …

GC1808:高性能24位立体声音频ADC芯片解析

1. 芯片简介 GC1808 是一款24位立体声音频模数转换器(ADC),支持96kHz采样率,集成Δ-Σ调制器、数字抗混叠滤波器和高通滤波器,适用于家庭影院、蓝牙音箱等场景。 核心特性 高精度:24位分辨率,…

echarts使用graph、lines实现拓扑,可以拖动增加effect效果

options.js // import React from react // import * as echarts from echartsimport ./index.lessexport const useEchartsOptionFun ({ nodeDataList, getNodeLinksDataList, getLinesCoordsFun }) > {const option {title: {text: 拓扑关系图,top: top,left: center,}…

产品经理课程(九)

从需求到功能设计 (一)复习 产品规划:产品定位、阶段性计划 产品定位:产品画布(9个步骤;最重要的是先解决什么问题) (Roadmap)目标要素:时间、事项、里程碑…

从零开始开发纯血鸿蒙应用之网络检测

从零开始开发纯血鸿蒙应用 〇、前言一、认识 connection 模块1、获取默认网络2、获取网络能力信息3、解析网络能力信息3.1、NetCap3.2、NetBearType 二、实现网络检测功能1、申请权限2、获取默认网路的 NetCap 数组 三、总结 〇、前言 在之前的博文里,介绍了如何实…

向 AI Search 迈进,腾讯云 ES 自研 v-pack 向量增强插件揭秘

作者:来自腾讯云刘忠奇 2025 年 1 月,腾讯云 ES 团队上线了 Elasticsearch 8.16.1 AI 搜索增强版,此发布版本重点提升了向量搜索、混合搜索的能力,为 RAG 类的 AI Search 场景保驾护航。除了紧跟 ES 官方在向量搜索上的大幅优化动…

【win | docker开启远程配置】使用 SSH 隧道访问 Docker的前操作

在主机A pycharm如何连接远程主机B win docker? 需要win docker配置什么? 快捷配置-主机B win OpenSSH SSH Server https://blog.csdn.net/z164470/article/details/121683333 winR,打开命令行,输入net start sshd,启动SSH。 或者右击我的电脑&#…

股指期货波动一个点多少钱?

很多朋友在交易股指期货时,都会好奇一个问题:股指期货波动一个点,我的账户里到底是赚了还是亏了多少钱?要搞清楚这个问题,其实很简单,只需要了解两个关键信息:股指期货的“交易单位”&#xff0…

iOS、Android、鸿蒙、Web、桌面 多端开发框架Kotlin Multiplatform

Kotlin Multiplatform(简称 KMP)是 JetBrains 推出的开源跨平台开发框架 Kuikly 是腾讯开源的跨端开发框架,基于 Kotlin Multiplatform 技术构建,为开发者提供了技术栈更统一的跨端开发体验 KMP 不仅局限于移动端,它…

探索C++标准模板库(STL):String接口的底层实现(下篇)

前引:在C的面向对象编程中,对象模型是理解语言行为的核心。无论是类的成员函数如何访问数据,还是资源管理如何自动化,其底层机制均围绕两个关键概念展开:this指针与六大默认成员函数。它们如同对象的“隐形守护者”&am…

Flutter知识点汇总

Flutter架构解析 1. Flutter 是什么?它与其他移动开发框架有什么不同? Flutter 是 Google 开发的开源移动应用开发框架,可用于快速构建高性能、高保真的移动应用(iOS 和 Android),也支持 Web、桌面和嵌入式设备。。它与其他移动开发框架(如 React Native、Xamarin、原…

​线性注意力 vs. 传统注意力:效率与表达的博弈新解

​核心结论​:线性注意力用计算复杂度降维换取全局建模能力,通过核函数和结构优化补足表达缺陷 一、本质差异:两种注意力如何工作? ​特性​传统注意力(Softmax Attention)线性注意力(Linear At…

YOLO在QT中的完整训练、验证与部署方案

以下是YOLO在QT中的完整训练、验证与部署方案: 训练方案 准备数据集: 收集数据:收集与目标检测任务相关的图像数据集,可以是公开数据集如COCO、Pascal VOC,也可以是自定义数据集。标注数据:使用标注工具如…

增量式网络爬虫通用模板

之前做过一个项目,他要求是只爬取新产生的或者已经更新的页面,避免重复爬取未变化的页面,从而节省资源和时间。这里我需要设计一个增量式网络爬虫的通用模板。可以继承该类并重写部分方法以实现特定的解析和数据处理逻辑。这样可以更好的节约…

【JVM】三色标记法原理

在JVM中,三色标记法是GC过程中对象状态的判断依据,回收前给对象设置上不同的三种颜色,三色分为白色、灰色、黑色。根据颜色的不同,决定对象是否要被回收。 白色表示: 初始状态:所有对象未被 GC 访问。含义…

【uniapp开发】picker组件的使用

项目uniapp,结合fastadmin后端开发 picker组件的官方文档说明 https://en.uniapp.dcloud.io/component/picker.html#普通选择器 先看效果: 1、实现设备类型的筛选;2、实现设备状态的筛选; 前端代码(节选&#xff0…