计算机组成原理——cache

news2025/5/31 20:34:27

3.4cache

出自up主Beokayy传送门

1.局部性原理

  • 时间局部性
    • 在最近的未来要用到的信息,很可能是现在正在使用的信息,因为程序中存在循环。
  • 空间局部性
    • 在最近的未来要用到的信息,很可能与现在正在使用的信息在存储空间上是邻近的,因为指令通常是顺序存放、顺序执行的。
    • 数据也一般是以向量、数组形式簇聚地存储在一起的。
  • 时间局部性好,例如数组元素经常被反复访问,例如出现循环指令:
for(i = 0; i <= 9; i++){
    temp = 1;
    for(j = 0; j <= i; j++)
        temp *= a[j];
    sum += temp;
}
  • 空间局部性好,即访问顺序与存放顺序一致:

程序A

int func(int a[M][N]){
    int i, j, sum = 0;
    for(i = 0; i < M; i++)
        for(j = 0; j < N; j++)
            sum += a[i][j];
    return sum;
}

程序B

int func(int a[M][N]){
    int i, j, sum = 0;
    for(j = 0; j < N; j++)
        for(i = 0; i < M; i++)
            sum += a[i][j];
    return sum;
}
  • 若按行存储,则存储顺序为a[0][0], a[0][1], a[0][2]……
  • 程序A的访问顺序为a[0][0], a[0][1], a[0][2]……,程序B的访问顺序为a[0][0], a[1][0], a[2][0]……。故程序A的空间局部性好,程序B的空间局部性差。

2.cache的工作原理

cache的组成

组成
组成

  • 为便于cache和主存交换信息,cache和主存会被划分成大小相等的块,每块由若干字节组成。
  • 由于cache容量远小于主存容量,故cache中的块数远少于主存中的块数,仅保存主存中最活跃的若干块的副本。
  • CPU与cache之间的数据交换以字为单位,cache与主存之间的数据交换以cache块为单位。

cache的命中率

  • CPU与访问的信息已被放入cache中的比率即为cache的命中率。
  • 命中率H=Nc/(Nc+Nm)
    • cache的总命中次数为Nc
    • 访问主存的次数为Nm
  • cache - 主存系统的平均访问时间Ta=Htc+ (1-H) tm
    • cache命中率为H
    • 命中时访问cache的时间为tc
    • 未命中时的访问时间为tm

CPU在cache中的访问过程

CPU在cache中的访问过程

cache地址与主存地址的关系

cache地址与主存地址的关系

cache行的内容

cache行中存放的内容

  • 标记位
    • 和主存地址划分的标记位完全一样,作用是精准匹配cache行和其对应的主存块。
  • 有效位
    • 1bit,说明cache中存放的数据是否有效,有效位为1时表示cache行有效。
  • 脏位
    • 1bit,使用回写法时才有脏位,脏位为1时表示该cache行中的数据被修改过,替换时需要写回主存。
  • 替换算法控制位
    • 随机算法:0bit。
    • LRU/FIFO:log2(路数)bit。

3.cache和主存的映射方式

直接映射

  • 基本思想:把主存每一块映射到一个固定的cache行中。
  • 映射关系:cache行号=主存块号%cache行数。
  • 主存地址结构:
    主存地址结构
    • 主存块号被分解成标记字段和cache行号字段,块内地址的划分不变。
    • 假设cache共有 2 c 2^c 2c行,主存共有 2 m 2^m 2m块,主存块大小占 2 b 2^b 2b字节,按字节编址,则cache行号占c位,主存块号占m位,块内地址占b位,而标记字段占m - c位。
  • 只有标记位相同且有效位为1时,cache才命中。
  • cache不命中时,CPU会从主存读出该地址所在的主存块,并把信息送到直接映射对应的cache行中,将有效位置1,并将标记设置为地址中的高t位,同时将该地址中的内容送往CPU。

全相联映射

  • 基本思想:主存中的每一块可以装入cache中的任何位置,每一行的标记用于指出该行取自主存的哪一块
  • 主存地址结构:
    主存地址结构

组相联映射

  • 基本思想:将cache分为 Q Q Q个大小相同的组,每个主存块可装入固定组中的任意一行。每组有 r r r个cache行,则称为 r r r路组相联。
  • 映射关系:cache组号=主存块号%cache组数。
  • 主存地址结构:
    主存地址结构

4.cache的替换算法

近期最少使用算法LRU

  • 依据局部性原理,选择近期内长久未访问过的cache行作为替换的行

随机算法

  • 随机确定替换的cache块

先进先出算法FIFO

  • 选择最早调入的cache行进行替换

5.cache写策略

全写法+非写分配法

  • 全写法
    • cache写命中时,必须把数据同时写入cache和主存。
    • 当某一块需要替换时,不必把这一块写回主存,用新调入的块直接覆盖即可。
  • 非写分配法
    • cache写不命中时,只对主存中的块进行修改,而不调入cache。

回写法+写分配法

  • 回写法
    • cache写命中时,只把数据写入cache,而不立即写入主存,只有当该块被换出时才写回主存。
    • 为了避免不一致隐患,引入脏位(修改位)。若脏位为1,则说明对应cache行中的块被修改过,替换时需要写回主存;若脏位为0,则说明对应cache行中的块未被修改过,替换时无需写回主存。
  • 写分配法
    • cache写不命中时,将对应主存块调入cache中,再修改这个cache块

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2391752.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

EasyExcel使用导出模版后设置 CellStyle失效问题解决

EasyExcel使用导出模版后在CellWriteHandler的afterCellDispose方法设置 CellStyle失效问题解决方法 问题描述&#xff1a;excel 模版塞入数据后&#xff0c;需要设置单元格的个性化设置时失效&#xff0c;本文以设置数据格式为例&#xff08;设置列的数据展示时需要加上千分位…

Knife4j框架的使用

文章目录 引入依赖配置Knife4j使用Knife4j 访问 SpringBoot 生成的文档 Knife4j 是基于 Swagger 的增强工具&#xff0c;对 Swagger 进行了拓展和优化&#xff0c;从而有更美观的界面设计和更强的功能 引入依赖 Spring Boot 2.7.18 版本 <dependency> <groupId>c…

深兰科技陈海波率队考察南京,加速AI医诊大模型区域落地应用

近日&#xff0c;深兰科技创始人、董事长陈海波受邀率队赴南京市&#xff0c;先后考察了南京江宁滨江经济开发区与鼓楼区&#xff0c;就推进深兰AI医诊大模型在南京的落地应用&#xff0c;与当地政府及相关部门进行了深入交流与合作探讨。 此次考察聚焦于深兰科技自主研发的AI医…

【芯片设计中的交通网络革命:Crossbar与NoC架构的博弈C架构的博弈】

在芯片设计领域&#xff0c;总线架构如同城市交通网&#xff0c;决定了数据流的通行效率。随着AI芯片、车载芯片等复杂场景的爆发式增长&#xff0c;传统总线架构正面临前所未有的挑战。本文将深入解析两大主流互连架构——Crossbar与NoC的优劣&#xff0c;揭示芯片"交通网…

deepseek告诉您http与https有何区别?

有用户经常问什么是Http , 什么是Https &#xff1f; 两者有什么区别&#xff0c;下面为大家介绍一下两者的区别 一、什么是HTTP HTTP是一种无状态的应用层协议&#xff0c;用于在客户端浏览器和服务器之间传输网页信息&#xff0c;默认使用80端口 二、HTTP协议的特点 HTTP协议…

mac将自己网络暴露到公网

安装服务 brew tap probezy/core && brew install cpolar// 安装cpolar sudo cpolar service install // 启动服务 sudo cpolar service start访问管理网站 http://127.0.0.1:9200/#/tunnels/list 菜单“隧道列表” 》 编辑 自定义暴露的端口 再到在线列表中查看公网…

拓扑排序算法剖析与py/cpp/Java语言实现

拓扑排序算法深度剖析与py/cpp/Java语言实现 一、拓扑排序算法的基本概念1.1 有向无环图&#xff08;DAG&#xff09;1.2 拓扑排序的定义1.3 拓扑排序的性质 二、拓扑排序算法的原理与流程2.1 核心原理2.2 算法流程 三、拓扑排序算法的代码实现3.1 Python实现3.2 C实现3.3 Java…

罗马-华为

SPA应用:single-page application:单页应用SPA是一种网络应用程序或网站的模型,它通过动态重写当前页面来与用户交互,这种方法避免了页面之间切换打断用户体验在单页应用中 集成 ROMA Connect 主要包含四个组件:数据集成( FDI )、服务集成( APIC )、消息集成 ( MQS …

切片器导航-大量报告页查看的更好方式

切片器导航-大量报告页查看的更好方式 现在很多报告使用的是按钮导航&#xff0c;即使用书签按钮来制作页面导航的方式。但是当我们的报告有几十页甚至上百页的时候&#xff0c;使用书签按钮来制作页面导航&#xff0c;无论是对于报表制作者还是报告使用者来说都是一种很繁琐的…

ubuntu 22.04安装k8s高可用集群

文章目录 1.环境准备&#xff08;所有节点&#xff09;1.1 关闭无用服务1.2 环境和网络1.3 apt源1.4 系统优化1.5 安装nfs客户端 2. 装containerd&#xff08;所有节点&#xff09;3. master的高可用方案&#xff08;master上操作&#xff09;3.1 安装以及配置haproxy&#xff…

使用java实现word转pdf,html以及rtf转word,pdf,html

word,rtf的转换有以下方案&#xff0c;想要免费最靠谱的是LibreOffice方案, LibreOffice 是一款 免费、开源、跨平台 的办公软件套件&#xff0c;旨在为用户提供高效、全面的办公工具&#xff0c;适用于个人、企业和教育机构。它支持多种操作系统&#xff08;Windows、macOS、…

使用LSTM进行时间序列分析

LSTM&#xff08;长短期记忆网络&#xff0c;Long Short-Term Memory&#xff09;是一种特殊的循环神经网络&#xff08;RNN&#xff09;&#xff0c;专门用于处理时间序列数据。由于其独特的结构设计&#xff0c;LSTM能够有效地捕捉时间序列中的长期依赖关系&#xff0c;这使得…

【密码学——基础理论与应用】李子臣编著 第十三章 数字签名 课后习题

题目 逐题解析 13.1 知道p83,q41,h2,g4,x57,y77。 我看到答案&#xff0c;“消息M56”的意思居然是杂凑值&#xff0c;也就是传统公式的H(M)。 选择k23&#xff0c;那么r(g^k mod p) mod q 51 mod 4110,sk(H(M)xr) mod q29 ws mod q17,u1(mw) mod q9&#xff0c;u2(rw) m…

k8s中kubeSphere的安装使用+阿里云私有镜像仓库配置完整步骤

一、实验目的 1、掌握kubeSphere 的安装部署 2、掌握kubesphere 使用外部镜像仓库&#xff1b; 2、熟悉图像化部署任务&#xff1a;产生pod---定义服务--验证访问 本次实验旨在通过 KubeSphere 平台部署基于自定义镜像&#xff08;nginx:1.26.0 &#xff09;的有状态副本集…

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible

arcgis js 4.x 的geometryEngine计算距离、面积、缓冲区等报错、失败

在arcgis js 4.x版本中geometryEngine.geodesicArea计算面积时&#xff0c;有时会失败&#xff0c;失败的主要原因是&#xff0c;当前底图的坐标系不是WGS84大地坐标系&#xff08;代号4326&#xff09;或者web墨卡托投影&#xff08;代号102113, 102100, 3857这三种之一&#…

SpringAI 大模型应用开发篇-纯 Prompt 开发(舔狗模拟器)、Function Calling(智能客服)、RAG (知识库 ChatPDF)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 大模型应用开发技术框架 2.0 纯 Prompt 模式 2.1 核心策略 2.2 减少模型"幻觉"的技巧 2.3 提示词攻击防范 2.4 纯 Prompt 大模型开发(舔狗模拟器) 3.0 Function Calling 模式 3.1 …

Unsupervised Learning-Word Embedding

传统的1 of N 的encoding无法让意义相近的词汇产生联系,word class可以将相近的词汇放到一起 但是word class不能表示class间的关系,所以引入了word embedding(词嵌入) 我们生成词向量是一种无监督的过程(没有label 自编码器是一种人工神经网络&#xff0c;主要用于无监督学习…

远控安全进阶之战:TeamViewer/ToDesk/向日葵设备安全策略对比

【作者主页】Francek Chen 【文章摘要】在数字化时代&#xff0c;卓越的远程控制软件需兼顾功能与体验&#xff0c;包括流畅连接、高清画质、低门槛UI设计、毫秒级延迟及多功能性&#xff0c;同时要有独树一帜的远控安全技术&#xff0c;通过前瞻性安全策略阻挡网络风险&#x…

变量的计算

不同类型变量之间的计算 数字型变量可以直接计算 在python中&#xff0c;数字型变量可以直接通过算术运算符计算bool型变量&#xff1a;True 对应数字1 &#xff1b;False 对应数字0、 字符串变量 使用 拼接字符串 使用 * 拼接指定倍数的相同字符串 变量的输入&#xff1a;&…