1.2指令系统-存储系统-cache

news2026/3/19 9:43:38
一、指令系统 00:021. 计算机指令的组成 00:03基本结构由操作码和操作数两部分组成以二进制编码形式存放在存储器中操作码决定要完成的操作如加法、减法用二进制数码表示操作数包含参加运算的数据及其所在单元地址分为地址码和数据两部分存储形式整条指令以二进制形式存储操作要求和操作数地址都使用二进制表示2. 计算机指令执行过程 01:42三阶段流程取指令从程序计数器PC取出指令地址→送入地址总线→CPU从内存取出指令存入指令寄存器R\mathrm{R}R分析指令指令译码器分析操作码执行指令取出源操作数执行操作关键部件程序计数器PC始终跟踪下一条指令地址3. 指令寻址方式 02:21顺序寻址特点指令按顺序执行地址由PC自动递增实现PC1→PC形成下条指令地址跳跃寻址特点下条指令地址由当前指令直接给出如跳转指令实现修改PC内容跟踪新指令地址典型应用汇编语言中的跳转指令如b指令4. 指令操作数的寻址方式 03:51立即寻址特点地址码字段直接存储操作数本身如53中的5和3优势无需访问主存执行速度快直接寻址特点地址码字段直接给出操作数在主存中的地址访问次数需1次主存访问间接寻址特点地址码指向的存储单元存储的是操作数的地址访问次数需2次主存访问先取地址再取数据寄存器寻址特点地址码是寄存器编号如r0、r1操作数存储在寄存器中基址/变址寻址计算方式基址/变址寄存器内容形式地址有效地址区别基址寄存器存放基地址变址寄存器存放偏移量5. 指令系统类型 06:521CISC 07:32全称Complex Instruction Set Computer复杂指令集核心特征指令特点数量多数百条、使用频率差异大、长度可变实现方式微程序控制技术微码典型表现指令格式和寻址方式多样研制周期长寄存器使用寄存器数量较少2RISC 07:47全称Reduced Instruction Set Computer精简指令集核心特征指令特点数量少约100条、使用频率接近、定长格式执行特点大部分为单周期指令仅Load/Store操作内存实现方式硬布线逻辑控制为主增加通用寄存器优化技术适合采用流水线技术编译优化程度高记忆口诀“精简少定单硬线多寄存”6. 应用案例 08:491例题:flynn分类法答案题目解析分类依据指令流和数据流的不同组合选A多核计算机属于MIMD多指令流多数据流判断依据多核多处理器多数据流支持多任务多指令流易错点容易混淆SIMD单指令多数据流如向量处理器2例题:复杂指令集叙述 09:45题目解析正确选项D指令长度不固定格式和寻址方式多错误选项分析A描述的是RISC特征B大量寄存器是RISC特点C组合逻辑是RISC实现方式解题技巧抓住复杂对应多、不固定、多样等关键词二、指令系统 10:391. 指令流水线原理 10:57分段处理机制将指令划分为取指、分析、执行等不同阶段各阶段由专用硬件并行处理形成叠加效果效率提升本质通过增加硬件资源空间换取时间效率典型表现为更小的CPI每条指令周期数技术对比超标量技术依赖硬件调度实现多指令并行VLIW技术通过软件优化指令并行简化硬件设计应用限制仅适用于RISC精简指令集架构CISC复杂指令集因指令复杂度高无法有效流水化2. 流水线时间计算 14:37周期确定取各阶段最长耗时作为流水线周期例取指5ns/分析8ns/执行10ns → 周期10ns执行时间公式T流水线kt(n−1)ΔtT_{流水线} kt (n-1)\Delta tT流水线​kt(n−1)Δtk阶段数t单阶段时间n指令数Δt\Delta tΔt流水线周期吞吐率计算吞吐率nT流水线吞吐率 \frac{n}{T_{流水线}}吞吐率T流水线​n​单位时间完成指令数加速比计算加速比T非流水T流水加速比 \frac{T_{非流水}}{T_{流水}}加速比T流水​T非流水​​分子为顺序执行总时间分母为流水线执行时间加速比1数值越大效率提升越显著3. 应用案例 17:231例题:流水线吞吐率计算解题关键识别最长阶段2ns为周期计算总时间(21×4)(100−1)×2204ns(21×4) (100-1)×2 204ns(21×4)(100−1)×2204ns单位换算1s109ns1s10^9ns1s109ns→吞吐率100204×109≈490×106/s吞吐率\frac{100}{204}×10^9≈490×10^6/s吞吐率204100​×109≈490×106/s易错点忽略纳秒与秒的单位换算选项A为典型错误答案2例题:单双缓冲区所需时间计算 19:40单缓冲区分析需合并前两段读缓冲15μs送用户区5μs为20μs公式201(10−1)×20201μs201 (10-1)×20 201μs201(10−1)×20201μs选D双缓冲区分析保持三段独立15/5/1μs公式21(10−1)×15156μs21 (10-1)×15 156μs21(10−1)×15156μs选C核心区别单缓冲区导致前两段无法并行必须合并计算3例题:流水线执行时间计算 26:17通用公式应用T(kn−1)tT (kn-1)tT(kn−1)t各段等长时间t时加速比极值问题顺序时间36n36n36n6789636流水时间369(n−1)36 9(n-1)369(n−1)周期9ns极限计算lim⁡n→∞36n9n274\lim_{n \to \infty}\frac{36n}{9n27}4limn→∞​9n2736n​4选A解题技巧当n→∞时常数项可忽略三、存储系统 30:251. 采用分级存储体系的目的 30:56核心矛盾解决存储容量、成本和速度之间的矛盾层级特征从上到下速度递减寄存器最快外存最慢容量递增寄存器最小仅32/64位外存可达TB级价格递减寄存器成本最高外存最廉价典型层级CPU寄存器纳秒级容量KB以下Cache兆字节级速度比内存快5-10倍主存GB级现代计算机通常8GB外存TB级包括磁盘/U盘等2. 空间局部性原理 33:52时间局部性当前访问的数据项很可能被再次访问如循环变量空间局部性相邻地址的数据可能被连续访问如数组遍历1空间局部性原理的应用实例数组累加 36:35典型场景for循环累加数组元素a[0]到a[99]缓存机制访问a[1]后会将a[2],a[3]预加载到Cache效率提升减少内存访问次数速度提升可达10倍3. 高速缓存 37:31核心作用存储当前最活跃程序和数据作为主存副本硬件特性半导体材料构成对程序员透明组成模块存储器实际存储数据控制部分判断数据是否命中1地址映射 39:30核心功能将主存地址转换为Cache地址硬件自动完成直接映像 40:14划分规则主存和Cache等分成块如1KB/块映射特点块号必须相同才能命中如都必须是第0块优缺点实现简单但冲突率高易造成资源浪费全相连映射 42:04映射特点主存任意块可调入Cache任意位置优势冲突率最低存储利用率高劣势实现复杂需要全表查询组相联映射 43:50混合设计组间直接映射组内全相连映射典型配置每组包含8块组号必须匹配平衡特性冲突率和实现复杂度介于前两者之间2替换算法 44:48随机替换随机选择被替换块实现简单但效率低FIFO替换最早进入的块可能替换活跃数据LRU替换最近最少使用的块基于局部性原理最常用优化算法需预执行统计实际应用较少3命中率及平均时间 46:45计算公式TavgH×Tcache(1−H)×TmemT_{avg} H \times T_{cache} (1-H) \times T_{mem}Tavg​H×Tcache​(1−H)×Tmem​例命中率90%时0.9×1ns0.1×1000ns100.9ns0.9 \times 1ns 0.1 \times 1000ns 100.9ns0.9×1ns0.1×1000ns100.9ns容量影响命中率随Cache容量增大呈对数曲线增长初期提升明显如3M→6M后期边际效益递减如6M→12M4. 应用案例 50:371例题cache地址映像冲突概率排序 50:43题目解析关键规律全相连组相联直接映像答案B直接映像→组相联映像→全相联映像2例题cache地址映射叙述判断 51:37题目解析核心考点地址映射由硬件自动完成排除法A/B/C均涉及软件干预答案D四、知识小结知识点核心内容考试重点/易混淆点难度系数指令系统组成指令由操作码和地址码组成二进制形式存放操作码决定操作类型地址码存储操作数地址⭐⭐指令执行流程取指令→分析指令→执行指令需操作数时再取区分取指令和取操作数的不同阶段⭐⭐寻址方式对比指令寻址 vs 操作数寻址本质不同顺序寻址 vs 跳跃寻址跳跃寻址的地址由当前指令直接给出⭐⭐⭐操作数寻址方式立即/直接/间接/寄存器寻址等6种方式立即寻址操作数在指令中 vs 间接寻址需两次访存⭐⭐⭐⭐CISC与RISC对比CISC复杂指令集数量多、变长RISC精简指令集定长、寄存器多RISC采用硬布线逻辑和流水线技术⭐⭐⭐流水线原理指令分段并行执行取指/分析/执行重叠流水线周期最长段执行时间⭐⭐⭐流水线计算执行时间单指令时间(n-1)×周期吞吐率指令数/执行时间加速比串行时间/流水线时间单位换算陷阱纳秒vs秒⭐⭐⭐⭐存储体系层次寄存器→Cache→主存→磁盘速度↓容量↑Cache速度是内存5-10倍⭐⭐局部性原理时间局部性重复访问空间局部性邻近访问循环数组操作体现空间局部性⭐⭐Cache映射方式直接/全相连/组相连三种映射地址映射由硬件自动完成高频考点⭐⭐⭐替换算法随机/FIFO/LRU/优化替换LRU算法最符合局部性原理⭐⭐⭐命中率计算平均时间命中率×Cache时间(1-命中率)×内存时间忽略首次Cache访问的简化计算⭐⭐⭐

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2425962.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…