32中的Flash读取周期设置
STM32 FLASH 简介不同型号的STM32F40xx/41xx其 FLASH容量也有所不同最小的只有128K字节最大 的则达到了 1024K 字节。STM32F4 的闪存模块由主存储器、系统存储器、OPT区域和选项字节等4部分组成。主存储器该部分用来存放代码和数据常数如const类型的数据。分为12个扇区前4 个扇区为16KB大小扇区4为64KB大小扇区5~11为128KB大小不同容量的STM32F4 拥有的扇区数不一样比如我们的STM32F407ZGT6拥有12个扇区。系统存储器主要用来存放 STM32F4 的 bootloader 代码此代码在出厂的时候就固化在 STM32F4 里面了专门用来给主存储器下载代码的。当B0接V3.3B1接GND的时候从该 存储器启动即进入串口下载模式。OTP区域即一次性可编程区域总共528字节大小被分成两个部分前面512字节32 字节为1块分成16块可以用来存储一些用户数据一次性的写完一次永远不可以擦 除后面16字节用于锁定对应块。选项字节用于配置读保护、BOR级别、软件/硬件看门狗以及器件处于待机或停止模式下 的复位。闪存存储器接口寄存器该部分用于控制闪存读写等是整个闪存模块的控制结构。在执行闪存写操作时任何对闪存的读操作都会锁住总线在写操作完成后读操作才能正确地进行。既在进行写或擦除操作时不能进行代码或数据的读取操作。1. 主存储器Main Memory作用存放用户代码和常量数据比如const定义的变量是我们最常操作的区域。结构以 STM32F407ZGT6 为例分为 12 个扇区Sector扇区大小不统一扇区 0~316KB扇区 464KB扇区 5~11128KB起始地址0x08000000启动逻辑当 BOOT0、BOOT1 都接 GND 时单片机从这里启动并运行用户代码。2. 系统存储器System Memory作用出厂固化了 STM32 的 Bootloader引导程序专门用于串口下载代码。关键特性用户无法修改这部分代码出厂时就已固定。启动逻辑当 BOOT0 接 V3.3、BOOT1 接 GND 时单片机从这里启动进入串口下载模式ISP 模式。3. OTP 区域One-Time Programmable一次性可编程区域作用存储用户数据只能写一次写完后无法擦除或修改适合存设备序列号、加密密钥等永久信息。结构总大小 528 字节前 512 字节分为 16 块每块 32 字节用于存储用户数据。后 16 字节用于锁定对应的 OTP 块锁定后无法再修改该块数据。4. 选项字节Option Bytes作用配置单片机的关键安全和运行参数比如Flash 读保护防止代码被读取BOR掉电复位级别看门狗类型软件 / 硬件看门狗待机 / 停止模式下的复位行为特点这部分配置可以通过特定的 Flash 操作修改常用于产品安全和功耗控制。5. Flash 存储接口寄存器作用控制 Flash 的读写、擦除操作是 Flash 模块的 “控制中枢”。关键规则执行 Flash 写操作时任何对 Flash 的读操作都会锁定总线直到写操作完成后读操作才能恢复。BOOT0BOOT1启动区域用途00主存储器运行用户代码10系统存储器串口下载模式0/11内置 SRAM调试 / 特殊应用场景一. 闪存的读取STM32F4 可以通过内部的I-Code指令总线或D-Code数据总线访问内置闪存模块本章主 要讲解的数据读写即通过D-Code数据总线来访问内部闪存模块。为了准确读取Flash数据 必须根据CPU时钟HCLK频率和器件电源电压在Flash存取控制寄存器FLASH_ACR中 正确地设置等待周期数LATENCY。当电源电压低于 2.1V 时必须关闭预取缓冲器。Flash 等待周期与CPU时钟频率之间的对应关系如表46.1.1.2所示一、表格核心信息解读这张表的核心作用是根据系统时钟HCLK频率和供电电压确定 Flash 读取时需要设置的等待周期WS确保 Flash 读取稳定可靠。不同电压范围下对应时钟频率的等待周期要求不同电压越高2.7V~3.6VFlash 读取速度越快能支持更高的时钟频率而无需增加等待周期电压越低如 1.8V~2.1V 且预取关闭Flash 读取速度受限需要更多等待周期 当电源电压低于 2.1V 时必须关闭预取缓冲器此时最高时钟和等待周期的对应关系会更严格二、举个例子帮你理解假设你的 STM32F4 供电电压为 3.3V属于 2.7V~3.6V 范围系统时钟 HCLK 配置为 168MHz1.在 2.7V~3.6V 列中找到150 HCLK ≤ 168对应等待周期为 5 WS即 6 个 CPU 周期2.你需要在FLASH_ACR寄存器中将LATENCY位设置为53.若供电电压为 1.8V~2.1V 且关闭预取168MHz 的 HCLK 需要设置为 7 WS8 个 CPU 周期三、关键使用注意事项1.必须先配置 Flash 等待周期再配置系统时钟若先把时钟拉到 168MHz 再配置等待周期会因为 Flash 跟不上时钟速度导致程序跑飞。正确顺序是// 1. 配置FLASH等待周期根据电压和目标时钟设置 FLASH-ACR | FLASH_ACR_LATENCY_5WS; // 3.3V下168MHz用5WS // 2. 配置预取缓冲和指令缓存电压≥2.1V时建议开启 FLASH-ACR | FLASH_ACR_PRFTEN | FLASH_ACR_ICEN | FLASH_ACR_DCEN; // 3. 再配置PLL将HCLK提升到目标频率2.预取缓冲器的开启条件电压≥2.1V建议开启预取缓冲PRFTEN位可以提升指令读取效率 电压 2.1V必须关闭预取缓冲否则无法稳定运行3.时钟与电压的对应关系不能错比如 3.3V 下120MHz 的 HCLK 可以用 4 WS但如果电压降到 2.4V~2.7V120MHz 的 HCLK 需要用 5 WS不按表设置会导致程序运行异常。四、ART 加速器自适应实时存储器加速器的作用在 STM32F4 运行在 168MHz 时Flash 读取需要 6 个 CPU 等待周期但 ART 加速器可以把这个等待时间 “隐藏” 起来原理通过指令缓存和预取机制提前把 Flash 里的指令读到缓存中效果CPU 直接从缓存取指令大部分时候相当于 0 等待周期接近无等待的运行效率注意这不是 “消除” 了等待周期而是把等待时间通过预取和缓存隐藏在了后台让 CPU 不用空转等待。五、Flash 读取代码解析data * (volatile uint32_t *)addr;这行代码的作用是从 addr 地址读取一个 32 位数据下面拆解每个部分代码部分作用说明addr要读取的 Flash 地址比如0x08000000(volatile uint32_t *)把addr强制转换为指向 32 位无符号整数的 volatile 指针*取该指针指向地址的值完成读取为什么要用 volatilevolatile 是防止编译器优化的关键字它告诉编译器 这个地址的值可能会被硬件比如 Flash 控制器意外修改不要把这行代码优化掉每次读取都必须直接访问 Flash 地址如果不加 volatile编译器可能会认为这行代码是 “多余的”直接优化成一个固定值导致读取失败。读取不同长度的数据读取 8 位字节data * (volatile uint8_t *)addr;读取 16 位半字data * (volatile uint16_t *)addr;读取 32 位字就是上面的代码六、Flash 读 vs Flash 写读取非常简单直接用指针访问地址即可不需要特殊操作写入复杂很多需要遵循 STM32F4 的 Flash 编程流程解锁 Flash 控制寄存器擦除目标扇区Flash 只能按扇区擦除不能直接改写单个字节按字 / 半字 / 字节写入数据等待操作完成并上锁寄存器七、实际开发中的注意事项地址范围Flash 主存储器的地址范围是0x08000000 ~ 0x080FFFFF以 1MB 容量为例超出范围会导致 HardFault 错误。读取速度虽然有 ART 加速器但连续随机读取时缓存命中率下降还是会出现等待周期顺序读取的效率最高。权限问题如果开启了 Flash 读保护读取受保护区域会失败甚至会锁死芯片补充预取缓存器有什么用一、核心作用解决「CPU 跑得快Flash 读得慢」的矛盾STM32F4 的 CPU 核心Cortex-M4工作频率可以高达 168MHz但内部 Flash 的读取速度跟不上 CPU 的时钟周期必须通过设置「等待周期LATENCY」来给 Flash 留出读取时间。没有预取缓冲时CPU 每取一条指令都要等 Flash 完成读取插入等待周期执行效率会被拉低。开启预取缓冲后缓冲器会提前从 Flash 中读取后续指令并缓存起来CPU 取指令时直接从缓冲器读取大部分时候可以「无等待」执行。二、具体工作原理预取缓冲器是一个硬件级的指令流水线工作流程如下当 CPU 执行指令时预取缓冲器会提前预判下一条 / 下几条指令的地址主动向 Flash 发起读取请求。Flash 完成读取后指令会被存入预取缓冲器的 FIFO 队列中。CPU 取指令时直接从缓冲器中读取无需等待 Flash 的读取延迟。即使 Flash 读取需要等待周期这些等待时间也会被预取缓冲器「隐藏」在后台不会打断 CPU 的执行流程。三、开启后的实际收益提升指令执行效率开启预取缓冲后即使设置了较高的 Flash 等待周期CPU 的指令执行效率也能接近「零等待」的水平。比如 168MHz 下设置 5 个等待周期开启预取后实际平均等待周期会大幅降低。减少 CPU 空转没有预取缓冲时CPU 每取一条指令都要插入等待周期相当于 CPU 在空等 Flash开启后等待周期被预取操作覆盖CPU 可以连续执行指令。配合 I-Code 总线优化STM32F4 的 I-Code 指令总线专门用于读取指令预取缓冲器和指令缓存ICACHE配合使用时能进一步提升指令读取的命中率减少对 Flash 的访问次数。四、关键限制与注意事项必须满足电压条件当供电电压低于 2.1V 时必须关闭预取缓冲器如你图片中的表格所示此时 Flash 读取速度更慢预取缓冲无法稳定工作反而可能导致程序跑飞。和 Flash 等待周期配合使用预取缓冲器只能「隐藏」等待周期不能消除等待周期。等待周期的设置必须严格按照电压和时钟频率的对应表来配置否则即使开启预取也会因为 Flash 读取失败导致程序异常。对分支指令的效果有限预取缓冲器对顺序执行的指令效率提升最明显遇到分支、跳转指令时预取的指令可能无效此时仍会产生一定的等待周期这时候指令缓存ICACHE的作用会更突出。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2586216.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!