计算机组成原理—

计算机组成原理——cache

news2026/2/17 14:31:32

3.4cache

出自up主Beokayy传送门

时间局部性：
- 在最近的未来要用到的信息，很可能是现在正在使用的信息，因为程序中存在循环。
空间局部性：
- 在最近的未来要用到的信息，很可能与现在正在使用的信息在存储空间上是邻近的，因为指令通常是顺序存放、顺序执行的。
- 数据也一般是以向量、数组形式簇聚地存储在一起的。
时间局部性好，例如数组元素经常被反复访问，例如出现循环指令：

for(i = 0; i <= 9; i++){
    temp = 1;
    for(j = 0; j <= i; j++)
        temp *= a[j];
    sum += temp;
}

int func(int a[M][N]){
    int i, j, sum = 0;
    for(i = 0; i < M; i++)
        for(j = 0; j < N; j++)
            sum += a[i][j];
    return sum;
}

int func(int a[M][N]){
    int i, j, sum = 0;
    for(j = 0; j < N; j++)
        for(i = 0; i < M; i++)
            sum += a[i][j];
    return sum;
}

若按行存储，则存储顺序为a[0][0], a[0][1], a[0][2]……。
程序A的访问顺序为a[0][0], a[0][1], a[0][2]……，程序B的访问顺序为a[0][0], a[1][0], a[2][0]……。故程序A的空间局部性好，程序B的空间局部性差。

CPU与访问的信息已被放入cache中的比率即为cache的命中率。
命中率H=Nc/(Nc+Nm)：
- cache的总命中次数为Nc。
- 访问主存的次数为Nm。
cache - 主存系统的平均访问时间Ta=Htc+ (1-H) tm：
- cache命中率为H。
- 命中时访问cache的时间为tc。
- 未命中时的访问时间为tm。

cache行中存放的内容

基本思想：把主存每一块映射到一个固定的cache行中。
映射关系：cache行号=主存块号%cache行数。
主存地址结构：
- 主存块号被分解成标记字段和cache行号字段，块内地址的划分不变。
- 假设cache共有 $2^c$ 行，主存共有 $2^m$ 块，主存块大小占 $2^b$ 字节，按字节编址，则cache行号占c位，主存块号占m位，块内地址占b位，而标记字段占m - c位。
只有标记位相同且有效位为1时，cache才命中。
cache不命中时，CPU会从主存读出该地址所在的主存块，并把信息送到直接映射对应的cache行中，将有效位置1，并将标记设置为地址中的高t位，同时将该地址中的内容送往CPU。

回写法：
- cache写命中时，只把数据写入cache，而不立即写入主存，只有当该块被换出时才写回主存。
- 为了避免不一致隐患，引入脏位（修改位）。若脏位为1，则说明对应cache行中的块被修改过，替换时需要写回主存；若脏位为0，则说明对应cache行中的块未被修改过，替换时无需写回主存。
写分配法：
- cache写不命中时，将对应主存块调入cache中，再修改这个cache块

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2391752.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！