目录
磁盘简介
Ext文件系统
块
分区
分组
inode
再谈inode
路径解析
路径缓存
再再看inode
挂载
小知识
磁盘简介
磁盘:一个机械设备,用于储存数据。 未被打开的文件都是存在磁盘上的,被打开的加载到内存中。
扇区:是OS访问磁盘的基本单位,普通为512字节。
磁头:通过左右摆动定位磁道,然后定位扇区
柱面:同一半径上下的磁道构成的柱面
逻辑上看,可以以磁道展开,当做一维数组,以柱面(整个磁盘的同一个垂直位置的磁道为一个柱面)展开,每个柱面都是个二维数组,整个磁盘(多个柱面)就是个三维数组,这样,对于OS来说,只需要在一个三维数组中定位即可对磁盘上的数据进行操作。
所以,对扇区的定位要通过找柱面-》磁道-》扇区的过程,叫CHS地址。
Ext文件系统
块
块:八个扇区组成一个块,块是文件存取的最小单位。
1.OS看待磁盘,认为磁盘是一个块设备,每个块都有下标
2.文件系统看待磁盘,认为磁盘是一个block array[N] 的块设备。
分区
分区:以开始块号和结束块号划分,不同分区其实就是不同的盘,所以一块磁盘就可以通过分区形成C、D等盘。
分组
分组:每个分区被分为多个块组。这里采用分治的思想,分而治之。
在一个块组中
Data Blocks:保存文件的内容,以4KB为单位。大部分的磁盘分区空间,都由Data Blocks占据。(每个数据块(4KB大小的块),都有唯一的编号 )
Block Bitmap(块位图):用来记录Data Blocks 中哪个数据块被占用,哪个数据块没被占用。(每个比特位代表一个数据块,比特位位置表示对应位置的数据块,比特位内容表示是否被占用。 )
inode
1.在文件系统中,文件属性由inode的结构体来描述,而结构体大小是固定的,一般为128字节或256字节。可知,任何文件的属性的种类是相同的,属性的内容不同。
2.为了标识每个文件的唯一性,每个inode中都有inode number(inode编号)。
3.inode结构体中有i_block的数组映射关系表来找到文件内容
所以,上面的块组中的
inode Table:存放文件属性,如文件大小、所有者、最近修改时间等(是当前块组中所有inode属性的集合)。
inode Bitmap:用来标识inode Table中的位置是否被占用。(比特位的位置,表示哪个对应的inode ,比特位的内容表示是否空闲)
GDT:用来描述整个块组的不同分区的位置。
Super Block:管理所有的组,用来描述一个分区分组整体情况。
注:不一定所有的组中都有,但几乎多个组会同时存在同样的Super Block,因为这个部分非常重要,如果损坏会导致整个分区废掉,所以会在多个组中都存在来备份。
所以,新建一个分区时,Super Block和GDT一定有有效数据,要给写入文件系统和分区分组相关的管理信息。
再谈inode
1.inode用来标识文件的唯一性。
2.inode由全分区统一分配(块号也是),不能跨分区,一个分区,就是一个文件系统,相互独立,,每个组的大小固定,每个组有多少个block和inode都是固定的,在Super Block结构中。
3.inode中不存放文件名,为什么呢,因为文件名存放在目录文件的Data Block中,目录文件的Data Block中放的是该目录下的文件的文件名和inode的映射关系。
4.所以,在指定目录下,新建文件,需要就将文件名和inode的映射写入到当前目录的Data Block中,所以要有w权限,读取一个文件的属性,要有r权限,x权限,关系着我们能否打开该目录,打开了才能去读写。
路径解析
要打开一个文件,就要知道这个文件的inode,就要去这个文件的目录文件Date Block中取,但目录文件也是文件,想要打开也要向上找,直到找到根目录,这就是路径解析,总之访问文件都需要其路径。
路径缓存
linux中,当用户访问指定路径下文件(包括路径上目录、最终的文件),linux会在进行路径解析过程中,在内核中形成目录树和路径缓存,加快查找效率。
在内核中使用dentry结构体组织、缓存文件的inode等信息,每个文件都会有对应的dentry结构体,这样访问文件时,会先在dentry树中查找,找到返回inode等数据,没找到再去磁盘中搜索,然后缓存新路径。
dentry树会使用lru算法处理不常访问的路径,防止占内存过多
再再看inode
1.前12个下标直接映射,还有三个分别是一级、二级、三级的间接块指针,一共在inode中只需要存15个指针来指向所有内容块。
2.一级间接块指针指向一个块,这个块中存的不是数据,而是块号,用来映射多个储存数据的块,二级的间接块指针指向一个存着多个一级间接块的块,三级同理,多级映射,就可以让一个inode指向一个很大的文件。
3.一个inode指向的文件如果过大,可以跨组申请块空间。(可能inode用完,block没用完或者反过来,这时,虽然磁盘还有空间,但不能新建文件了)
挂载
指的是将文件系统附加到操作系统的目录树中的某个特定位置(称为挂载点),从而使得该文件系统中的文件和目录能够被访问和使用。
1.一个磁盘必须分区格式化才能使用,一个分区也不能直接使用,需要挂载到指定的目录才可以使用。
2.df -h 查看挂载
3.所以,虽然每个分区inode编号可能重复,但可以根据访问目标文件的“路径前缀”来判断是在哪一个分区。
小知识
1.操作系统通过外设内部的寄存器将数据写给或读出外设。
2.OS一次会读取4KB,就会一次读取32个文件的inode,可以减少IO次数,提高缓存效率。