# 磁盘结构
# 磁盘、磁面、扇区
磁盘的表面由一些磁性物质组成,可以用这些磁性物质来记录二进制数据
磁盘的盘面被划分成一个个磁道。
一个磁道又被划分为一个个扇区,每个扇区就是一个磁盘块。各个扇区存放的数据量相同
最内侧磁道上的扇区面积最小,因此数据密度最大
# 盘片、柱面
一个盘片可能会有两个盘片,每个盘片对应一个磁头,所有的磁头都是连在同一个磁臂上的,因此所有磁头只能 "共进退"
所有盘面中相对位置相同的磁道组成柱面
# 磁盘的物理地址
可用(柱面号,盘面号,扇区号)来定位任意一个 "磁盘块"。
可以根据该地址去读一个块
- 根据柱面号移动磁臂,让磁头指向指定柱面
- 激活指定盘面对应的磁头
- 磁盘旋转的过程中,指定的扇区会从磁头下面划过,这样就完成了对指定扇区的读 / 写
# 磁头的分类
磁头可以移动的称为活动头磁盘。磁臂可以来回伸缩来带动磁头定位磁道
磁头不可移动的称为固定头磁盘。这种磁盘中每个磁道有一个磁头
# 磁盘的分类
盘片可以更换的称为可换盘磁盘,盘片不可更换的称为固定盘磁盘
# 磁盘调度算法
一次磁盘读 / 写操作需要的时间
寻找时间(寻道时间)Ts:在读 / 写数据前,将磁头移动到指定磁道所花的时间
- 启动磁头臂是需要时间的。假设耗时为 s
- 移动磁头也是需要时间的。假设磁头匀速移动,每跨越一个磁道耗时为 m,总共需要跨越 n 条磁道。则:寻道时间 Ts=s+m*n
延迟时间 TR:通过旋转磁盘,使磁头定位到目标扇区所需要的时间。设磁盘转速为 r(单位:转 / 秒,或转 / 分),则平均所需的延迟时间 TR=1/2r
传输时间 Tt:从磁盘读出或向磁盘写入数据所经历的时间,假设磁盘转速为 r,此次读 / 写的字节数为 b,每个磁道上的字节数为 N。则:传输时间 Tt=b/(rN)
总的平均存取时间 Ta=Ts+1/2r+b/(rN)
延迟时间和传输时间都与磁盘转速有关,且为线性相关。而转速是硬件的固有属性,因此操作系统也无法优化延迟时间和传输时间
# 先来先服务算法(FCFS)
根据进程请求访问磁盘的先后顺序进行调度
优点:公平;如果请求访问的磁道比较集中的话,算法性能还算过得去
缺点:如果有大量进程竞争使用磁盘,请求访问的磁道很分散,则 FCFS 在性能上很差,寻道时间长
# 最短寻找时间优先(SSTF)
SSTF 算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短,但并不能保证总的寻道时间最短。(其实就是贪心算法思想)
优点:性能较好,平均寻道时间段
缺点:可能产生 "饥饿" 现象
- 原因:磁头在一个小区域内来回来去地移动
# 扫描算法(SCAN)
SSTF 会产生饥饿的原因在于:磁头有可能在一个小区域内来回来去地移动。为了防止这个问题可以规定,只有磁头移动到最外侧磁道的时候才能往内移动,移动到最内侧磁道的时候才能往外移动。这就是扫描算法的思想。由于磁头移动的方式很像电梯,因此也叫电梯算法
优点:性能较好,平均寻道时间较短,不会产生饥饿现象
缺点:
- 只有到达最边上的磁道时才能改变磁头移动方向。
- SCAN 算法对于各个位置磁道的响应频率不平均
# LOOK 调度算法
扫描算法(SCAN)中,只有到达了最边上的磁道时才能改变磁头方向。LOOK 算法就是为了解决这个问题,如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向。
优点:比起 SCAN 算法,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短
# 循环扫描算法(C-SCAN)
SCAN 算法对于各个位置磁道的响应频率不平均,而 C-SCAN 算法就是为了解决这个问题。规定只有磁头朝某个特定方向移动时才处理磁道访问请求,而返回时直接快速移动至起始端而不处理任何请求。
优点:比起 SCAN 算法,对于各个位置磁道的响应频率很平均
缺点:只有到达最边上的磁道时才能改变磁头方向。比起 SCAN 算法来,平均寻道时间更长
# C-LOOK 调度算法
C-SCAN 算法的主要缺点是只有到达最边上的磁道时才能改变磁头方向,并且磁头返回时不一定需要返回到最边缘的磁道上。C-LOOK 算法就是为了解决这个问题的。如果磁头移动的方向上已经没有磁道访问请求了,就可以立即让磁头返回,并且磁头只需要返回到有磁道访问请求的位置即可
优点:比起 C-SCAN 算法,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短
# 减少磁盘延迟时间的方法
磁头读入一个扇区数据后需要一小段时间处理,如果逻辑上相邻的扇区在物理上也相邻,则读入几个连续的逻辑扇区,可能需要很长的 "延迟时间"
# 减少延迟时间方法:交替编号
若采用交替编号的策略,即让逻辑上相邻的扇区在物理上有一定的间隔,可以使读取连续的逻辑扇区所需要的延迟时间更小
# 磁盘地址结构的设计
为什么磁盘的物理地址是(柱面号,盘面号,扇区号)而不是(盘面号,柱面号,扇区号)
- 读取地址连续的磁盘块时,采用(柱面号,盘面号,扇区号)的地址结构可以减少磁头移动消耗的时间
# 减少延迟时间方法:错位命名
让相邻盘面的扇区编号错位
原理:与交替编号的原理相同,错位命名法可以降低延迟时间
# 磁盘的管理
# 磁盘初始化
- 进行低级格式化(物理格式化),将磁盘的各个磁道划分为扇区。一个扇区通常可分为头、数据区域、尾三个部分组成。管理扇区所需要的各种数据结构一般存放在头、尾两个部分,包括扇区检验码(如奇偶校验、CRC 等,校验码用于校验扇区中的数据是否发生错误)
- 将磁盘分区,每个分区由若干柱面组成(即分为我们熟悉的 C 盘、D 盘、F 盘)
- 进行逻辑格式化,创建文件系统。包括创建文件系统的根目录、初始化存储空间管理所用的数据结构
# 引导块
引导块:计算机开机时需要进行一系列初始化的工作,这些初始化工作是通过执行初始化程序(自举程序)完成的
初始化程序可以放在 ROM(只读存储器)中,ROM 中的数据在出厂时就写入了,并且以后不能再修改
注:ROM 一般是出厂时就集成在主板上的
ROM 中只存放很小的 "自举装入程序",完整的自举程序放在磁盘的启动块(即引导块 / 启动分区)上,启动块位于磁盘的固定位置
开机时计算机先运行 "自举装入程序",通过执行该程序就可以找到引导块,并将完整的 "自举程序" 读入内存,完成初始化
拥有启动分区的磁盘称为启动磁盘或系统磁盘(C 盘)
# 坏块的管理
坏了,无法正常使用的扇区就是坏块。这属于硬件故障,操作系统无法修复的。应该将坏块标记出来,以免错误地使用到它
对于简单的磁盘,可以在逻辑格式化时(建立文件系统时)对整个磁盘进行坏块检查,标明哪些扇区是坏扇区,比如:在 FAT 表上表明(在这种方式中,坏块对操作系统不透明)
对于复杂的磁盘,磁盘控制器(磁盘设备内部的一个硬件部件)会维护一块坏块链表
在磁盘出厂前进行低级格式化(物理格式化)时就将坏块链进行初始化
会保留一些 "备用扇区",用于替换坏块。这种方案称为扇区备用、且这种处理方式中,坏块对操作系统透明。
# 固态硬盘 SSD
- 原理:基于闪存技术 Flash Memory,属于电可擦除 ROM,即 EEPROM
- 组成:
- 闪存翻译层:负责翻译逻辑模块号,找到对应页
- 存储介质:多个闪存芯片 (Flash Chip)—— 每个芯片包含多个块 —— 每个块包含多个页
- 读写性能特性:
- 以页为单位读 / 写 —— 相当于磁盘的扇区
- 以块为单位擦除,擦干净的块,其中的每一页都可以写一次,读无限次
- 支持随机访问,系统给定一个逻辑地址,闪存翻译层可通过电路迅速定位到对应的物理地址
- 读快、写慢。要写的页如果有数据,则不能写入,需要块内其他页全部复制到一个新的 (擦除过的) 块中,再写入新的页
- 与机械硬盘相比的特点:
- SSD 读写速度快、随机访问性能高,用电路控制访问位置;机械硬盘通过移动磁臂旋转磁盘控制访问位置,有寻道时间和旋转延迟
- SSD 安静无噪音、耐摔抗震、能耗低、造价更贵
- SSD 的一个块被擦除次数过多 (重复写同一个块) 可能会坏掉,而机械硬盘的扇区不会因为写的次数太多而坏掉
- 磨损均衡技术
- 思想:将 "擦除" 平均分布在各个块上,以提升使用寿命
- 动态磨损均衡:写入数据时,优先选择累计擦除次数少的新闪存块
- 静态磨损均衡:SSD 监测并自动进行数据分配、迁移,让老旧的闪存块承担以读为主的存储任务,让较新的闪存块承担更多的写任务
理想情况下,固态硬盘的寿命:
某固态硬盘采用磨损均衡技术,大小为,闪存块的擦写寿命只有 次。某男子平均每天会对该固态硬盘写 数据。在最理想的情况下,这个固态硬盘可以用多久?
最理想情况下,SSD 中每个块被擦除的次数都是完全均衡的。
因此平均每 8 天,每个闪存块就要被擦除一次。每个闪存块可以被擦除 次。因此经过 天,约 23 年后,该固态硬盘损坏