操作系统 408-5-3 - 操作系统 - 计算机科学 | Flüstern = Whispering's Blog = 无需过去，无关未来，只有现在

# 磁盘结构

# 磁盘、磁面、扇区

磁盘的表面由一些磁性物质组成，可以用这些磁性物质来记录二进制数据

磁盘的盘面被划分成一个个磁道。

一个磁道又被划分为一个个扇区，每个扇区就是一个磁盘块。各个扇区存放的数据量相同

最内侧磁道上的扇区面积最小，因此数据密度最大

# 盘片、柱面

一个盘片可能会有两个盘片，每个盘片对应一个磁头，所有的磁头都是连在同一个磁臂上的，因此所有磁头只能 "共进退"

所有盘面中相对位置相同的磁道组成柱面

# 磁盘的物理地址

可用（柱面号，盘面号，扇区号）来定位任意一个 "磁盘块"。

可以根据该地址去读一个块

根据柱面号移动磁臂，让磁头指向指定柱面
激活指定盘面对应的磁头
磁盘旋转的过程中，指定的扇区会从磁头下面划过，这样就完成了对指定扇区的读 / 写

# 磁头的分类

磁头可以移动的称为活动头磁盘。磁臂可以来回伸缩来带动磁头定位磁道

磁头不可移动的称为固定头磁盘。这种磁盘中每个磁道有一个磁头

# 磁盘的分类

盘片可以更换的称为可换盘磁盘，盘片不可更换的称为固定盘磁盘

# 磁盘调度算法

一次磁盘读 / 写操作需要的时间

寻找时间（寻道时间）Ts：在读 / 写数据前，将磁头移动到指定磁道所花的时间

启动磁头臂是需要时间的。假设耗时为 s
移动磁头也是需要时间的。假设磁头匀速移动，每跨越一个磁道耗时为 m，总共需要跨越 n 条磁道。则：寻道时间 Ts=s+m*n

延迟时间 TR：通过旋转磁盘，使磁头定位到目标扇区所需要的时间。设磁盘转速为 r（单位：转 / 秒，或转 / 分），则平均所需的延迟时间 TR=1/2r

传输时间 Tt：从磁盘读出或向磁盘写入数据所经历的时间，假设磁盘转速为 r，此次读 / 写的字节数为 b，每个磁道上的字节数为 N。则：传输时间 Tt=b/(rN)

总的平均存取时间 Ta=Ts+1/2r+b/(rN)

延迟时间和传输时间都与磁盘转速有关，且为线性相关。而转速是硬件的固有属性，因此操作系统也无法优化延迟时间和传输时间

# 先来先服务算法（FCFS）

根据进程请求访问磁盘的先后顺序进行调度

优点：公平；如果请求访问的磁道比较集中的话，算法性能还算过得去

缺点：如果有大量进程竞争使用磁盘，请求访问的磁道很分散，则 FCFS 在性能上很差，寻道时间长

# 最短寻找时间优先（SSTF）

SSTF 算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短，但并不能保证总的寻道时间最短。（其实就是贪心算法思想）

优点：性能较好，平均寻道时间段

缺点：可能产生 "饥饿" 现象

原因：磁头在一个小区域内来回来去地移动

# 扫描算法（SCAN）

SSTF 会产生饥饿的原因在于：磁头有可能在一个小区域内来回来去地移动。为了防止这个问题可以规定，只有磁头移动到最外侧磁道的时候才能往内移动，移动到最内侧磁道的时候才能往外移动。这就是扫描算法的思想。由于磁头移动的方式很像电梯，因此也叫电梯算法

优点：性能较好，平均寻道时间较短，不会产生饥饿现象

缺点：

只有到达最边上的磁道时才能改变磁头移动方向。
SCAN 算法对于各个位置磁道的响应频率不平均

# LOOK 调度算法

扫描算法（SCAN）中，只有到达了最边上的磁道时才能改变磁头方向。LOOK 算法就是为了解决这个问题，如果在磁头移动方向上已经没有别的请求，就可以立即改变磁头移动方向。

优点：比起 SCAN 算法，不需要每次都移动到最外侧或最内侧才改变磁头方向，使寻道时间进一步缩短

# 循环扫描算法（C-SCAN）

SCAN 算法对于各个位置磁道的响应频率不平均，而 C-SCAN 算法就是为了解决这个问题。规定只有磁头朝某个特定方向移动时才处理磁道访问请求，而返回时直接快速移动至起始端而不处理任何请求。

优点：比起 SCAN 算法，对于各个位置磁道的响应频率很平均

缺点：只有到达最边上的磁道时才能改变磁头方向。比起 SCAN 算法来，平均寻道时间更长

# C-LOOK 调度算法

C-SCAN 算法的主要缺点是只有到达最边上的磁道时才能改变磁头方向，并且磁头返回时不一定需要返回到最边缘的磁道上。C-LOOK 算法就是为了解决这个问题的。如果磁头移动的方向上已经没有磁道访问请求了，就可以立即让磁头返回，并且磁头只需要返回到有磁道访问请求的位置即可

优点：比起 C-SCAN 算法，不需要每次都移动到最外侧或最内侧才改变磁头方向，使寻道时间进一步缩短

# 减少磁盘延迟时间的方法

磁头读入一个扇区数据后需要一小段时间处理，如果逻辑上相邻的扇区在物理上也相邻，则读入几个连续的逻辑扇区，可能需要很长的 "延迟时间"

# 减少延迟时间方法：交替编号

若采用交替编号的策略，即让逻辑上相邻的扇区在物理上有一定的间隔，可以使读取连续的逻辑扇区所需要的延迟时间更小

# 磁盘地址结构的设计

为什么磁盘的物理地址是（柱面号，盘面号，扇区号）而不是（盘面号，柱面号，扇区号）

读取地址连续的磁盘块时，采用（柱面号，盘面号，扇区号）的地址结构可以减少磁头移动消耗的时间

# 减少延迟时间方法：错位命名

让相邻盘面的扇区编号错位

原理：与交替编号的原理相同，错位命名法可以降低延迟时间

# 磁盘的管理

# 磁盘初始化

进行低级格式化（物理格式化），将磁盘的各个磁道划分为扇区。一个扇区通常可分为头、数据区域、尾三个部分组成。管理扇区所需要的各种数据结构一般存放在头、尾两个部分，包括扇区检验码（如奇偶校验、CRC 等，校验码用于校验扇区中的数据是否发生错误）
将磁盘分区，每个分区由若干柱面组成（即分为我们熟悉的 C 盘、D 盘、F 盘）
进行逻辑格式化，创建文件系统。包括创建文件系统的根目录、初始化存储空间管理所用的数据结构

# 引导块

引导块：计算机开机时需要进行一系列初始化的工作，这些初始化工作是通过执行初始化程序（自举程序）完成的

初始化程序可以放在 ROM（只读存储器）中，ROM 中的数据在出厂时就写入了，并且以后不能再修改

注：ROM 一般是出厂时就集成在主板上的

ROM 中只存放很小的 "自举装入程序"，完整的自举程序放在磁盘的启动块（即引导块 / 启动分区）上，启动块位于磁盘的固定位置

开机时计算机先运行 "自举装入程序"，通过执行该程序就可以找到引导块，并将完整的 "自举程序" 读入内存，完成初始化

拥有启动分区的磁盘称为启动磁盘或系统磁盘（C 盘）

# 坏块的管理

坏了，无法正常使用的扇区就是坏块。这属于硬件故障，操作系统无法修复的。应该将坏块标记出来，以免错误地使用到它

对于简单的磁盘，可以在逻辑格式化时（建立文件系统时）对整个磁盘进行坏块检查，标明哪些扇区是坏扇区，比如：在 FAT 表上表明（在这种方式中，坏块对操作系统不透明）

对于复杂的磁盘，磁盘控制器（磁盘设备内部的一个硬件部件）会维护一块坏块链表

在磁盘出厂前进行低级格式化（物理格式化）时就将坏块链进行初始化

会保留一些 "备用扇区"，用于替换坏块。这种方案称为扇区备用、且这种处理方式中，坏块对操作系统透明。

# 固态硬盘 SSD

原理：基于闪存技术 Flash Memory，属于电可擦除 ROM，即 EEPROM
组成：
- 闪存翻译层：负责翻译逻辑模块号，找到对应页
- 存储介质：多个闪存芯片 (Flash Chip)—— 每个芯片包含多个块 —— 每个块包含多个页
读写性能特性：
- 以页为单位读 / 写 —— 相当于磁盘的扇区
- 以块为单位擦除，擦干净的块，其中的每一页都可以写一次，读无限次
- 支持随机访问，系统给定一个逻辑地址，闪存翻译层可通过电路迅速定位到对应的物理地址
- 读快、写慢。要写的页如果有数据，则不能写入，需要块内其他页全部复制到一个新的 (擦除过的) 块中，再写入新的页
与机械硬盘相比的特点：
- SSD 读写速度快、随机访问性能高，用电路控制访问位置；机械硬盘通过移动磁臂旋转磁盘控制访问位置，有寻道时间和旋转延迟
- SSD 安静无噪音、耐摔抗震、能耗低、造价更贵
- SSD 的一个块被擦除次数过多 (重复写同一个块) 可能会坏掉，而机械硬盘的扇区不会因为写的次数太多而坏掉
磨损均衡技术
- 思想：将 "擦除" 平均分布在各个块上，以提升使用寿命
- 动态磨损均衡：写入数据时，优先选择累计擦除次数少的新闪存块
- 静态磨损均衡：SSD 监测并自动进行数据分配、迁移，让老旧的闪存块承担以读为主的存储任务，让较新的闪存块承担更多的写任务

理想情况下，固态硬盘的寿命：

某固态硬盘采用磨损均衡技术，大小为 $2^{40}B=1TB$ ，闪存块的擦写寿命只有 $2^{10}=1K$ 次。某男子平均每天会对该固态硬盘写 $2^{37}B=128GB$ 数据。在最理想的情况下，这个固态硬盘可以用多久？

最理想情况下，SSD 中每个块被擦除的次数都是完全均衡的。 $1TB/128G=8$

因此平均每 8 天，每个闪存块就要被擦除一次。每个闪存块可以被擦除 $1K$ 次。因此经过 $8K$ 天，约 23 年后，该固态硬盘损坏