操作系统 408-5-2 - 操作系统 - 计算机科学 | Flüstern = Whispering's Blog = 无需过去，无关未来，只有现在

# I/O 核心子系统

属于操作系统的内核部分，即 I/O 系统，或称 I/O 核心子系统：

设备独立性软件
- I/O 调度、设备保护；设备分配与回收、缓冲区管理（即缓冲与高速缓存）
  - I/O 调度：用某种算法确定一个好的顺序来处理各个 I/O 请求
  - 设备保护：操作系统需要实现文件保护功能；不同用户对各个文件有不同的访问权限
设备驱动程序
中断处理程序

用户层软件：假脱机技术（SPOOLing 技术）（归为 I/O 核心子系统可实现功能）

# 假脱机（SPOOLing）技术

# 脱机技术

批处理阶段引入了脱机输入 / 输出技术（用磁带完成）

在外围控制机的控制下，慢速输入设备的数据先被输入到更快速的磁带上。之后主机可以从快速的磁带上读入数据，从而缓解了速度矛盾

引入脱机技术后，缓解了 CPU 与慢速 I/O 设备的速度矛盾。另一方面，即使 CPU 在忙碌，也可以提前将数据输入到磁带；即使慢速的输出设备正在忙碌，也可以提前将数据输出到磁带

# 假脱机技术 —— 输入井和输出井

假脱机技术，又称 SPOOLing 技术，是用软件的方式模拟脱机技术。SPOOLing 系统的组成如下：

输入井和输出井

"输入进程" 模拟脱机输入时的外围控制机，"输出进程" 模拟脱机输出时的外围控制机

要实现 SPOOLing 技术，必须要有多道程序技术的支持。系统会建立 "输入进程" 和 "输出进程"

注意，输入缓冲区和输出缓冲区是在内存的缓冲区

在输入进程的控制下，"输入缓冲区" 用于暂存从输入设备输入的数据，之后再转存到输入井中

在输出进程的控制下，"输出缓冲区" 用于暂存从输出井送来的数据，之后再传送到到输入设备中

# 共享打印机原理

独占式设备 —— 只允许各个进程串行使用的设备。一段时间内只能满足一个进程的请求

共享设备 —— 允许多个进程 "同时" 使用的设备（宏观上同时使用，微观上可能是文件交替使用）。可以同时满足多个进程的使用请求

打印机是 "独占式设备"，但是可以用 SPOOLing 技术改造成 "共享设备"

当多个用户进程提出输出打印的请求时，系统会答应它们的请求，但是并不是真正把打印机分配给它们，而是由假脱机管理进程为每个进程做两件事

在磁盘输出井中为进程申请一个空闲缓冲区（也就是说，这个缓冲区是在磁盘上建立的），并将要打印的数据送入其中
为用户进程申请一张空白的打印请求表，并将用户的打印请求填入表中（其实就是用来说明用户的打印数据存放位置等信息的），再将该表挂到假脱机文件队列上

当打印机空闲时，输入进程会从文件队列的队头取出一张打印请求表，并根据表中的要求将要打印的数据从输出井传送到输出缓冲区，再输出到打印机进行打印。用这种方式可依次处理完全部的打印任务

虽然系统中只有一台打印机，但是每个进程提出打印请求时，系统都会为在输出井中为其分配一个存储区（相当于分配了一个逻辑设备），使每个用户进程都觉得自己在独占一台打印机，从而实现对打印机的共享

SPOOLing 技术可以把一台物理设备虚拟成逻辑上的多台设备，可将独占式设备改造成共享设备

# 设备的分配与回收

# 设备分配时应考虑的因素

设备的固有属性

设备的固定属性可分为：独占设备、共享设备、虚拟设备

独占式设备 —— 只允许各个进程串行使用的设备。一段时间内只能满足一个进程的请求

共享设备 —— 允许多个进程 "同时" 使用的设备（宏观上同时使用，微观上可能是文件交替使用）。可以同时满足多个进程的使用请求

虚拟设备 —— 采用 SPOOLing 技术将独占设备改造成虚拟的共享设备，可同时分配给多个进程使用（如采用 SPOOLing 技术实现的共享打印机）

设备分配算法

先来先服务、优先级高者优先、短任务优先

设备分配中的安全性

从进程运行的安全性上考虑，设备分配有两种方式：

安全分配方式：为进程分配一个设备后就将进程阻塞，本次 I/O 完成后才将进程唤醒。

一个时间段内每个进程只能使用一个设备
优点：破坏了请求和保持的条件，不会死锁
缺点：对于一个进程来说，CPU 与 I/O 设备只能串行工作

不安全分配方式：进程发出 I/O 后，系统为其分配 I/O 设备，进程可继续执行，之后还可以发出新的 I/O 请求。只有某个 I/O 请求得不到满足时才将进程阻塞

一个进程可以同时使用多个设备
优点：进程的计算任务和 I/O 任务可以并行处理，使进程迅速推进
缺点：有可能发生死锁（死锁避免、死锁的检测和解除）

# 静态分配和动态分配

静态分配：进程运行前为其分配全部所需资源，运行结束后归还资源

动态分配：进程运行过程中动态申请设备资源

# 设备分配管理中的数据结构

设备、控制器、通道之间的关系：

一个通道可控制多个控制器，每个设备控制器可控制多个设备

控制设备表（DCT）：系统为每个设备配置一张 DCT，用于记录设备情况

设备类型
设备标识符：即物理设备名，系统中的每个设备的物理设备名唯一
设备状态：忙碌 / 空闲 / 故障
指向控制器的指针：每个设备由一个控制器控制，该指针可找到相应控制器的信息
重复执行次数或时间：当重复执行多次 I/O 操作后扔不成立，才认为此次 I/O 失败
设备队列的队首指针：指向正在等待该设备的进程队列（由进程 PCB 组成队列）

设备控制表（COCT）：每个设备控制器都会对应一张 COCT，操作系统根据 COCT 的信息对控制器进行操作和管理

控制器标识符：各个控制器的唯一标识符
控制器状态：忙碌 / 空闲 / 故障
指向通道表的指针：每个控制器由一个通道控制，该指针可找到相应通道的信息
控制器队列的队首指针
控制器队列的队尾指针：指向正在等待该控制器的进程队列（由进程 PCB 组成队列）

通道控制表（CHCT）：每个通道都会对应一张 DHCT。操作系统根据 CHCT 的信息对通道进行操作和管理

通道标识符：各个通道的唯一 ID
通道状态：忙碌 / 空闲 / 故障
与通道连接的控制器首址：可通过该指针找到该通道管理的所有控制器相关信息（COCT）
通道队列的队首指针
通道队列的队尾指针：指向正在等待该通道的进程队列（由进程 PCB 组成队列）

系统设备表（SDT）：记录了系统中全部设备的情况，每个设备对应一个表目。

每个表目中由设备类型、设备标识符、DCT、驱动程序入口组成

# 设备分配的步骤

根据进程请求的物理设备名查找 SDT（注：物理设备名是进程请求分配时提供的参数）
根据 SDT 找到 DCT，若设备忙碌则将进程 PCB 挂到设备等待队列中，不忙碌则将设备分配给进程
根据 DCT 找到 COCT，若控制器忙碌则将进程 PCB 挂到控制器等待队列中，不忙碌则将控制器分配给进程
根据 COCT 找到 CHCT，若通道忙碌则将进程 PCB 挂到通道等待队列中，不忙碌则将通道分配给进程

注：只有设备、控制器、通道三设备都分配成功时，这次设备才算成功，之后便可启动 I/O 设备进行数据传送

缺点：

用户编程时必须使用 "物理设备名"，底层细节对用户不透明，不方便编程
若换了一个物理设备，则程序无法运行
若进程请求的物理设备正在忙碌，则即使用系统中还有同类型的设备，进程也必须阻塞等待

改进方法：建立逻辑设备名与物理设备名的映射机制，用户编程时只需提供逻辑设备名

设备分配步骤改进

根据进程请求的逻辑设备名查找 SDT（注：用户编程时提供的逻辑设备名其实就是 "设备类型"）
查找 SDT，找到用户进程指定类型的、并且空闲的设备，将其分配给该进程。操作系统在逻辑设备表（LUT）中新增一个表项
根据 DCT 找到 COCT，若控制器忙碌则将进程 PCB 挂到控制器等待队列中，不忙碌则将控制器分配给进程
根据 COCT 找到 CHCT，若通道忙碌则将进程 PCB 挂到通道等待队列中，不忙碌则将通道分配给进程

逻辑设备表（LUT）建立了逻辑设备名与物理设备名之间的映射关系

某用户进程第一次使用逻辑设备名向操作系统发出请求，操作系统根据用户进程指定的设备类型（逻辑设备名）查找系统设备表。找到一个空闲设备分配给进程，并在 LUT 中增加相应表项

如果之后用户进程再次通过相同的逻辑设备名请求使用设备，则操作系统通过 LUT 表即可知道用户进程实际要使用的是哪个物理设备了，并且也能知道该设备的驱动程序入口地址

逻辑设备表的设置问题：

整个系统只有一张逻辑设备表 LUT：各用户所用的逻辑设备名不允许重复，适用于单用户操作系统

每个用户一张 LUT：不同的用户的逻辑设备名可重复，适用于多用户操作系统

# 缓冲区管理

缓冲区是一个存储区域，可以由专门的硬件寄存器组成，也可以利用内存作为缓冲区

使用硬件作为缓冲区的成本较高，容量也较小，一般仅用在对速度要求非常高的场合（如存储器管理中所用的联想寄存器，由于对页表的访问频率极高，因此使用速度很快的联想寄存器来存放页表项的副本）

一般情况下，更多的是利用内存作为缓冲区，"设备独立性软件" 的缓冲区管理就是要组织管理好这些缓冲区

缓冲区的作用

缓和 CPU 和 I/O 设备之间速度不匹配的矛盾
减少对 CPU 的中断频率，放宽对 CPU 中断相应时间的限制
解决数据粒度不匹配的问题
提高 CPU 与 I/O 设备之间的并行性

单缓冲

假设某用户进程请求某种块设备读入若干块的数据。若采用单缓冲的策略，操作系统会在主存中为其分配一个缓冲区（若题目中没有特别说明，一个缓冲区的大小就是一个块）。

注意：当缓冲区数据非空时，不能往缓冲区冲入数据，只能从缓冲区把数据传出；当缓冲区为空时，可以往缓冲区冲入数据，但必须把缓冲区充满以后才能从缓冲区把数据传出

结论：采用单缓冲区的策略，处理一块数据平均耗时 Max (C,T)+M（其中，C 为 CPU 处理数据时间，M 为缓冲区传输数据到用户进程工作区时间，T 为块设备将数据传入缓冲区的时间）

双缓冲

假设某用户进程请求某种块设备读入若干块的数据。若采用单缓冲的策略，操作系统会在主存中为其分配两个缓冲区（若题目中没有特别说明，一个缓冲区的大小就是一个块）。

假设初始状态为：工作区空，其中一个缓冲区满，另一个缓冲区空

结论：采用双缓冲区，处理一个数据块的平均耗时为 Max (T,C+M)

使用单 / 双缓冲区在通信时的区别

单缓冲区：在任意时刻只能实现数据的单向传输（单缓冲区）

双缓冲区：在同一时刻可以实现双向的数据传输（发送数据缓冲区，接收数据缓冲区）

循环缓冲区

将多个大小相等的缓冲区链接成一个循环队列

in 指针，指向下一个可以冲入数据的空缓冲区

out 指针，指向下一个可以取出数据的满缓冲区

缓冲池

缓冲池由系统中共用的缓冲区组成。这些缓冲区按使用状况可以分为：空缓冲队列、装满输入数据的缓冲队列（输入队列）、装满输出数据的缓冲队列（输出队列）

另外，根据一个缓冲区在实际运算中扮演的功能不同，又设置了四种工作缓冲区：用于收容输入数据的工作缓冲区（hin），用于提取输入数据的工作缓冲区（sin）、用于收容输出数据的工作缓冲区（hout）、用于提取输出数据的工作缓冲区（sout）

输入进程请求输入数据
- 从空缓冲队列中取出一块作为收容输入数据的工作缓冲区（hin）。充满数据后将缓冲区挂到输入队列队尾
计算进程想要取出一块输入数据
- 从输入队列中取得一块充满输入数据的缓冲区作为 "提取输入数据的工作缓冲区（sin）"。缓冲区读空后挂到空缓冲区队列
计算进程想要将准备好的数据冲入缓冲区
- 从空缓冲队列中取出一块作为收容输入数据的工作缓冲区（hout）。充满数据后将缓冲区挂到输出队列队尾
输出进程请求输出数据
- 从输出队列中取得一块充满输入数据的缓冲区作为 "提取输入数据的工作缓冲区（sout）"。缓冲区读空后挂到空缓冲区队列