# I/O 核心子系统
属于操作系统的内核部分,即 I/O 系统,或称 I/O 核心子系统:
- 设备独立性软件
- I/O 调度、设备保护;设备分配与回收、缓冲区管理(即缓冲与高速缓存)
- I/O 调度:用某种算法确定一个好的顺序来处理各个 I/O 请求
- 设备保护:操作系统需要实现文件保护功能;不同用户对各个文件有不同的访问权限
- I/O 调度、设备保护;设备分配与回收、缓冲区管理(即缓冲与高速缓存)
- 设备驱动程序
- 中断处理程序
用户层软件:假脱机技术(SPOOLing 技术)(归为 I/O 核心子系统可实现功能)
# 假脱机(SPOOLing)技术
# 脱机技术
批处理阶段引入了脱机输入 / 输出技术(用磁带完成)
在外围控制机的控制下,慢速输入设备的数据先被输入到更快速的磁带上。之后主机可以从快速的磁带上读入数据,从而缓解了速度矛盾
引入脱机技术后,缓解了 CPU 与慢速 I/O 设备的速度矛盾。另一方面,即使 CPU 在忙碌,也可以提前将数据输入到磁带;即使慢速的输出设备正在忙碌,也可以提前将数据输出到磁带
# 假脱机技术 —— 输入井和输出井
假脱机技术,又称 SPOOLing 技术,是用软件的方式模拟脱机技术。SPOOLing 系统的组成如下:
"输入进程" 模拟脱机输入时的外围控制机,"输出进程" 模拟脱机输出时的外围控制机
要实现 SPOOLing 技术,必须要有多道程序技术的支持。系统会建立 "输入进程" 和 "输出进程"
注意,输入缓冲区和输出缓冲区是在内存的缓冲区
在输入进程的控制下,"输入缓冲区" 用于暂存从输入设备输入的数据,之后再转存到输入井中
在输出进程的控制下,"输出缓冲区" 用于暂存从输出井送来的数据,之后再传送到到输入设备中
# 共享打印机原理
独占式设备 —— 只允许各个进程串行使用的设备。一段时间内只能满足一个进程的请求
共享设备 —— 允许多个进程 "同时" 使用的设备(宏观上同时使用,微观上可能是文件交替使用)。可以同时满足多个进程的使用请求
打印机是 "独占式设备",但是可以用 SPOOLing 技术改造成 "共享设备"
当多个用户进程提出输出打印的请求时,系统会答应它们的请求,但是并不是真正把打印机分配给它们,而是由假脱机管理进程为每个进程做两件事
- 在磁盘输出井中为进程申请一个空闲缓冲区(也就是说,这个缓冲区是在磁盘上建立的),并将要打印的数据送入其中
- 为用户进程申请一张空白的打印请求表,并将用户的打印请求填入表中(其实就是用来说明用户的打印数据存放位置等信息的),再将该表挂到假脱机文件队列上
当打印机空闲时,输入进程会从文件队列的队头取出一张打印请求表,并根据表中的要求将要打印的数据从输出井传送到输出缓冲区,再输出到打印机进行打印。用这种方式可依次处理完全部的打印任务
虽然系统中只有一台打印机,但是每个进程提出打印请求时,系统都会为在输出井中为其分配一个存储区(相当于分配了一个逻辑设备),使每个用户进程都觉得自己在独占一台打印机,从而实现对打印机的共享
SPOOLing 技术可以把一台物理设备虚拟成逻辑上的多台设备,可将独占式设备改造成共享设备
# 设备的分配与回收
# 设备分配时应考虑的因素
设备的固有属性
设备的固定属性可分为:独占设备、共享设备、虚拟设备
独占式设备 —— 只允许各个进程串行使用的设备。一段时间内只能满足一个进程的请求
共享设备 —— 允许多个进程 "同时" 使用的设备(宏观上同时使用,微观上可能是文件交替使用)。可以同时满足多个进程的使用请求
虚拟设备 —— 采用 SPOOLing 技术将独占设备改造成虚拟的共享设备,可同时分配给多个进程使用(如采用 SPOOLing 技术实现的共享打印机)
设备分配算法
先来先服务、优先级高者优先、短任务优先
设备分配中的安全性
从进程运行的安全性上考虑,设备分配有两种方式:
安全分配方式:为进程分配一个设备后就将进程阻塞,本次 I/O 完成后才将进程唤醒。
- 一个时间段内每个进程只能使用一个设备
- 优点:破坏了请求和保持的条件,不会死锁
- 缺点:对于一个进程来说,CPU 与 I/O 设备只能串行工作
不安全分配方式:进程发出 I/O 后,系统为其分配 I/O 设备,进程可继续执行,之后还可以发出新的 I/O 请求。只有某个 I/O 请求得不到满足时才将进程阻塞
- 一个进程可以同时使用多个设备
- 优点:进程的计算任务和 I/O 任务可以并行处理,使进程迅速推进
- 缺点:有可能发生死锁(死锁避免、死锁的检测和解除)
# 静态分配和动态分配
静态分配:进程运行前为其分配全部所需资源,运行结束后归还资源
动态分配:进程运行过程中动态申请设备资源
# 设备分配管理中的数据结构
设备、控制器、通道之间的关系:
一个通道可控制多个控制器,每个设备控制器可控制多个设备
控制设备表(DCT):系统为每个设备配置一张 DCT,用于记录设备情况
- 设备类型
- 设备标识符:即物理设备名,系统中的每个设备的物理设备名唯一
- 设备状态:忙碌 / 空闲 / 故障
- 指向控制器的指针:每个设备由一个控制器控制,该指针可找到相应控制器的信息
- 重复执行次数或时间:当重复执行多次 I/O 操作后扔不成立,才认为此次 I/O 失败
- 设备队列的队首指针:指向正在等待该设备的进程队列(由进程 PCB 组成队列)
设备控制表(COCT):每个设备控制器都会对应一张 COCT,操作系统根据 COCT 的信息对控制器进行操作和管理
- 控制器标识符:各个控制器的唯一标识符
- 控制器状态:忙碌 / 空闲 / 故障
- 指向通道表的指针:每个控制器由一个通道控制,该指针可找到相应通道的信息
- 控制器队列的队首指针
- 控制器队列的队尾指针:指向正在等待该控制器的进程队列(由进程 PCB 组成队列)
通道控制表(CHCT):每个通道都会对应一张 DHCT。操作系统根据 CHCT 的信息对通道进行操作和管理
- 通道标识符:各个通道的唯一 ID
- 通道状态:忙碌 / 空闲 / 故障
- 与通道连接的控制器首址:可通过该指针找到该通道管理的所有控制器相关信息(COCT)
- 通道队列的队首指针
- 通道队列的队尾指针:指向正在等待该通道的进程队列(由进程 PCB 组成队列)
系统设备表(SDT):记录了系统中全部设备的情况,每个设备对应一个表目。
- 每个表目中由设备类型、设备标识符、DCT、驱动程序入口组成
# 设备分配的步骤
根据进程请求的物理设备名查找 SDT(注:物理设备名是进程请求分配时提供的参数)
根据 SDT 找到 DCT,若设备忙碌则将进程 PCB 挂到设备等待队列中,不忙碌则将设备分配给进程
根据 DCT 找到 COCT,若控制器忙碌则将进程 PCB 挂到控制器等待队列中,不忙碌则将控制器分配给进程
根据 COCT 找到 CHCT,若通道忙碌则将进程 PCB 挂到通道等待队列中,不忙碌则将通道分配给进程
注:只有设备、控制器、通道三设备都分配成功时,这次设备才算成功,之后便可启动 I/O 设备进行数据传送
缺点:
- 用户编程时必须使用 "物理设备名",底层细节对用户不透明,不方便编程
- 若换了一个物理设备,则程序无法运行
- 若进程请求的物理设备正在忙碌,则即使用系统中还有同类型的设备,进程也必须阻塞等待
改进方法:建立逻辑设备名与物理设备名的映射机制,用户编程时只需提供逻辑设备名
设备分配步骤改进
- 根据进程请求的逻辑设备名查找 SDT(注:用户编程时提供的逻辑设备名其实就是 "设备类型")
- 查找 SDT,找到用户进程指定类型的、并且空闲的设备,将其分配给该进程。操作系统在逻辑设备表(LUT)中新增一个表项
- 根据 DCT 找到 COCT,若控制器忙碌则将进程 PCB 挂到控制器等待队列中,不忙碌则将控制器分配给进程
- 根据 COCT 找到 CHCT,若通道忙碌则将进程 PCB 挂到通道等待队列中,不忙碌则将通道分配给进程
逻辑设备表(LUT)建立了逻辑设备名与物理设备名之间的映射关系
某用户进程第一次使用逻辑设备名向操作系统发出请求,操作系统根据用户进程指定的设备类型(逻辑设备名)查找系统设备表。找到一个空闲设备分配给进程,并在 LUT 中增加相应表项
如果之后用户进程再次通过相同的逻辑设备名请求使用设备,则操作系统通过 LUT 表即可知道用户进程实际要使用的是哪个物理设备了,并且也能知道该设备的驱动程序入口地址
逻辑设备表的设置问题:
整个系统只有一张逻辑设备表 LUT:各用户所用的逻辑设备名不允许重复,适用于单用户操作系统
每个用户一张 LUT:不同的用户的逻辑设备名可重复,适用于多用户操作系统
# 缓冲区管理
缓冲区是一个存储区域,可以由专门的硬件寄存器组成,也可以利用内存作为缓冲区
使用硬件作为缓冲区的成本较高,容量也较小,一般仅用在对速度要求非常高的场合(如存储器管理中所用的联想寄存器,由于对页表的访问频率极高,因此使用速度很快的联想寄存器来存放页表项的副本)
一般情况下,更多的是利用内存作为缓冲区,"设备独立性软件" 的缓冲区管理就是要组织管理好这些缓冲区
缓冲区的作用
- 缓和 CPU 和 I/O 设备之间速度不匹配的矛盾
- 减少对 CPU 的中断频率,放宽对 CPU 中断相应时间的限制
- 解决数据粒度不匹配的问题
- 提高 CPU 与 I/O 设备之间的并行性
单缓冲
假设某用户进程请求某种块设备读入若干块的数据。若采用单缓冲的策略,操作系统会在主存中为其分配一个缓冲区(若题目中没有特别说明,一个缓冲区的大小就是一个块)。
注意:当缓冲区数据非空时,不能往缓冲区冲入数据,只能从缓冲区把数据传出;当缓冲区为空时,可以往缓冲区冲入数据,但必须把缓冲区充满以后才能从缓冲区把数据传出
结论:采用单缓冲区的策略,处理一块数据平均耗时 Max (C,T)+M(其中,C 为 CPU 处理数据时间,M 为缓冲区传输数据到用户进程工作区时间,T 为块设备将数据传入缓冲区的时间)
双缓冲
假设某用户进程请求某种块设备读入若干块的数据。若采用单缓冲的策略,操作系统会在主存中为其分配两个缓冲区(若题目中没有特别说明,一个缓冲区的大小就是一个块)。
假设初始状态为:工作区空,其中一个缓冲区满,另一个缓冲区空
结论:采用双缓冲区,处理一个数据块的平均耗时为 Max (T,C+M)
使用单 / 双缓冲区在通信时的区别
单缓冲区:在任意时刻只能实现数据的单向传输(单缓冲区)
双缓冲区:在同一时刻可以实现双向的数据传输(发送数据缓冲区,接收数据缓冲区)
循环缓冲区
将多个大小相等的缓冲区链接成一个循环队列
in 指针,指向下一个可以冲入数据的空缓冲区
out 指针,指向下一个可以取出数据的满缓冲区
缓冲池
缓冲池由系统中共用的缓冲区组成。这些缓冲区按使用状况可以分为:空缓冲队列、装满输入数据的缓冲队列(输入队列)、装满输出数据的缓冲队列(输出队列)
另外,根据一个缓冲区在实际运算中扮演的功能不同,又设置了四种工作缓冲区:用于收容输入数据的工作缓冲区(hin),用于提取输入数据的工作缓冲区(sin)、用于收容输出数据的工作缓冲区(hout)、用于提取输出数据的工作缓冲区(sout)
- 输入进程请求输入数据
- 从空缓冲队列中取出一块作为收容输入数据的工作缓冲区(hin)。充满数据后将缓冲区挂到输入队列队尾
- 计算进程想要取出一块输入数据
- 从输入队列中取得一块充满输入数据的缓冲区作为 "提取输入数据的工作缓冲区(sin)"。缓冲区读空后挂到空缓冲区队列
- 计算进程想要将准备好的数据冲入缓冲区
- 从空缓冲队列中取出一块作为收容输入数据的工作缓冲区(hout)。充满数据后将缓冲区挂到输出队列队尾
- 输出进程请求输出数据
- 从输出队列中取得一块充满输入数据的缓冲区作为 "提取输入数据的工作缓冲区(sout)"。缓冲区读空后挂到空缓冲区队列