# 调度
当有一堆任务要处理,由于资源有限,这些事情没办法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是 "调度" 研究的问题
# 调度的三个层次
高级调度
作业:一个具体的任务
高级调度:按一定的原则从外存的作业后备队列挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立 PCB,调出时才撤销 PCB
低级调度(进程调度 / 处理机调度)
按照某种策略从就绪队列中选取一个进程,将处理机分配给它
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都是必须配置进程调度
进程调度的频率很高,一般几十毫秒一次
中级调度
内存不够时,可将某些进程的数据调出外存。等内存空间空闲或者进程需要运行时再重新调入内存
暂时调到外存等待的进程状态为挂起状态,被挂起的进程 PCB 会被组织成挂起队列
中级调度 (内存调度):按照某种策略决定将哪个处于挂起状态的进程重新调入内存
一个进程可能会多次被调出、调入内存,因此中级调度发生的频率要比高级调度更高
三层调度联系对比:
要做什么 | 调度发生在 | 发生频率 | 对进程状态的影响 | |
---|---|---|---|---|
高级调度 (作业调度) | 按照某种规划,从后备队列中选择合适的作业将其调入内存,并为其创建进程 | 外存 -> 内存 (面向作业) | 最低 | 无 -> 创建态 -> 就绪态 |
中级调度 (内存调度) | 按照某种规则,从挂起队列中选择合适的进程将其数据调回内存 | 外存 -> 内存 (面向进程) | 中等 | 挂起态 -> 就绪态 (阻塞挂起 -> 阻塞态) |
低级调度 (进程调度) | 按照某种规则,从就绪队列中选择一个进程为其分配处理机 | 内存 ->CPU | 最高 | 就绪态 -> 运行态 |
# 进程调度的时机、切换与过程
# 进程调度
需要进行进程调度与切换的情况:
- 当前运行的进程主动放弃处理机
- 进程正常终止
- 运行过程中发生异常而终止
- 进程主动请求阻塞 (如等待 I/O)
- 当前运行的进程被动放弃处理机
- 分给进程的时间片用完
- 有更紧急的事需要处理 (如 I/O 中断)
- 有更高优先级的进程进入就绪队列
不能进行进程调度与切换的情况
- 在处理中断的过程中,中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换
- 进程在操作系统内核程序临界区中
- 在原子操作过程中 (原语)。原子操作不可中断,要一气呵成
注意:
- 进程在操作系统内核程序临界区中不能进行调度与切换 —— 正确
- 进程处于临界区时不能进行处理机调度 —— 错误
临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源
临界区:访问临界资源的那段代码
内核程序临界区一般是用来访问某种内核数据结构的,比如进程就绪队列 (由各就绪进程的 PCB 组成)
如果还没退出临界区 (还没解锁) 就进行进程调度,但是进程调度相关的程序也需要访问就绪队列,但此时就绪队列被锁住了,因此无法顺利进行进程调度。
内核程序临界区访问的临界资源如果不尽快释放的话,极有可能影响到操作系统内核的其他管理工作,因此在访问内核程序临界区期内不能进行调度与切换
在打印机打印完成之前,进程一直处于临界区内,临界资源不会解锁。但打印机又是慢速设备,此时如果一直不允许进程调度的话就会导致 CPU 一直空闲
普通临界区访问的临界资源不会影响操作系统内核的管理工作,因此在访问普通临界区时可以进行调度与切换
# 进程调度的方式
非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即使有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态
- 实现简单,系统开销小但是无法及时处理紧急任务,适用于早期的批处理系统
剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要的或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配更重要紧迫的那个进程
- 可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能 (通过时钟中断)。适用于分时操作系统,实时操作系统
# 进程的切换与过程
"狭义的进程调度" 与 "进程切换" 的区别
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可以是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程
- 对原来运行进程各种数据的保存
- 对新的进程各种数据的恢复
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少
# 调度器和闲逛进程
调度器 / 调度程序
就绪态到运行态的转换中,被调度程序选中和时间用完导致的转换由调度程序引起,调度程序决定:
- 让谁运行 —— 调度算法
- 运行多长时间 —— 时间片大小
调度时机 —— 什么事件会触发 "调度程序"
创建新的进程
进程退出
运行进程阻塞
I/O 中断发生 (可能唤醒某些阻塞进程)
非抢占式调度策略,只有运行进程阻塞或退出才触发调度程序工作
抢占式调度策略,每个时钟中断或 k 个时钟中断会触发调度程序工作
对于不支持内核级线程的操作系统,调度程序的处理对象是进程
支持内核级线程的操作系统,调度程序的处理对象是内核线程
闲逛进程
当没有其他就绪进程是时,运行闲逛进程
闲逛进程的特性:
- 优先级最低
- 可以是 0 地址指令,占一个完整的指令周期 (指令周期末尾例行检查中断)
- 能耗低
# 调度算法的评价指标
CPU 利用率
CPU 利用率:指 CPU 忙碌的时间占总时间的比例
利用率 = 忙碌的时间 / 总时间
系统吞吐量
系统吞吐量:单位时间内完成作业的数量
系统吞吐量 = 总共完成了多少道作业 / 总共花了多少时间
周转时间
周转时间:指从作业被提交给系统开始,到作业完成为止的这段时间间隔
它包括四部分:
- 作业在外存后备队列上等待作业调度 (高级调度) 的时间
- 进程在就绪队列上等待进程调度 (低级调度) 的时间
- 进程在 CPU 上执行的时间
- 进程等待 I/O 操作完成的时间
后三项在一个作业的整个处理中,可能发生多次
(作业) 周转时间 = 作业完成时间 - 作业提交时间
平均周转时间 = 各作业周转时间之和 / 作业数
带权周转时间 = 作业周转时间 / 作业实际运行的时间 =(作业完成时间 - 作业提交时间)/ 作业实际运行的时间
平均带权周转时间 = 各作业带权周转时间 / 作业数
等待时间
等待时间:指进程 / 作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低
对于进程来说,等待时间就是进程建立之后等待被服务的时间之和,在等待 I/O 完成的期间其实进程也是在被服务的,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间
一个作业总共需要被 CPU 服务多久,被 I/O 设备服务多久一般是确定不变的,因此调度算法其实只会影响作业 / 进程的等待时间。
同理,也有平均等待时间指标
响应时间
响应时间:指从用户提交请求到首次产生响应所用的时间
# 调度算法
# 先来先服务 (FCFS)
- 算法思想:主要从 "公平" 的角度考虑
- 算法规则:按照作业 / 进程到达的先后顺序进行服务
- 用于作业 / 进程调度:用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列
- 是否可抢占:非抢占式算法
- 优缺点
- 优点:公平、算法实现简单
- 缺点:排在长作业 (进程) 后面的短作业需要等待很长时间,带全周期时间很大,对短作业来说用户体验不好。即 FCFS 算法对长作业有利,对短作业不利
- 是否会导致饥饿:不会
# 短作业优先 (SJF)
- 算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间
- 算法规则:最短的作业 / 进程优先得到服务 (所谓 "最短",是要求服务时间最短)
- 用于作业 / 进程调度:即可用于作业调度,也可用于进程调度。用于进程调度时称为 "短进程优先算法 (SPF)"
- 是否可抢占:SJF 和 SPF 是非抢占式算法,但是也有抢占式算法 —— 最短剩余时间优先算法 (SRTN)
- 最短剩余时间优先算法:每当有进程加入就绪队列改变时就需要调整调度,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度
- 优缺点:
- 优点:"最短的(不严谨)" 平均等待时间、平均周转时间
- 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业 / 进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的最短作业优点
- 是否会导致饥饿:会。如果源源不断地有短作业 / 进程到来,可能是长作业 / 进程长时间得不到服务,产生饥饿现象
# 高响应比优先 (HRRN)
- 算法思想:要综合考虑作业 / 进程的等待时间和要求服务的时间
- 算法规则:在每次调度时先计算各个作业 / 进程的响应比,选择响应比最高的作业 / 进程为其服务
- 响应比:(等待时间 + 要求服务时间)/ 要求服务时间
- 用于作业 / 进程调度:既可用于作业调度,也可用于进程调度
- 是否可以抢占:非抢占式的算法。因此只有当前运行的作业 / 进程主动放弃处理机时,才需要调度,才需要计算响应比
- 优缺点:
- 综合考虑了等待时间和运行时间 (要求服务时间)
- 等待时间相同时,要求服务时间短的有限 (SJF 的优点)
- 要求服务时间相同时,等待时间长的有限 (PCS 的优点)
- 对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
- 是否会导致饥饿:不会
这三种算法一般适合用于早期的批处理系统。
# 时间片轮转调度算法 (RR)
- 算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
- 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片。若进程未在一个时间片内执行完,则剥夺处理机。将进程重新放回就绪队列队尾重新排队
- 用于作业 / 进程调度:用于进程调度 (只有作业放入内存建立了相应进程后,才能被分配处理机时间片)
- 是否可抢占:若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知 CPU 时间片已到
- 如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。
- 另一方面,进程调度、切换是有时间代价的 (保存、恢复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少,可见时间片也不能太小
- 一般来说,设计时间片时要让切换进程的开销占比不超过 1%
- 优缺点:
- 优点:公平;响应快,适用于分时操作系统
- 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度
- 是否会导致饥饿:不会
# 优先级调度算法
- 算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
- 算法规则:每个作业 / 进程由各自的优先级,调度时选择优先级最高的作业 / 进程
- 用于作业 / 进程:既可用于作业调度,也可用于进程调度和 I/O 调度
- 是否可抢占:抢占式、非抢占式都有
- 非抢占式需要在进程主动放弃处理机时进行调度即可
- 抢占式还需在就绪队列变化时,检查是否会发生抢占
- 优缺点:
- 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整各种作业 / 进程的偏好程度。
- 缺点:若源源不断地有高优先级进程到达,则可能导致饥饿
- 是否会导致饥饿:会
- 补充:
- 就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置
- 根据优先级是否可以改变,可将优先级分为静态优先级和动态优先级两种
- 静态优先级:创建进程时确定,之后一直不变
- 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级
- 可以从追求公平、提升资源利用率等角度考虑
- 如果某进程在就绪队列中等待了很长时间,则可以适当提升其优先级
- 如果某进程占用处理机运行了很长时间,则可适当降低其优先级
- 通常:系统进程优先级高于用户进程;前台进程优先级高于后台进程;操作系统更偏好 I/O 型进程 (或称 I/O 繁忙型进程)
- 注:与 I/O 型进程相对的是计算型进程 (或称 CPU 繁忙型进程)
- I/O 设备和 CPU 可以并行工作。如果优先让 I/O 繁忙型进程优先运行的话,则越有可能让 I/O 设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升
# 多级反馈队列调度算法
算法思想:对其他调度算法的折中权衡
算法规则:
- 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
- 新进程到达时先进入第 1 级队列,按 FCFS 原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是最下级的队列,则重新放回该队列队尾
- 只有第 k 级队列为空时,才为 k+1 级队头的进程分配时间片
用于作业 / 进程调度:用于进程调度
是否可抢占:抢占式的算法:在 k 级队列的进程运行过程中,若更上级的队列 (1~k-1 级) 中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来的进程放回 k 级队列队尾
优缺点:对各类型进程相对公平 (FCFS 的优点);每个新到达的进程都可以很快就得到响应 (RR 的优点);短进程只用较少的时间就可完成 (SPF 的优点);不必实现估计进程的运行时间 (避免用户作假);可灵活地调整对各类进程的偏好程度,比如 CPU 密集型进程、I/O 密集型进程(拓展:可以将因 I/O 而阻塞的进程重新放回原队列,这样 I/O 型进程就可以保持较高优先级)
是否会导致饥饿:会
# 多级队列调度算法
系统中按进程类型设置多个队列,进程创建成功后插入某个队列
队列之间可采取固定优先级,或时间片
- 系统进程:优先级调度
- 交互式进程:RR 时间片轮转调度
- 批处理进程:FCFS 调度