# 调度

当有一堆任务要处理,由于资源有限,这些事情没办法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是 "调度" 研究的问题

# 调度的三个层次

高级调度

作业:一个具体的任务

高级调度:按一定的原则从外存的作业后备队列挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立 PCB,调出时才撤销 PCB

低级调度(进程调度 / 处理机调度)

按照某种策略从就绪队列中选取一个进程,将处理机分配给它

进程调度是操作系统中最基本的一种调度,在一般的操作系统中都是必须配置进程调度

进程调度的频率很高,一般几十毫秒一次

中级调度

内存不够时,可将某些进程的数据调出外存。等内存空间空闲或者进程需要运行时再重新调入内存

暂时调到外存等待的进程状态为挂起状态,被挂起的进程 PCB 会被组织成挂起队列

中级调度 (内存调度):按照某种策略决定将哪个处于挂起状态的进程重新调入内存

一个进程可能会多次被调出、调入内存,因此中级调度发生的频率要比高级调度更高

七状态模型

三层调度联系对比:

要做什么调度发生在发生频率对进程状态的影响
高级调度 (作业调度)按照某种规划,从后备队列中选择合适的作业将其调入内存,并为其创建进程外存 -> 内存 (面向作业)最低无 -> 创建态 -> 就绪态
中级调度 (内存调度)按照某种规则,从挂起队列中选择合适的进程将其数据调回内存外存 -> 内存 (面向进程)中等挂起态 -> 就绪态 (阻塞挂起 -> 阻塞态)
低级调度 (进程调度)按照某种规则,从就绪队列中选择一个进程为其分配处理机内存 ->CPU最高就绪态 -> 运行态

# 进程调度的时机、切换与过程

# 进程调度

需要进行进程调度与切换的情况:

  • 当前运行的进程主动放弃处理机
    • 进程正常终止
    • 运行过程中发生异常而终止
    • 进程主动请求阻塞 (如等待 I/O)
  • 当前运行的进程被动放弃处理机
    • 分给进程的时间片用完
    • 有更紧急的事需要处理 (如 I/O 中断)
    • 有更高优先级的进程进入就绪队列

不能进行进程调度与切换的情况

  • 在处理中断的过程中,中断处理过程复杂,与硬件密切相关,很难做到在中断处理过程中进行进程切换
  • 进程在操作系统内核程序临界区中
  • 在原子操作过程中 (原语)。原子操作不可中断,要一气呵成

注意:

  • 进程在操作系统内核程序临界区中不能进行调度与切换 —— 正确
  • 进程处于临界区时不能进行处理机调度 —— 错误

临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源

临界区:访问临界资源的那段代码

内核程序临界区一般是用来访问某种内核数据结构的,比如进程就绪队列 (由各就绪进程的 PCB 组成)

  • 如果还没退出临界区 (还没解锁) 就进行进程调度,但是进程调度相关的程序也需要访问就绪队列,但此时就绪队列被锁住了,因此无法顺利进行进程调度。

  • 内核程序临界区访问的临界资源如果不尽快释放的话,极有可能影响到操作系统内核的其他管理工作,因此在访问内核程序临界区期内不能进行调度与切换

  • 在打印机打印完成之前,进程一直处于临界区内,临界资源不会解锁。但打印机又是慢速设备,此时如果一直不允许进程调度的话就会导致 CPU 一直空闲

  • 普通临界区访问的临界资源不会影响操作系统内核的管理工作,因此在访问普通临界区时可以进行调度与切换

# 进程调度的方式

非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即使有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态

  • 实现简单,系统开销小但是无法及时处理紧急任务,适用于早期的批处理系统

剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要的或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配更重要紧迫的那个进程

  • 可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能 (通过时钟中断)。适用于分时操作系统,实时操作系统

# 进程的切换与过程

"狭义的进程调度" 与 "进程切换" 的区别

狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可以是另一个进程,后一种情况就需要进程切换)

进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程

广义的进程调度包含了选择一个进程和进程切换两个步骤。

进程切换的过程

  • 对原来运行进程各种数据的保存
  • 对新的进程各种数据的恢复

注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少

# 调度器和闲逛进程

调度器 / 调度程序

就绪态到运行态的转换中,被调度程序选中和时间用完导致的转换由调度程序引起,调度程序决定:

  • 让谁运行 —— 调度算法
  • 运行多长时间 —— 时间片大小

调度时机 —— 什么事件会触发 "调度程序"

  • 创建新的进程

  • 进程退出

  • 运行进程阻塞

  • I/O 中断发生 (可能唤醒某些阻塞进程)

  • 非抢占式调度策略,只有运行进程阻塞或退出才触发调度程序工作

  • 抢占式调度策略,每个时钟中断或 k 个时钟中断会触发调度程序工作

对于不支持内核级线程的操作系统,调度程序的处理对象是进程

支持内核级线程的操作系统,调度程序的处理对象是内核线程

闲逛进程

当没有其他就绪进程是时,运行闲逛进程

闲逛进程的特性:

  • 优先级最低
  • 可以是 0 地址指令,占一个完整的指令周期 (指令周期末尾例行检查中断)
  • 能耗低

# 调度算法的评价指标

CPU 利用率

CPU 利用率:指 CPU 忙碌的时间占总时间的比例

利用率 = 忙碌的时间 / 总时间

系统吞吐量

系统吞吐量:单位时间内完成作业的数量

系统吞吐量 = 总共完成了多少道作业 / 总共花了多少时间

周转时间

周转时间:指从作业被提交给系统开始,到作业完成为止的这段时间间隔

它包括四部分:

  • 作业在外存后备队列上等待作业调度 (高级调度) 的时间
  • 进程在就绪队列上等待进程调度 (低级调度) 的时间
  • 进程在 CPU 上执行的时间
  • 进程等待 I/O 操作完成的时间

后三项在一个作业的整个处理中,可能发生多次

(作业) 周转时间 = 作业完成时间 - 作业提交时间

平均周转时间 = 各作业周转时间之和 / 作业数

带权周转时间 = 作业周转时间 / 作业实际运行的时间 =(作业完成时间 - 作业提交时间)/ 作业实际运行的时间

平均带权周转时间 = 各作业带权周转时间 / 作业数

等待时间

等待时间:指进程 / 作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低

对于进程来说,等待时间就是进程建立之后等待被服务的时间之和,在等待 I/O 完成的期间其实进程也是在被服务的,所以不计入等待时间。

对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间

一个作业总共需要被 CPU 服务多久,被 I/O 设备服务多久一般是确定不变的,因此调度算法其实只会影响作业 / 进程的等待时间。

同理,也有平均等待时间指标

响应时间

响应时间:指从用户提交请求到首次产生响应所用的时间

# 调度算法

# 先来先服务 (FCFS)

  • 算法思想:主要从 "公平" 的角度考虑
  • 算法规则:按照作业 / 进程到达的先后顺序进行服务
  • 用于作业 / 进程调度:用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列
  • 是否可抢占:非抢占式算法
  • 优缺点
    • 优点:公平、算法实现简单
    • 缺点:排在长作业 (进程) 后面的短作业需要等待很长时间,带全周期时间很大,对短作业来说用户体验不好。即 FCFS 算法对长作业有利,对短作业不利
  • 是否会导致饥饿:不会

# 短作业优先 (SJF)

  • 算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间
  • 算法规则:最短的作业 / 进程优先得到服务 (所谓 "最短",是要求服务时间最短)
  • 用于作业 / 进程调度:即可用于作业调度,也可用于进程调度。用于进程调度时称为 "短进程优先算法 (SPF)"
  • 是否可抢占:SJF 和 SPF 是非抢占式算法,但是也有抢占式算法 —— 最短剩余时间优先算法 (SRTN)
    • 最短剩余时间优先算法:每当有进程加入就绪队列改变时就需要调整调度,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度
  • 优缺点:
    • 优点:"最短的(不严谨)" 平均等待时间、平均周转时间
    • 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业 / 进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的最短作业优点
  • 是否会导致饥饿:会。如果源源不断地有短作业 / 进程到来,可能是长作业 / 进程长时间得不到服务,产生饥饿现象

# 高响应比优先 (HRRN)

  • 算法思想:要综合考虑作业 / 进程的等待时间和要求服务的时间
  • 算法规则:在每次调度时先计算各个作业 / 进程的响应比,选择响应比最高的作业 / 进程为其服务
    • 响应比:(等待时间 + 要求服务时间)/ 要求服务时间
  • 用于作业 / 进程调度:既可用于作业调度,也可用于进程调度
  • 是否可以抢占:非抢占式的算法。因此只有当前运行的作业 / 进程主动放弃处理机时,才需要调度,才需要计算响应比
  • 优缺点:
    • 综合考虑了等待时间和运行时间 (要求服务时间)
    • 等待时间相同时,要求服务时间短的有限 (SJF 的优点)
    • 要求服务时间相同时,等待时间长的有限 (PCS 的优点)
    • 对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
    • 是否会导致饥饿:不会

这三种算法一般适合用于早期的批处理系统。

# 时间片轮转调度算法 (RR)

  • 算法思想:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
  • 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片。若进程未在一个时间片内执行完,则剥夺处理机。将进程重新放回就绪队列队尾重新排队
  • 用于作业 / 进程调度:用于进程调度 (只有作业放入内存建立了相应进程后,才能被分配处理机时间片)
  • 是否可抢占:若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知 CPU 时间片已到
    • 如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。
    • 另一方面,进程调度、切换是有时间代价的 (保存、恢复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少,可见时间片也不能太小
    • 一般来说,设计时间片时要让切换进程的开销占比不超过 1%
  • 优缺点:
    • 优点:公平;响应快,适用于分时操作系统
    • 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度
  • 是否会导致饥饿:不会

# 优先级调度算法

  • 算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
  • 算法规则:每个作业 / 进程由各自的优先级,调度时选择优先级最高的作业 / 进程
  • 用于作业 / 进程:既可用于作业调度,也可用于进程调度和 I/O 调度
  • 是否可抢占:抢占式、非抢占式都有
    • 非抢占式需要在进程主动放弃处理机时进行调度即可
    • 抢占式还需在就绪队列变化时,检查是否会发生抢占
  • 优缺点:
    • 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整各种作业 / 进程的偏好程度。
    • 缺点:若源源不断地有高优先级进程到达,则可能导致饥饿
  • 是否会导致饥饿:会
  • 补充:
    • 就绪队列未必只有一个,可以按照不同优先级来组织。另外,也可以把优先级高的进程排在更靠近队头的位置
    • 根据优先级是否可以改变,可将优先级分为静态优先级和动态优先级两种
    • 静态优先级:创建进程时确定,之后一直不变
    • 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级
      • 可以从追求公平、提升资源利用率等角度考虑
      • 如果某进程在就绪队列中等待了很长时间,则可以适当提升其优先级
      • 如果某进程占用处理机运行了很长时间,则可适当降低其优先级
    • 通常:系统进程优先级高于用户进程;前台进程优先级高于后台进程;操作系统更偏好 I/O 型进程 (或称 I/O 繁忙型进程)
      • 注:与 I/O 型进程相对的是计算型进程 (或称 CPU 繁忙型进程)
      • I/O 设备和 CPU 可以并行工作。如果优先让 I/O 繁忙型进程优先运行的话,则越有可能让 I/O 设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升

# 多级反馈队列调度算法

  • 算法思想:对其他调度算法的折中权衡

  • 算法规则:

    • 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
    • 新进程到达时先进入第 1 级队列,按 FCFS 原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是最下级的队列,则重新放回该队列队尾
    • 只有第 k 级队列为空时,才为 k+1 级队头的进程分配时间片
  • 用于作业 / 进程调度:用于进程调度

  • 是否可抢占:抢占式的算法:在 k 级队列的进程运行过程中,若更上级的队列 (1~k-1 级) 中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来的进程放回 k 级队列队尾

  • 优缺点:对各类型进程相对公平 (FCFS 的优点);每个新到达的进程都可以很快就得到响应 (RR 的优点);短进程只用较少的时间就可完成 (SPF 的优点);不必实现估计进程的运行时间 (避免用户作假);可灵活地调整对各类进程的偏好程度,比如 CPU 密集型进程、I/O 密集型进程(拓展:可以将因 I/O 而阻塞的进程重新放回原队列,这样 I/O 型进程就可以保持较高优先级)

  • 是否会导致饥饿:会

# 多级队列调度算法

系统中按进程类型设置多个队列,进程创建成功后插入某个队列

队列之间可采取固定优先级,或时间片

  • 系统进程:优先级调度
  • 交互式进程:RR 时间片轮转调度
  • 批处理进程:FCFS 调度