处理机调度
- 处理机调度概念
- 调度概念
- 调度时机
- 调度原则
- 调度算法
- 实时调度
- 优先级翻转
处理机调度概念
调度概念
进程切换: CPU资源的当前占用者切换
- 保存当前进程在PCB中的执行上下文(CPU状态)
- 恢复下一个进程的执行上下文
处理机调度:
- 从就绪队列中挑选下一个占用CPU运行的进程
- 从多个可用CPU中挑选就绪进程可使用的CPU资源
调度程序:挑选就绪进程的内核函数
在进程 / 线程的生命周期中的什么时候进行调度?
调度时机
在进程的生命周期中,当进程从一个运行状态到另外一状态变化的时候,其实会触发一次调度。比如,以下状态的变化都会触发操作系统的调度:
-
从就绪态 -> 运行态:当进程被创建时,会进入到就绪队列,操作系统会从就绪队列选择一个进程运行;
-
从运行态 -> 阻塞态:当进程发发生 I/O 事件而阻塞时,操作系统必须另外一个进程运行;
-
从运行态 -> 结束态:当进程退出结束后,操作系统得从就绪队列选择另外一个进程运行;
因为,这些状态变化的时候,操作系统需要考虑是否要让新的进程给 CPU 运行,或者是否让当前进程从CPU 上退出来而换另一个进程运行。
另外,如果硬件时钟提供某个频率的周期性中断,那么可以根据如何处理时钟中断,把调度算法分为两类:
-
非抢占式调度算法挑选一个进程,然后让该进程运行直到被阻塞,或者直到该进程退出,才会调用另外一个进程,也就是说不会被时钟中断这个事情。
-
抢占式调度算法挑选一个进程,然后让该进程只运行某段时间,如果在该时段结束时,该进程仍然在运行时,则会把它挂起,接着调度程序从就绪队列挑选另外一个进程。这种抢占式调度处理,需要在时间间隔的末端发生时钟中断,以便把 CPU 控制返回给调度程序进⾏调度,也就是常说的时间片机制。
调度原则
调度策略:确定如何从就绪队列中选择下一个执行进程
调度策略要解决的问题:挑选就绪队列中的哪一个进程 ?通过什么样的准则来选择 ?
原则1:如果运行的程序,发生了 I/O 事件的请求,那 CPU 使用率必然会很低,因为此时进程在阻塞等待硬盘的数据返回。这样的过程,势必会造成 CPU 突然的空闲。所以,为了提高 CPU 利用率,在这种发送I/O 事件致使 CPU 空闲的情况下,调度程序需要从就绪队列中选择⼀个进程来运行。
原则2:有的程序执行某个任务花费的时间会比较长,如果这个程序⼀直占⽤着 CPU,会造成系统吞吐量(CPU 在单位时间内完成的进程数量)的降低。所以,要提高系统的吞吐率,调度程序要权衡⻓任务和短任务进程的运行完成数量。
原则3:从进程开始到结束的过程中,实际上是包含两个时间,分别是进程运行时间和进程等待时间,这两个时间总和就称为周转时间。进程的周转时间越小越好,如果进程的等待时间很长而运行时间很短,那周转时间就很长,这不是我们所期望的,调度程序应该避免这种情况发⽣。
原则4::处于就绪队列的进程,也不能等太久,当然希望这个等待的时间越短越好,这样可以使得进程更快的在 CPU 中执行。所以,就绪队列中进程的等待时间也是调度程序所需要考虑的原则。
原则5:对于鼠标、键盘这种交互式比较强的应用,我们当然希望它的响应时间越快越好,否则就会影响用户体验了。所以,对于交互式比较强的应用,响应时间也是调度程序需要考虑的原则。
针对上面的五种调度原则,总结成如下:
-
CPU 利⽤率:调度程序应确保 CPU 是始终匆忙的状态,这可提高 CPU 的利用率;
-
系统吞吐量:吞吐量表示的是单位时间内 CPU 完成进程的数量,长作业的进程会占用较长的 CPU 资源,因此会降低吞吐量,相反,短作业的进程会提升系统吞吐量;
-
周转时间:周转时间是指进程初始化到结束(包括等待)的总时间,一个进程的周转时间越小越好;
-
等待时间:这个等待时间不是阻塞状态的时间,而是进程处于就绪队列的总时间,等待的时间越长,用户越不满意;
-
响应时间:用户提交请求到产生响应所花费的总时间,在交互式系统中,响应时间是衡量调度算法好坏的主要标准。
说白了,这么多调度原则,目的就是要使得进程要快
调度算法
01 先来先服务算法
最简单的一个调度算法,就是非抢占式的先来先服务(First Come First Served, FCFS)算法了。
顾名思义,先来后到,每次从就绪队列选择最先进入队列的进程,然后一直运行,直到进程退出或被阻塞,才会继续从队列中选择第一个进程接着运行。
-
这似乎很公平,但是当一个长作业先运行了,那么后面的短作业等待的时间就会很长,不利于短作业。
-
FCFS 对长作业有利,适用于 CPU 繁忙型作业的系统,而不适用于 I/O 繁忙型作业的系统
-
I/O 资源和 CPU资源的利用率较低,CPU密集型进程会导致I/O设备闲置时,I/O密集型进程也等待
02 最短作业优先调度算法
最短作业优先(Shortest Job First, SJF)调度算法同样也是顾名思义,它会优先选择运行时间最短的进程来运行,这有助于提高系统的吞吐量
这显然对长作业不利,很容易造成⼀种极端现象。比如,一个长作业在就绪队列等待运行,而这个就绪队列有非常多的短作业,那么就会使得长作业不断的往后推,周转时间变长,致使长作业长期不会被运行。
03 高响应比优先算法
前面的「先来先服务调度算法」和「最短作业优先调度算法」都没有很好的权衡短作业和长作业。
高响应比优先(Highest Response Ratio Next, HRRN)调度算法主要是权衡了短作业和长作业。
每次进行进程调度时,先计算「响应比优先级」,然后把「响应比优先级」最高的进程投入运行,「响应比优先级」的计算公式:
从上面的公式,可以发现:
-
如果两个进程的「等待时间」相同时,「要求的服务时间」越短,「响应比」就越高,这样短作业的进程容易被选中运行;
-
如果两个进程「要求的服务时间」相同时,「等待时间」越长,「响应比」就越高,这就兼顾到了长作业进程,因为进程的响应比可以随时间等待的增加而提高,当其等待时间足够长时,其响应比便可以升到很高,从而获得运行的机会;
04 时间片轮转算法
最古老、最简单、最公平且使⽤最广的算法就是时间片轮转(Round Robin, RR)调度算法
每个进程被分配一个时间段,称为时间片(Quantum),即允许该进程在该时间段中运行
-
如果时间片用完,进程还在运行,那么将会把此进程从 CPU 释放出来,并把 CPU 分配给另外⼀个进程;
-
如果该进程在时间片结束前阻塞或结束,则 CPU 立即进行切换;
另外,时间片长度就是⼀个很关键的点:
- 如果时间片设得太短会导致过多的进程上下文切换,降低了 CPU 效率;
- 如果设得太长(极限长变成了先来先服务)又可能引起对短作业进程的响应时间变长。
⼀般来说,时间片设为 20ms~50ms
通常是⼀个比较合理的折中值。
05 最高优先级调度算法
前面的「时间片轮转算法」做了个假设,即让所有的进程同等重要,也不偏袒谁,大家的运行时间都一样。
但是,对于多用户计算机系统就有不同的看法了,它们希望调度是有优先级的,即希望调度程序能从就绪队列中选择最高优先级的进程进行运行,这称为最高优先级(Highest Priority First,HPF)调度算法。
进程的优先级可以分为,静态优先级和动态优先级:
- 静态优先级:创建进程时候,就已经确定了优先级,然后整个运行时间优先级都不会变化;
- 动态优先级:根据进程的动态变化调整优先级,比如如果进程运行时间增加,则降低其优先级,如果进程等待时间(就绪队列的等待时间)增加,则升高其优先级,也就是随着时间的推移增加等待进程的优先级。。
但是依然有缺点,可能会导致低优先级的进程永远不会运行。
06 多级反馈队列调度算法
多级反馈队列(Multilevel Feedback Queue,MLFQ)调度算法是「时间片轮转算法」和「最高优先级算法」的综合和发展。
顾名思义:
- 「多级」表示有多个队列,每个队列优先级从高到低,同时优先级越高时间片越短。
- 「反馈」表示如果有新的进程加入优先级高的队列时,立刻停止当前正在运行的进程,转而去运行优先级高的队列;
工作原理:
-
设置了多个队列,赋予每个队列不同的优先级,每个队列优先级从高到低,同时优先级越高时间片越短;
-
新的进程会被放入到第一级队列的末尾,按先来先服务的原则排队等待被调度,如果在第一级队列规定的时间片没运行完成,则将其转入到第二级队列的末尾,以此类推,直至完成;
-
当较高优先级的队列为空,才调度较低优先级的队列中的进程运行。如果进程运行时,有新进程进入较高优先级的队列,则停止当前运行的进程并将其移入到原队列末尾,接着让较高优先级的进程运行;
可以发现,对于短作业可能可以在第一级队列很快被处理完。对于长作业,如果在第一级队列处理不完,可以移入下次队列等待被执行,虽然等待的时间变长了,但是运行时间也变更长了,所以该算法很好的兼顾了长短作业,同时有较好的响应时间。
实时调度
实时操作系统
- 定义: 正确性依赖于其时间和功能两方面的操作系统
- 性能指标: 时间约数的及时性,速度和性能相对不重要
- 特性: 时候约束的可预测性
实时操作系统分类
- 强 / 硬实时操作系统:要求在指定的时间内必须完成重要的任务
- 弱 / 软实时操作系统:重要进程有高优先级,要求尽量但非必须完成
实时任务
- 任务(工作单元):一次计算,一次文件读取,一次信息传递等等
- 任务属性:完成任务所需要的资源,定时参数等
周期实时任务
- 任务有规律地重复
- 周期p = 任务请求时间间隔 (0 <p)
- 执行时间e = 最大执行时间(0 < e < p)
- 使用率U = e/p
可调度性
-
可调度表示一个实时操作系统能够满足任务时限要求
-
静态优先级调度:任务执行过程中不会改变任务的优先级
-
动态优先级调度:任务执行过程中会改变任务的优先级
优先级翻转
优先级翻转: 操作系统中出现高优先级进程长时间等待低优先级进程所占用资源的现象。
解决办法:
1. 优先级继承: 占用资源的低优先级进程继承申请资源的高优先级进程的优先级,只在占有资源的低优先级进程被阻塞时,才提高占有资源进程的优先级。
2. 优先级天花板协议: 占用资源进程的优先级和所有可能申请该资源的进程的最高优先级相同。
- 不管是否发生等待,都提升占用资源进程的优先级。
- 优先级高于系统中所有被锁定的资源的优先级上限,任务执行临界区时就不会被阻塞。
整理自【清华大学】操作系统+【小林Coding】图解系统