前言
今天在学习《深入理解Linux内核》的时候,发现出现了一个新的名词TSS(Task-State Segment),这还是我第一次了解到原来x86提供了硬件级别的任务切换功能,之前以为任务切换都是操作系统实现的来着,这里也记录一下我的发现。
参考资料
Intel白皮书的Volume 3A Chapter 8: Task Management
什么是TSS
TSS是一块特殊的内存区域,这块内存区域用来存储硬件上下文,在实现硬件级别的任务切换时起到了保存和加载上下文的作用。具体而言,这块内存区域的分布如下图所示:
这块内存区域里面记录了一些任务的硬件上下文(例如通用寄存器的值,段寄存器的值,栈寄存器的值等)。
从段(Segment)的角度看TSS
从TSS的名字可以知道,它也是一个段,那么也是需要使用段描述符来寻址的。事实上,TSS的段描述符如下图所示
保存这个段描述符的段寄存器是TR,这个寄存器和SS等寄存器类似,也是拥有一个用户可见部分(存放描述符)和用户不可见部分(存放描述符的内容)。
在当前特权等级为0的情况下,可以使用LTR
汇编指令来把一个描述符加载到TR里面。
硬件级别的任务切换过程
任务切换可以通过jump-far
和call-far
来实现,call
和call-far
的区别在于,普通的call
不会修改SS寄存器,而call-far
需要传递一个新的段描述符,用来更新SS寄存器的值。
根据白皮书,当使用call-far
,并且传入的段描述符是一个TSS段描述符,那么就会进行任务切换,例如下面这条指令(其中0x2b描述符对应的是TSS段):
call 0x2b:0x00000000
当满足上述条件时,CPU会先经历一系列检查,然后把当前的硬件上下文(如寄存器的值)保存到TSS段中,然后根据传入的新的TSS段描述符,把新的TSS段的内容加载到各个寄存器中。
Linux的任务切换
虽然x86提供了一套硬件级别的任务切换机制,但是Linux内核并没有采用这套机制。具体而言,Linux采取了如下的方法(摘自https://liujunming.top/2020/01/18/%E6%B5%85%E8%B0%88tss/)
- linux没有为每一个进程都准备一个tss段,而是每一个cpu使用一个tss段,tr寄存器保存该段。进程切换时,只更新唯一tss段中的esp0字段,esp0保存新进程的内核栈地址。
- linux的tss段中只使用esp0和iomap等字段,不用它来保存寄存器,在一个用户进程被中断进入ring0的时候,tss中取出esp0,然后切到esp0,其它的寄存器则保存在esp0指示的内核栈上,而不保存在tss中。
- 结果,linux中每一个cpu只有一个tss段,tr寄存器永远指向它。符合x86处理器的使用规范,但不遵循intel的建议,这样的后果是开销更小了,因为不必切换tr寄存器了。
总之就是,Linux把上下文保存在了内核栈中,而内核栈的地址保存在esp0里面。