阻塞和非阻塞是一种状态,关键要看调用线程有没有被挂起。以处理I/O为例,如果是调用线程处理阻塞型I/O,那么调用线程会被挂起,此时调用线程就是阻塞的;如果调用线程处理的是非阻塞I/O,调用线程开启了I/O之后可以并行做别的事情,那么调用线程就是非阻塞的。
非阻塞I/O有不同的实现方式,可以在应用层开启一个新的I/O多路复用线程,也可以利用Linux系统内核epoll接口。采用I/O多路复用策略,阻塞的I/O连接数和线程数是1:1,非阻塞的I/O连接数和线程数是N:1,这样就平衡了I/O和CPU速度上的差距。
同步和异步的本质区别关键要看数据如何返回给调用方?或者说数据返回的主动方是谁?是调用方(应用层)还是被调用方(系统内核)?如果是应用层主动问询,那么就意味着应用层和系统内核的同步;如果是系统内核通知应用层,那么就意味着应用层在系统内核处理I/O时,可以处理别的事情直到收到系统内核的通知。
看完上面的内容,你可能更加迷糊了,你可能会问阻塞/非阻塞和同步/异步又有什么区别呢?
阻塞/非阻塞是看I/O第一阶段读取数据时是否可以并行处理其他事情;而同步/异步则是看I/O第二阶段读取数据完毕以后是谁主动,如果是被调用方(系统内核)主动通知,则是异步的。
现在你能够回答这样一个问题吗?阻塞是否就意味着同步,反过来是否成立?非阻塞是否意味着异步,反过来是否成立?
阻塞和同步关注的点不一样,阻塞是线程的一种状态,同步是一种过程。线程如果阻塞了,但是如果被调用方(系统内核)通知返回数据,线程恢复运行状态,这就是异步的。反之,如果I/O采用同步方式,由调用方(应用层)主动问询系统内核获取数据,但是调用线程并不是阻塞状态,因为它在一直轮询系统内核数据是否准备好。
同样的道理,非阻塞和异步关注的点也不一样。举个栗子,调用线程请求I/O时开启另外一个线程处理,在I/O线程读取的同时,调用线程可以做别的事情,所以调用线程是非阻塞的状态,但是调用线程把其他事情都处理完了之后,还是要问询I/O线程数据是否已经读取完毕,这个过程就是同步的,或者可以称为“伪异步”。
如果是异步的过程,调用方等待被调用方通知,那么调用方就一定是非阻塞吗?也不一定,也许调用方被其他的资源阻塞了呢?所以异步过程,线程状态是未知的。