3.1 Grand Central Dispatch (GCD)概要
3.1.1什么是GCD
Grand Central Dispatch(GCD)是异步执行任务
的技术之一。一般将应用中记述线程管理用的代码在系统级中实现。开发者只要定义想执行的任务并追加到Dispatch Queue中,GCD就能生成必要的线程并计划执行任务。
由于线程管理是作为系统的一部分来实现的,因此可统一管理,也可以执行任务,这样就比以前的线程更加有效率。也就是说GCD用简洁的记述方法,实现了极为复杂繁琐的多线程编程
。
上面的就是在后台线程中执行长时间处理,处理结束时,主线程使用该处理结果的源代码。
这仅有一行的代码表示让处理在后台线程中执行。
这样就能让处理在主线程中执行。另外,脱字符号"^"
就能发现,GCD用到“Blocks"
简化了应用程序代码。
在导入GCD之前,Cocoa框架提供了NSObjective类的performSelectorInBackground:withObject
实例方法和 performSelectorOnMainThread
实例方法等简单的多线程编程技术。
相比performSelector系方法,GCD 更为简洁。如果使用GCD,不仅不必使用NSThread类或performSelector系方法这些过时的API,更可以通过GCD提供的系统级线程管理提高执行效率。
3.1.2多线程编程
线程到底是什么?看下面OC的源代码
虽然调用了几个方法,但代码基本上是按从上到下的顺序执行的。
该代码在Mac和iPhone上是如何执行的?通过编译器转化为如下的CPU命令列(二进制代码)
汇集CPU命令列,将其作为一个应用程序安装到Mac或iPhone上。
Mac,iPone的操作系统OSX,iOS根据用户的指时启动该程序后,首先便将包含在应用程序的CPU命令列配置到内存中。CPU从应用程序指定的地址开始,一个一个地执行CPU命令列。
先执行地址 lac 的命令列push,接着向后移动,执行地址 lae 的命令列 movw,再次向后移动,执行地址lb2的命令列,就这样不断循环下去。
在OC的if语句和for语句等控制语句或函数调用
的情况下,执行命令列的地址会远离当前的位置(位置迁移),但是,由于一个CPU一次只能执行一个命令,不能执行某处分开的并列的两个命令,因此CPU执行的CPU命令列就好比一条无分叉的大道,其执行不会出现分歧。
这里所说的“1个CPU执行的CPU命令列为一条无分叉路经”即为“线程”
。
这种无分叉路经不止一条,即存在多条时即为“多线程”。在多线程中,一个CPU和执行多条不同路径的不同命令。如下
但基本上一个CPU和一次能够执行的CPU命令始终为1.那么怎才能在多条路径中执行CPU命令列?
OS X和iOS 的核心XNU内核在发生操作系统事件时(如每隔一定时间,唤起系统调用等情况)会切换执行路径。执行中路径的状态,例如CPU的寄存器等信息保存到各自路径专用的内存块中,从切换目标路径专用的内存块中,复原CPU寄存器等信息,继续执行切换路径的 CPU命令列。这被称为“上下文切换
”
在使用多线程的程序可以在某个线程和其他线程之间反复多次地进行上下文切换,因此看上去一个CPU和能够并列地执行多个线程一样**。而且在多个CPU核的情况下,就真的提供了多个CPU核执行多个线程的问题**。
这种利用多线程编程技术就被称为“多线程编程”
但是多线程编程实际上会出现各种问题。比如多个线程更新相同的资源会导致数据的不一致(数据竞争),停止等待事件的线程会导致多个线程相互持续等待(死锁),使用太多线程会导致消耗大量内存。
尽管如此也要使用多线程编程,因为其可以保证应用程序的响应性能。
应用程序在启动时,通过最先执行的线程,即“主线程”
来描绘用户界面、处理触摸屏幕的事件等。如果在该主线程中进行长时间的处理,如 AR 用画像的识别或数据库访问,就会妨碍主线程的执行(阻塞)。在OS X和iOS 的应用程序中,会妨碍主线程中被称为RunLoop
的主循环的执行,从而导致不能更新用户界面、应用程序的画面长时间停滞等问题。
这就是长时间的处理不在主线程执行而在其他线程执行的原因。
使用多线程编程就能在执行长时间的处理时仍可以保证用户界面的响应性能。而GCD
大大简化了偏于复杂的多线程的源代码。
3.2CGD的API
3.2.1Dispatch Queue
回顾苹果官方对GCD的说明。
开发者要做的只是定义想执行的任务并追加到适当的Dispatch Queue中。
用源代码表示
该源代码使用Block
语法“定义想执行的任务”,通过dispatch_async
函数“追加”赋值在变量queue的“Dispatch Queue中”
。仅这样就可以使指定的Block在另一个线程中执行。
“Dispatch Queue”是什么?其名称所示,是执行处理的等待队列。
应用程序编程人员通过dispatch_async函数等API,在Block语法中记述想要执行的处理并追加到Dispatch Queue中。Dispatch queue按照追加的顺序(先进先出FIFO,First-In-First-Out)执行处理。
另外在执行处理时存在两种Dispatch queue,一种是等待现在执行处理的Serial Dispatch Queue
,另一种是不等待现在执行中处理的Concurrent Dispatch Queue
。
比较两个Dispatch Queue。如下在dispatch_async中追加多个处理。
当变量 queue 为 Serial Dispatch Queue
时,因为要等待现在执行中的处理结束,所以首先执行blk0,blk0 执行结束后,接着执行 blk1,blk1 结束后再开始执行blk2,如此重复。同时执行的处理数只能有1个。执行顺序
blk0
blk1
blk2
blk3
blk4
blk5
blk6
blk7
如下面的代码
运行这段代码是不会输出结果的?我们想通过输出结果来判断执行处理的顺序
由于dispatch_async方法是异步执行的,它会立即返回,不会等待block中的人物执行完毕。当程序执行到return语句时,主线程就会结束,导致队列中的任务没有机会执行。
如果你想要看到block中的内容输出,可以在主线程结束之前,使用dispatch_sync
或dispatch_barrier_sync
等方法来等待队列中的任务执行完毕。
当变量queue 为Concurrent Dispatch Queue
时,因为不用等待现在执行中的处理结束,所以首先执行bk0,不管bk0 的执行是否结束,都开始执行后面的blk1,不管 blk1 的执行是否结束,都开始执行后面的blk2,如此重复循环。
这样虽然不用等待处理结束,可以执行多个处理。但并行执行的处理数量取决于当前系统的状态。
即iOS和OSX基于Dispatch Queue中的处理数,CPU核数以及CPU负荷等当前系统的状态来决定Concurrent Dispatch Queue中并行执行的处理数。
iOS和OSX的核心–XNU内核
决定应当使用的线程数,并只生成所需的线程执行处理。另外,当处理结束,应当执行的处理数减少时,XNU内核会结束不再需要的线程。XUN内核仅使用Concurrent Dispatch Queue便可以完美的管理并行执行多个处理的线程。
前面的源代码,在多个线程中执行Block。
假设准备4个Concurrent Dispatch Queue
用线程。首先blk0在线程0中开始执行,接着 blk1在线程1中、blk2在线程2中、blk3在线程3中开始执行。线程0中blk0执行结束后开始执行 blk4,由于线程1中blk1的执行没有结束,因此线程2中blk2执行结束后开始执行 blk5,就这样循环往复。
如下面的代码
像前面一样,我们想通过输出结果来判断执行处理的顺序。同样使用dispatch_sync方法却不行。
输出结果为这样且不唯一,这可能与使用多线程执行处理有关。
这里我们要用dispatch_barrier_sync
方法来实现
dispatch_barrier_sync
方法会等待追加到Concurrent Dispatch Queue上的并行执行的处理全部结束。
输出结果并不唯一。
还有最后发现在Main函数中执行会有这个输出不了的问题,尽量在app程序的viewDidLoad函数中写。
像这样在Concurrent Dispatch Queue
中执行处理时,执行顺序会根据处理内容和系统状态发生改变。它不同于执行顺序固定的Serial Dispatch Queue
,在不能改变执行的处理顺序或不想并行执行多个处理时使用Serial Dispatch Queue
。
知道了有 Serial Dispatch Queue
和 Concurrent Dispatch Queue
这两种,但如何才能得到这些Dispatch Queue 呢?方法有两种。
3.2.2 dispatch_queue_create
一种方法是通过GCD的API生成Dispatch Queue。
通过dispatch_queue_create函数可生成Dispatch queue。下面代码生成了Serial Dispatch Queue。
先讲一下关于 Serial Dispatch Queue 生成个数的注意事项。如前所述,Concurrent Dispatch Queue 并行执行多个追加处理,而Serial Dispatch Queue 同时只能执行1个追加处理。虽然 Serial Dispatch Queue 和 Concurrent Dispatch Queue 受到系统资源的限制,但用dispatch_queue_create
函数可生成任意多个 Dispatch Queue。
当生成多个Serial Dispatch Queue 时,各个 Serial Dispatch Queue 将并行执行。虽然在1个Serial Dispatch Queue 中同时只能执行一个追加处理,但如果将处理分别追加到4个Serial Dispatch Queue 中,各个Serial Dispatch Queue 执行1个,即为同时执行4个处理。
一旦生成serial Dispatch Queue并追加处理,系统对于一个Serial Dispatch Queue就只生成并使用一个线程。如果生成多个serial Dispatch Queue,就生成多个线程。
如果过多使用多线程,就会消耗大量内存,引起大量的上下文切换,大幅度降低系统的响应性能。
只在避免多线程编程问题之一-----多个线程更新相同资源导致数据竞争时使用Serial Dispatch Queue
。
但是Serial Dispatch Queue 的生成个数应当仅限所必需的数量。例如更新数据库时1个表生成1个Serial Dispatch Queue,更新文件时1个文件或是可以分割的1个文件块生成1个Serial Dispatch Queue。虽然“Serial Dispatch Queue 比Concurrent Dispatch Queue 能生成更多的线程”,但绝不能激动之下大量生成Serial Dispatch Queue。
当想并行执行不发生数据竞争等问题的处理时,使用Concurrent Dispatch Queue。而且对于 Concurrent Dispatch Queue 来说,不管生成多少,由于XNU内核只使用有效管理的线程,因此不会发生 Serial Dispatch Queue 的那些问题。
下面继续将dispatch_queue_create
函数。该函数的第一个参数指定Serial Dispatch Queue的名称。想源代码一样,Dispatch queue的名称推荐使用应用程序ID这种逆序全称域名。我们命名一般遵循这样的原则:对于我们编程人员要简单易懂,对于用户也要易懂。
生成Serial Dispatch Queue时,像源代码这样,将第二个参数指定为NULL
,生成Concurrent Dispatch Queue时,像下面源代码一样,指定为DISPATCH_QUEUE_CONCURRENT
。
dispatch_queue_create
函数的返回值为Dispatch Queue的“dispatch_queue_t"
类型。在前面源代码提到的变量queue均为dispatch_queue_t类型变量。
该源代码在Concurrent Dispatch Queue中执行指定的Block。
另外,遗憾的是尽管有 ARC 这一通过编译器自动管理内存的优秀技术,但生成的Dispatch Queue 必须由程序员负责释放。这是因为Dispatch Queue 并没有像Block那样具有作为 Objective-C 对象来处理的技术。
通过dispatch_queue_create
函数生成的 Dispatch Queue
在使用结束后通过 dispatch_release
函数释放。
注意:在iOS6.0后 ,GCD对象使用ARC 的管理,ARC程序中不再需要调用dispatch_release来释放GCD对象
dispatch_release(mySerialDispatchQueue);
该名称中含有release,由此可以推测出相应地也存在 dispatch_retain 函数。
dispatch_retain(myConcurrentDispatchQueue);
即Dispatch Queue 也像Objective-C的引用计数式内存管理一样,需要通过dispatch_retain 函数和dispatch_release函数的引用计数来管理内存。前面的源代码中,需要释放通过 dispatch_queue_create
函数生成并赋值给变量myConcurrentDispatchQueue
中的 Concurrent Dispatch Queue
。
dispatch_queue_t myConcurrentDispatchQueue = dispatch_queue_create(com.example.gcd.MyConcurrentDispatchQueue", DISPATCH_QUEUE_CONCURRENT);
dispatch_async(MyConcurrentDispatchQueue, ^{
NSLog(@"block on myConcurrent DispatchQueue");
});
dispatch_release(myConcurrentDispatchQueue);
虽然Concurrent Dispatch Queue是使用多线程执行追加的处理,但像该例这样,在dispatch_sync函数中追加Block到Concurrent Dispatch Queue,并立即通过dispatch_release 函数进行释放是否可以呢?
源代码完全没有问题。在dispatch_async
函数中追加Block
到Dispatch Queue
,换言之,该 Block 通过 dispatch_retain 函数持有 Dispatch Queue。无论 Dispatch Queue 是 Serial Dispatch Queue还是Concurrent Dispatch Queue都一样。一旦Block 执行结束,就通过 dispatch_release 函数释放该 Block 持有的 Dispatch Queue。
也就是说,在dispatch_async 函数中追加 Block 到 Dispatch Queue 后,即使立即释放 Dispatch Queue,该 Dispatch Queue 由于被 Block 所持有也不会被废弃,因而Block 能够执行。Block 执行结束后会释放Dispatch Queue,这时谁都不持有Dispatch Queue,因此它会被废弃。
3.2.3 Main Dispatch Queue/Global Dispatch Queue
第二种方法是获取系统标准提供的Dispatch Queue
系统也为我们提供了几个Dispatch Queue。那就是Main Dispatch Queue 和 Global Dispatch Queue。
Main Dispatch Queue
正如其名称中含有“Main”一样,是在主线程中执行的Dispatch Queue
。因为主线程只有一个,所以Main Dispatch Queue
自然就是Serial Dispatch Queue
。
追加到Main Dispatch Queue的处理在主线程的RunLoop中执行
。因此要将用户界面的界面更新等一些必须在主线程中执行的处理追加到Main Dispatch Queue使用。这正好与NSObjective类的performSelectorOnMainThead实例方法
这一执行方法相同。
另一个Global Dispatch Queue
是所有应用程序都能用到的Concurrent Dispatch Queue
。没必要通过dispatch_queue_create函数逐个生成Concurrent Dispatch Queue。只要获取Global Dispatch Queue使用即可。
另外,Global Dispatch Queue
有4个执行优先级,分别是高优先级(High Priority)、默认优先级(Default Priority)、低优先级(Low Priority)和后台优先级(Background Priority)
。通过 XNU内核管理的用于Global Dispatch Queue 的线程,将各自使用的Global Dispatch Queue 的执行优先级作为线程的执行优先级使用。在向Global Dispatch Queue 追加处理时,应选择与处理内容对应的执行优先级的 Global Dispatch Queue。
但是通过XNU内核用于GlobalDispatch Queue的线程并不能保证实时性,因此执行优先级只是大致的判断。例如在处理内容的执行可有可无时,使用后台优先级的Global Dispatch Queue等,只能进行这种程度的区分。
系统提供的Dispatch Queue总结如表。
各种Dispatch Queue的获取方法。
另外对于Main Dispatch Queue
和Global dispatch Queue
执行执行 dispatch_retain
函数和 dispatch_release
函数不会引起任何变化,也不会有任何问题。这也是获取并使用Global Dispatch Queue 比生成、使用、释放 Concurrent Dispatch Queue 更轻松的原因。
当然,源代码上在进行类似通过dispatch_queue_create 函数生成Dispatch Queue 的处理要更轻松时,可参照引用计数式内存管理的思考方式,直接在Main Dispatch Queue 和 Global Dispatch Queue 中执行 dispatch_retain 函数和 dispatch_release 函数。
以下列举使用了Main Dispatch Queue
和 Global Dispatch Queue
的源代码:
3.2.4 dispatch_set_target_queue
dispatch_queue——create函数生成的函数生成的Dispatch Queue不管是Serial Dispatch Queue还是Concurrent Dispatch Queue,都与默认优先级Global Dispatch Queue相同执行优先级的线程。而变更生成的Dispatch Queue的执行优先级要使用dispatch_set_target_queue函数。
在后台处理执行动作的dispatch_set_target_queue的生成方法如下:
指定要变更执行优先级的Dispatch Queue为dispatch_set_target_queue函数的第一个参数,指定要与使用的执行优先级相同优先级的Global Dispatch Queue为第二个参数(目标)。
第一个参数如果指定系统提供的Main Dispatch Queue 和 Global Dispatch Queue
则不知道会出现什么状况,因此这些均不可指定。
将Dispatch Queue 指定为dispatch_set_target_queue 函数的参数,不仅可以变更 Dispatch Queue的执行优先级,还可以作成Dispatch Queue的执行阶层。
如果在多个Serial Dispatch Queue 中用 dispatch_set_target_queue 函数指定目标为某一个Serial Dispatch Queue,那么原先本应并行执行的多个Serial Dispatch Queue,在目标Serial Dispatch Queue 上只能同时执行一个处理。
在必须将不可并行执行的处理追加到多个Serial Dispatch Queue中时,如果使用dispatch_set_target_queue函数将目标指定为某一个Serial Dispatch Queue,即可防止处理并行执行。
3.2.5 dispatch_after
经常会有这样的情况:想在3秒后执行处理。可能不仅限于3秒,总之,这种想在指定时间后执行处理的情况,可使用dispatch_after
函数来实现。
在3秒后将指定的Block追加到Main Dispatch Queue中的源代码如下:
需要注意的是,dispatch_after函数并不是在指定时间后执行处理,而只是在指定时间追加处理到Dispatch Queue。此源代码与在3秒后用dispatch_async函数追加Block到Main Dispatch Queue相同。
因为Main Dispatch Queue 在主线程的RunLoop中执行,所以在比如每隔1/60秒执行的 RunLoop中,Block最快在3秒后执行,最慢在3秒+1/60秒后执行,并且在Main Dispatch Queue有大量处理追加或主线程的处理本身有延迟时,这个时间会更长。
虽然在有严格时间的要求下使用时会出现问题,但在想大致延迟执行处理时,该函数是非常有效的。
另外,第二个参数
指定要追加处理的Dispatch Queue,第三个参数
指定记述要执行处理的Block。
第一个参数
是指定时间用的dispatch_time_t类型的值。该值使用dispatch_time函数或dispatch_walltime函数作成。
dispatch_time
函数能够获取从第一个参数dispatch_time_t类型值中指定的时间开始,到第二个参数指定的毫微秒单位时间后的时间。第一个参数经常使用的值是之前源代码中出现的 DISPATCH_TIME_NOW
。这表示现在的时间。
即以下源代码可得到表示从现在开始1秒后的 dispatch_time_t类型的值。
dispatch_time_t time = dispatch_time(DISPATCH TIME_NOW, 1ull* NSEC_PER_SEC)
数值和NSEC_PER_SEC
的乘积得到单位为毫微秒的数值。
“ull”是C语言的数值字面量,是显式表明类型时使用的字符串(表示“unsigned long long”)。
如果使用NSEC_PER_MSEC
可以以毫秒为单位计算。以下源代码获取表示从现在开始150毫秒后时间的值。
dispatch_time_t time = dispatch_time(DISPATCH_TIME_NOW, 150ull * NSEC_PER_MSEC);
dispatch_walltime 函数
由POSIX中使用的struct timcspec类型
的时间得到dispatch_time_t类型
的值。dispatch_time 函数通常用于计算相对时间,而dispatch_walltime 函数用于计算绝对时间。例如在dispatch_after函数中想指定 2111年11月 11日 11 时 11 分 11 秒这一绝对时间的情况,这可作为粗略的闹钟功能使用。
struct timespec类型的时间可以轻松地通过NSDate类对象作成。
上面源代码可由NSDate类对象获取能传递给dispatch_after函数的dispatch_time_t类型的值。
3.2.6 Dispatch Group
在追加到Dispatch Queue中的多个处理全部结束后执行结束处理,这种情况会经常出现。
只使用一个Serial Dispatch Queue时,只要将想执行的处理全部追加到Serial Dispatch Queue中并在最后追加结束处理。即可实现。
但在使用Concurrent Dispatch Queue时或同时使用多个Dispatch Queue时,源代码就会变得颇为复杂。在这种情况下使用Dispatch Group。
例如下面源代码为:追加3个Block到Global Dispatch Queue,这些Block如果全部执行完毕,就会执行Main Dispatch Queue 中结束处理用的Block。
该源代码执行结果如下:
因为向Global Dispatch Queue即Concurrent Dispatch Queue追加处理,多个线程并行执行,所以追加的处理的执行顺序不定。执行时会发生变化,但是此执行结果的done一定是最后输出的。
无论向什么样的Dispatch Queue中追加处理,使用Dispatch Group 都可监视这些处理执行的结束。一旦检测到所有处理执行结束,就可将结束的处理追加到Dispatch Queue中。这就是使用Dispatch Group
的原因。
dispatch_group_create 函数
生成dispatch_group_t类型
的Dispatch Group
。如 dispatch_group_create 函数名中所含的create 所示,该 Dispatch Group与Dispatch Queue 相同,在使用结束后需要通过dispatch_release 函数释放。
dispatch_group_async 函数
与 dispatch_async 函数相同,都追加 Block 到指定的 Dispatch Queue 中。与 dispatch_async 函数不同的是指定生成的 Dispatch Group 为第一个参数。指定的 Block 属于指定的 Dispatch Group。
另外,与追加Block 到 Dispatch Queue 时同样,Block 通过 dispatch_retain 函数持有Dispatch Group,从而使得该Block属于Dispatch Group。这样如果Block执行结束,该Block就通过 dispatch_release 函数释放持有的 Dispatch Group。一旦 Dispatch Group 使用结束,不用考虑属于该 Dispatch Group 的 Block,立即通过 dispatch_release 函数释放即可。
在追加到 Dispatch Group 中的处理全部执行结束时,该源代码中使用的 dispatch_group_notify函数
会将执行的 Block 追加到 Dispatch Queue
中,将第一个参数指定为要监视的 Dispatch Group。在追加到该 Dispatch Group 的全部处理执行结束时,将第三个参数的 Block 追加到第二个参数 Dispatch Queue 中。在dispatch_group_notify 函数中不管指定什么样的Dispatch Queue,属于 Dispatch Group 的全部处理在追加指定的Block 时都已执行结束。
另外,在Dispatch Group 中也可以使用dispatch_group_wait 函数仅等待全部处理执行结束。
dispatch_group_wait 函数
的第二个参数指定为等待的时间(超时)。它属于 dispatch_time_t类型
的值。该源代码使用DISPATCH_TIME_FOREVER
,意味着永久等待。只要属于Dispatch Group的处理尚未执行结束,就会一直等待,中途不能取消。
如同dispatch_after 函数
说明中出现的那样,指定等待间隔为1秒时应做如下处理。
如果dispatch_group_wait 函数的返回值不为0,就意味着虽然经过了指定的时间,但属于 Dispatch Group的某一个处理还在执行中。如果返回值为0,那么全部处理执行结束。当等待时间为DISPATCH TIME FOREVER、由dispatch_group_wait函数返回时,由于属于Dispatch Group的处理必定全部执行结束,因此返回值恒为0。
这里的“等待”
是什么意思呢?
这意味着一旦调用dispatch_group_wait 函数,该函数就处于调用的状态而不返回。即执行dispatch_group_wait函数的现在的线程(当前线程)停止。在经过 dispatch_group_wait 函数中指定的时间或属于指定Dispatch Group的处理全部执行结束之前,执行该函数的线程停止。
指定DISPATCH_TIME_NOW
,则不用任何等待即可判定属于Dispatch Group的处理是否执行结束。
long result = dispatch_group_wait(group, DISPATCH_TIME_NOW);
在主线程的RunLoop的每次循环中,可检查执行是否结束,从而不耗费多余的等待时间,虽然这样也可以,但一般在这种情形下,还是推荐用dispatch_group_notify函数追加结束处理到 Main Dispatch Queue 中。这是因为dispatch_group_notify 函数可以简化源代码。
3.2.7dispatch_barrier_async
在访问数据库或文件时,如前所述,使用 Serial Dispatch Queue
可避免数据竞争的问题。
写入处理确实不可与其他的写入处理以及包含读取处理的其他某些处理并行执行。但是如果读取处理只是与读取处理并行执行,那么多个并行执行就不会发生问题
。
也就是说,为了高效率地进行访问,读取处理追加到Concurrent Dispatch Queue中
,写入处理在任一个读取处理没有执行的状态下,追加到Serial Dispatch Queue
中即可(在写入处理结束之前,读取处理不可执行)。
虽然利用Dispatch Group 和dispatch_set_target_queue 函数也可实现,但是源代码会很复杂 GCD为我们提供了更为聪明的解决方法dispatch_barrier_async 函数
。该函数同 dispatch_queue_create 函数生成的Concurrent_Dispatch_Queue 一起使用。
首先dispatch_queue_create 函数生成Concurrent_Dispatch_Queue,在dispatch_async 中追加读取处理。
在 blk3_for_reading
处理和blk4_for_reading
处理之间执行写入处理,并将写入的内容读取 blk4_for_reading 处理以及之后的处理中。
如果像下面这样简单地在dispatch_async 函数中加入写入处理,那么根据Concurrent Dispatch Queue的性质,就有可能在追加到写入处理前面的处理中读取到与期待不符的数据,还可能因非法访问导致应用程序异常结束。如果追加多个写入处理,则可能发生更多问题,比如数据竞争等。
输出结果
因此我们要使用 dispatch_barrier_async 函 数
。dispatch_barrier_async 函数会等待追加 到 Concurrent Dispatch Queue上的并行执行的处理全部结束之后,再将指定的处理追加到该 Concurrent Dispatch Queue 中。然后在由dispatch_barrier_async 函数追加的处理执行完毕后,Concurrent Dispatch Queue 才恢复为一般的动作,追加到该 Concurrent Dispatch Queue 的处理又开始并行执行。
输出结果
仅使用dispatch_barrier_async 函数代替 dispatch_async 函数即可。
使用Concurrent Dispatch Queue
和dispatch_barrier_async函数
可实现高效率的数据库访问和文件访问。
3.2.8 dispatch_sync
dispatch_async函数的“async”意味着“非同步”,就是将指定的Block“非同步”地追加到指定的Dispatch Queue中。dispatch_async函数不做任何等待。
既然有“async”,当然也就有“sync",即dispatch_sync函数。它意味着“同步”,也就是将指定的Block“同步”追加到指定的Dispatch Queue中。在追加Block结束之前,dispatch_sync函数会一直等待。
如dispatch_group_wait函数说明所示,“等待”意味着当前线程停止。
我们先假设一种情况:执行Main Dispatch Queue时,使用另外的线程Global Dispatch Queue进行处理,处理结束后立即使用所得到的结果。在这种情况下就要使用dispatch_sync函数。
一旦调用dispatch_sync函数,那么在指定的结束处理执行结束之前,该函数不会返回。dispatch_sync可简化源代码,也可说时简体版的dispatch_group_wait函数
正因为dispatch_sync函数使用简单,所以也容易引起问题,即死锁
。
该源代码在Main Dispatch Queue即主线程中执行指定的Block,并等待起执行结束。而其实在主线程中正在执行这些源代码,所以无法执行追加到Main Dispatch Queue的Block。
下面例子也一样。
Main Dispatch Queue中执行的Block等待Main Dispatch Queue中要执行的Block执行结束。这样的死锁就像在画像上画画一样。
当然Serial Dispatch Queue也会引起相同的问题。
另外,由dispatch_barrier_async 函数中含有 async 可推测出,相应的也有dispatch_barrier_sync函数。dispatch_barrier_async 函数的作用是在等待追加的处理全部执行结束后,再追加处理到Dispatch Queue 中,此外,它还与dispatch_sync 函数相同,会等待追加处理的执行结束。
3.2.9 dispatch_apply
dispatch_apply函数是dispatch_sync函数和Dispatch Group的关联API。该函数按照指定的次数将指定的Block追加到指定的Dispatch_Queue,并等待全部处理执行结束。
执行结果:
因为在Global Dispatch Queue中执行处理,所以各个处理的执行时间不定。但是输出结果中的最后done必定在最后的位置。这是因为dispatch_apply函数会等待全部处理执行结束。
第一个参数为重复次数,第二个参数为追加对象的Dispatch Queue,第三个参数为追加的处理。
。与到目前为止所出现的例子不同,第三个参数的Block为带有参数的 Block。这是为了按第一个参数重复追加Block并区分各个Block而使用。例如要对NSArray类对象的所有元素执行处理时,不必一个一个编写for 循环部分。
我们来看一下下面的源代码。变量array为NSArray类对象。
这样可简单地在Global Dispatch Queue 中对所有元素执行Block。
另外,由于dispatch_apply 函数
也与 dispatch_sync 函数
相同,会等待处理执行结束,因此推荐在 dispatch_async 函数
中非同步地执行 dispatch_apply 函数
。
3.2.10 dispatch_suspend / dispatch_resume
当追加大量处理到Dispatch Queue时,在追加处理的过程中,有时希望不执行已追加的处理。
例如演算结果被Block截获时,一些处理会这个演算结果造成影响。
在这种情况下,只要挂起Dispatch Queue 即可。当可以执行时再恢复。
dispatch_suspend 函数挂起指定的Dispatch Queue。
dispatch_suspend(queue);
dispatch_resume 函数恢复指定的 Dispatch Queue。
dispatch_resume(queue);
这些函数对已经执行的处理没有影响。挂起后,追加到Dispatch Queue中但尚未执行的处理在此之后停止处理。而恢复则使得这些处理能够继续执行。
2.3.11 Dispatch Semaphore
如前所述,**当并行执行的处理更新数据时,会产生数据不一致的情况,**有时应用程序还会异常结束。
虽然使用Serial Dispatch Queue
和 dispatch_barrier_async 函数
可避免这类问题,但有必要进行更细粒度的排他控制。
我们来思考一下这种情况:不考虑顺序,将所有数据追加到 NSMutableArray 中。
因为该源代码使用Global Dispatch Queue更新NSMutableArray类对象,所以执行后由内存错误导致应用程序异常结束的概率很高。此时应使用Dispatch Semaphore
。
Dispatch Semaphore
是持有计数的信号,该计数是多线程编程中的计数类型信号。所谓信号,类似于过马路时常用的手旗。可以通过时举起手旗,不可通过时放下手旗。而在Dispatch Semaphore中,使用计数来实现该功能。计数为0时等待,计数为1或大于1时,减去1而不等待。
下面介绍一下使用方法。通过dispatch_semaphore_create 函数
生成Dispatch Semaphore
。
dispatch_semaphore_t semaphore = dispatch_semaphore_create(1);
参数表示计数的初始值。本例将计数值初始化为“1”。从函数名称中含有的create 可以看出,该函数与Dispatch Queue 和 Dispatch Group 一样,必须通过dispatch_release 函数释放。当然也可通过dispatch_retain 函数持有。
dispatch_semaphore_wait(semaphore, DISPATCH_TIME_FOREVER);
dispatch_semaphore_wait 函数
等待 Dispatch Semaphore
的计数值达到大于或等于1。当计数值大于等于 1,或者在待机中计数值大于等于1时,对该计数进行减法并从 dispatch_semaphore_wait 函数返回。
第二个参数与dispatch_group_wait 函数
等相同,由 dispatch_time_t类型值指定等待时间。该例的参数意味着永久等待。
另外,dispatch_semaphore_wait 函数的返回值也与 dispatch_group_wait 函数相同。可像以下源代码这样,通过返回值进行分支处理。
dispatch_semaphore_wait 函数返回0时,可安全地执行需要进行排他控制的处理。该处理结束时通过dispatch_semaphore_signal函数将Dispatch Semaphore的计数加1。
我们在前面的源代码中实际使用 Dispatch Semaphore 看看。
3.2.12dispatch_once
dispatch_once函数
是保证在应用程序执行中只执行一次指定处理的API。下面这种经常的用来进行初始化的源代码可以通过dispatch_once函数简化。
源代码看起来没有太大的变化。但是通过dispatch_once函数
,该源代码即使在多线程环境下执行,也可保证百分之百安全。
之前的源代码在大多数情况下也是安全的。但是在多核CPU中,在正在更新表示是否初始化的标志变量时读取,就有可能多次执行初始化处理。而用dispatch_once 函数初始化就不必担心这样的问题。这就是所说的单例模式
,在生成单例对象时使用。
3.2.13 Dispatch I/O
大家可能想过,在读取较大文件时,如果将文件分成合适的大小并使用Global Dispatch Queue并列读取的话,应该会比一般的读取速度快不少。现今的输入/输出硬件已经可以做到一次使用多个线程更快地并列读取了。能实现这一功能的就是DispatchI/O和Dispatch Date
。
可像上面这样,将文件分割为一块一块地进行读取处理。分割读取的数据通过使用Dispatch Data可更为简单地进行结合和分割。
下面为使用Dispatch I/O和 Dispatch Data的例子。
以上摘自Apple System Log API用的源代码(Libc-763.11 gen/aslc)。
dispatch_io_create 函数
生成Dispatch I/O,并指定发生错误时用来执行处理的Block,以及执行该Block的 Dispatch Queue。
dispatch_io_set_low_water 函数
设定一次读取的大小(分割大小),dispatch_io_read 函数
使用Global Dispatch Queue开始并列读取。每当各个分割的文件块读取结束时,将含有文件块数据的 Dispatch Data 传递给dispatch_io_read函数
指定的读取结束时回调用的Block。回调用的 Block 分析传递过来的Dispatch Data并进行结合处理。
如果想提高文件读取速度,可以尝试使用Dispatch I/O。
3.3GCD实现
3.3.1 Dispatch Queue
GCD的Dispatch Queue 非常方便,那么它究竟是如何实现的呢?
- 用于管理追加的Block的C语言实现的FIFO队列
- Atomic函数中实现的用于排他控制的轻量级信号
- 用于管理线程的C语言层实现的一些容器
回顾一下苹果的官方说明
通常,应用程序中编写的线程管理用的代码在系统级实现
实际上正如这句话所说,在系统即iOS和OS X的核心XNU内核级上实现。
因此,无论编程人员如何努力编写管理线程的代码,在性能方面也不可能胜过XNU内核级所实现的GCD。
使用GCD 要比使用pthreads 和 NSThread 这些一般的多线程编程API 更好。并且,如果使用 GCD 就不必编写为操作线程反复出现的类似的源代码(这被称为固定源代码片断)。
那么首先确认一下用于实现Dispatch Queue而使用的软件组件。
编程人员所使用GCD的API全部为包含在libdispatch库中的C语言函数。Dispatch Queue 通过结构体和链表,被实现为FIFO队列。FIFO队列管理是通过dispatch_async 等函数所追加的Block
Block 并不是直接加入 FIFO 队列,而是先加入Dispatch Continuation
这一dispatch_continuation_t类型结构体
中,然后再加入FIFO队列
。该 Dispatch Continuation 用于记忆 Block 所属的 Dispatch Group和其他一些信息,相当于一般常说的执行上下文。
Main Dispatch Queue 在 RunLoop 中执行Block。这并不是令人耳目一新的技术。 Global Dispatch Queue有如下8种。
- Global Dispatch Queue(High Priority)
- Global Dispatch Queue(Default Priority)
- Global Dispatch Queue(Low Priority)
- Global Dispatch Queue(Background Priority)
- Global Dispatch Queue(High Overcommit Priority)
- Global Dispatch Queue (Default Overcommit Priority)
- Global Dispatch Queue(Low Overcommit Priority)
- Global Dispatch Queue(Background Overcommit Priority)
优先级中附有 Overcommit
的 Global Dispatch Queue 使 用在 Serial Dispatch Queue 中
。如 Overcommit 这个名称所示,不管系统状态如何,都会强制生成线程的Dispatch Queue。
这8种Global Dispatch Queue 各使用1个pthread_workqueue
。GCD初始化时,使用pthread_workqueue_create_np 函数生成pthread_workqueue。
pthread_workqueue 包含在 Libc 提供的pthreads API 中。其使用bsdthread_register 和 workq_open系统调用,在初始化XNU内核的workqueue之后获取 workqueue信息。
XNU内核持有4种 workqueue。
- WORKQUEUE_HIGH_PRIOQUEUE
- WORKOUEUE_DEFAULT_PRIOQUEUE
- WORKQUEUE_LOW_PRIOQUEUE
- WORKQUEUE_BG_PRIOQUEUE
以上为4种执行优先级的workqueue。该执行优先级与Global Dispatch Queue的4种执行优先级相同。
下面看一下DispatchQueue中执行Block的过程。
当在Global Dispatch Queue中执行Block时, libdispatch 从Global Dispatch Queue 自身的 FIFO 队列中取出 Dispatch Continuation,调用pthread_workqueue_additem_np函数。将该Global Dispatch Queue 自身、符合其优先级的workqueue信息以及为执行Dispatch Continuation的回调函数等传递给参数。
pthread_workqueue_additem_np函数使用workq_kernreturn 系统调用,通知workqueue 增加应执行的项目。根据该通知,XNU内核基于系统状态判断是否要生成线程。如果是Overcommit优先级的Global Dispatch Queue,workqueue 则始终生成线程。
workqueue 的线程执行pthread_workqueue 函数,该函数调用libdispatch 的回调函数。在该回调函数中执行加入到 Dispatch Continuation 的 Block。
lock 执行结束后,进行通知 Dispatch Group 结束、释放 Dispatch Continuation 等处理,开始准备执行加入到Global Dispatch Queue 中的下一个 Block。
以上就是Dispatch Queue 执行的大概过程。
3.3.2 Dispatch Source
GCD中除了主要的Dispatch Queue 外,还有不太引人注目的 Dispatch Source
。它是 BSD 系内核惯有功能kqueue的包装。
kqueue 是在XNU内核中发生各种事件时,在应用程序编程方执行处理的技术。其CPU负荷非常小,尽量不占用资源。
Dispatch Source 可处理以下事件。
事件发生时,在指定的Dispatch Queue中可执行事件的处理。
下面我们使用 DISPATCH_SOURCE_TYPE_READ,异步读取文件映像。
实际上Dispatch Queue 没有“取消”
这一概念。一旦将处理追加到Dispatch Queue 中,就没有方法可将该处理去除,也没有方法可在执行中取消该处理。编程人员要么在处理中导入取消这一概念,要么放弃取消,或者使用 NSOperationQueue 等其他方法。
Dispatch Source 与Dispatch Queue 不同,是可以取消的。而且取消时必须执行的处理可指定为回调用的 Block形式。因此使用 Dispatch Source 实现 XNU 内核中发生的事件处理要比直接使用 kqueue 实现更为简单。在必须使用 kqueue 的情况下希望大家还是使用 Dispatch Source,它比较简单。