内存屏障类型表
StoreLoad Barriers是一个“全能型 ”的屏障,它同时具有其他3个屏障的效果。现代的多处理器大多支持该屏障(其他类型的屏障不一定被所有处理器支持)。执行该屏障开销会很昂贵 ,因为当前处理器通常要把写缓冲区中的数据全部 刷新到内存中(Buffer Fully Flush)。 |
---|
JMM如何实现volatile写/读的内存语义
重排序分为编译器重排序和处理器重排序。为了实现volatile内存语义,JMM会分别限制这两种类型的重排序类型。下表是JMM针对编译器制定的volatile重排序规则表 |
---|
我们可以看出 |
·当第二个操作是volatile写时,不管第一个操作是什么,都不能重排序。这个规则确保volatile写之前的操作不会被编译器重排序到volatile写之后。 |
·当第一个操作是volatile读时,不管第二个操作是什么,都不能重排序。这个规则确保volatile读之后的操作不会被编译器重排序到volatile读之前。 |
·当第一个操作是volatile写,第二个操作是volatile读时,不能重排序。 |
为了实现volatile的内存语义,编译器在生成字节码时,会在指令序列中插入内存屏障 来禁止特定类型的处理器重排序。对于编译器来说,发现一个最优布置来最小化插入屏障的总数几乎不可能。为此,JMM采取保守策略 。下面是基于保守策略的JMM内存屏障插入策略。 |
·在每个volatile写操作的前面插入一个StoreStore屏障。 |
·在每个volatile写操作的后面插入一个StoreLoad屏障。 |
·在每个volatile读操作的后面插入一个LoadLoad屏障。 |
·在每个volatile读操作的后面插入一个LoadStore屏障。 |
上述内存屏障插入策略非常保守,但它可以保证在任意 处理器平台,任意的程序中都能得到正确的volatile内存语义。 |
下面是保守策略下,volatile写插入内存屏障后生成的指令序列示意图 |
---|
上图的StoreStore屏障可以保证在volatile写之前,其前面的所有普通写操作已经对任意处理器可见了。这是因为 StoreStore 屏障将保障上面所有的普通写 在volatile写之前刷新到主内存。(个人理解是防止volatile写普通写再把volatile写覆盖了,所以让他们先写) |
这里比较有意思的是,volatile写后面的 StoreLoad 屏障。此屏障的作用是避免volatile写 与后面可能有的volatile读/写操作重排序。(个人理解就是StoreLoad前的读写全处理干净了,StoreLoad后面相当于重新开始和前面不会产生一点关系)因为编译器常常无法准确判断在一个volatile写的后面是否需要插入一个StoreLoad屏障(比如,一个volatile写之后方法立即return)。为了保证能正确实现volatile的内存语义,JMM在采取了保守策略:在每个volatile写的后面,或者在每个volatile读的前面插入一个StoreLoad屏障。从整体执行效率的角度考虑,JMM最终选择了在每个volatile写的后面插入一个StoreLoad屏障。因为volatile写-读内存语义的常见使用模式是:一个写线程写volatile变量,多个读线程读同一个volatile变量 。当读线程的数量大大超过写线程时,选择在volatile写之后插入StoreLoad屏障将带来可观的执行效率的提升。从这里可以看到JMM在实现上的一个特点:首先确保正确性,然后再去追求执行效率 。 |
下面是在保守策略下,volatile读插入内存屏障后生成的指令序列示意图,如下图所示。 |
---|
LoadLoad 屏障用来禁止处理器把上面的volatile读 与下面的普通读 重排序。LoadStore 屏障用来禁止处理器把上面的volatile读 与下面的普通写 重排序。 |
由于volatile仅仅保证对单个volatile变量 的读/写具有原子性,而锁的互斥执行的特性可以确保对整个临界区代码 的执行具有原子性。在功能上,锁比volatile更强大;在可伸缩性和执行性能上,volatile更有优势。如果读者想在程序中用volatile代替锁,请一定谨慎,具体详情请参阅Brian Goetz的文章《Java理论与实践:正确使用Volatile变量》。 |
-----------------------------------------------------------------------------摘自 书名:Java并发编程的艺术 作者:方腾飞;魏鹏;程晓明