龙空技术网

如何理解 Java volatile 关键字?

少鹰说 812

前言:

此刻朋友们对“jschecked失效”大概比较关切,我们都想要了解一些“jschecked失效”的相关内容。那么小编也在网络上收集了一些有关“jschecked失效””的相关资讯,希望小伙伴们能喜欢,看官们一起来了解一下吧!

由于 CPU 缓存的存在及编译器/CPU 的指令重排,多线程程序的运行结果实际上很难预期,volatile 关键词是 JVM 提供的保证变量“可见性”的武器。JVM 会做许多底层的工作来保证这种可见性。

缓存让读写不确定

现代 CPU 有多级缓存,写指令的结果可能“很久”之后才会真正写入内存;同样的,读指令也可能读取的不是最新的值,而是“很久”之前缓存的值。例如对于下面代码:

public class Shared { private int count = 0; public void write() { count = 1; } public void read() { System.out.println(count); // ① }}

一个线程先调用 write ,在另一个线程调用 read 时,① 处的输出可能是 1 也可能是 0 。由于缓存的存在,在线程 2 读取 count 时,线程 1 的数据可能还没有真正写入内存,导致读取的是“旧值” 0:

多线程的程序中,一个线程写入的数据不能及时反映到另一个线程中,这就是可见性问题。此时会说一个线程对变量的修改对另一个线程不可见。

强制读写内存保证可见性

一个变量如果加了 volatile 关键词,JVM 变会保证它的“可见性”。简单地说,JVM 会:

在写入一个 volatile 变量时,强制它写入到内存中在读取一个 volatile 变量时,强制它从内存中读取

因此上面的例子中,如果我们改成下面代码,就可以保证如果一个线程先写入 counter = 1 ,另一个线程之后读取时,读到的 counter 值一定是 1 。

public class Shared { private volatile int counter = 0; //...}

事实上,当变量加了 volatile 后,JVM 做的不仅仅是上面说的,它还会保证 完全可见性 :

如果线程 A 写入 一个 volatile 变量,之后线程 B 读取该变量,则线程 A 写 入该变量之前线程就可见(定义的、修改的)的所有变量都将对线程 B 可见。JVM 会 强制将缓存中的这些变量写入内存中。如果线程 A 读取 一个 volatile 变量,则读取该变量之前线程 A 可见的所有 变量都会从内存中重新读取。

举个例子,下面的代码中,只有 count 变量加了 volatile ,但在写入 count 时,线程可见的其它变量( price )会随着 count 一起,被强制写入到内存中。

public class Order { private double price; private volatile int count; public void update(double price, int count) { this.price = price; this.count = count; }}

而下面的代码中,在读取 count 时,线程可见的所有变量都将从内存中重新读取,因此②中 price 的值是从刚从内存读取的“最新”的值。

public class Order { private double price; private volatile int count; public double howMuch() { int lCount = count ; // ① 此处会重新从内存中读取 price double lPrice = price; // ② return lCount * lPrice; }}

听着好像很复杂,其实总结下来,就是 JVM 会需要强制从内存中读写数据:

在写入 volatile 变量时,之前写的(在缓存里的)变量都会被强制写入内存中在读取 volatile 变量时,之前读的(在缓存里的)变量都会重新从内在中读取

指令重排

另一个难题是指令重排。为了提高执行效率,编译器在编译过程中会对指令进行重排,例如下面代码:

int a = 1;int b = 2;a++;b++

为了节省访问内存的开销,编译器可能会对某个变量的操作集中处理,变成:

int a = 1;a++;int b = 2;b++;

另一种可能的重排是 CPU 层面的,目的都是提升程序的执行速度。CPU 会保证在“没有竞争”的情况下,重排后的执行结果和顺序执行的结果是一样的。但在多线程有竞争情况下事情就复杂了起来。

限制指令重排

如果 JVM 只是强制将变量写回内存,由于指令重排的存在,实际上是达不到可见性保证的。假设:

public class Order { private double price; private volatile int count; public void update(double price, int count) { // this.price = price; // 由于指令重排,该语句的执行移到 count 之后 this.count = count; this.price = price; // 由于指令重排,语句的实际执行位置 }}

那么在写入 count 变量时,一同写入内存的 price 实际上是“旧值”。因此另一个线程读取 price 时读取的也是“旧值”, count 值是最新的,但 price 可能不是,这和我们的预期(完全可见性)不符。

因此除了上节中提到的强制在内存中读写数据,JVM 还需要限制指令重排,在编译/执行过程中:

在 volatile 变量的 写入 指令 之前 ,对其它变量的读写指令不能重排到该指令 之后 。在 volatile 变量的 读取 指令 之后 ,对其它变量的读写指令不能重排到该指令 之前 。

如下面的代码,JVM 会为 volatile 变量的读/写创建一个屏障,阻止指令的重排。

public class Order { private volatile int barrier; private int a; private int b; public int barrierTest() { int localA = a; this.a = 10; this.barrier = 100; // ▼ 上方的指令不能重排到下方,下方的指令允许重排到上方 int localBarrier = this.barrier; // ▲ 下方的指令不能重排到上方,上方的指令允许重排到下方 this.b = 20; int localB = this.b; return localA + localBarrier + localB; }}

有了这个限制,和上节说的强制内存读写一起,JVM 就可以为 volatile 变量提供“完全可见性”的保证。

为什么要保证“完全可见性”

为什么 JVM 要保证“完全可见性”?由于缓存和指令重排等机制,我们对程序执行顺序和执行结果的预期,可能跟真实的执行顺序和结果并不相同。此时究竟是预期有问题?还是执行结果出错?

因此我们需要和 JVM 之间有一个约定。JVM 约定了一个叫 happens-before的规则,如果两个操作 x , y , x 发生在 y 之前,记作 hb(x, y) ,同时还规定了一系列推导的规则。VM 的实现需要保证,程序能推导出的 happens-before 关系在执行结果上要能得到体现。

例如考虑以下 4 个操作:

线程 A 写入变量 X = 1线程 A 写入 volatile 变量 Y = 2线程 B 读取 volatile 变量 Y线程 B 读取变量 X

我们会预期步骤 #4 中变量的值 X 为 1 。如果没有任何约定,JVM 给我们的结果可能是 0 ,那么是谁的错呢?而在 happens-before 规则的约定之下,如果实际执行时步骤 #3 发生在步骤 #2 之后,则我们预期步骤 #4 中 X 为 1 就是一个正确的预期,如果 JVM 给出的结果不为 1,就是 JVM 的错误。

我们来看看 happens-before 其中的两条推导规则:

规则1:如果操作 x, y 在同一线程中执行,且在程序中 x 出现在 y 之前,则认为 hb(x, y)规则2:写入一个 volatile 变量的操作,发生在(happens before) 后续对该变量的读取之前。

根据规则1,我们有步骤 #1 > #2 、 #3 > #4 ,而如果实际执行时 #3 的确发生在 #2 之后,则根据规则2,我们有 #2 > #3 ,因此我们能确定在步骤 #4 时,JVM 需要保证我们能看到步骤 #1 的修改。

可以看到 JVM 对 volatile “完全可见性”的保证,根源上是对 happens-before 规则的遵守要付出的代价。

那么为什么要约定 happens-before 呢?(不要十万个为什么啊……)猜测是在预期上尽量接近程序员的理解(即顺序一致性),在实现上为优化保留足够的空间。

小结

volatile 的作用,简单理解是强制在内存读写数据,但由于 happens-before 规则的限制,JVM 的实现需要做一些额外的工作,主要是对所有可见变量的强制读写(到内存)及限制指令重排。

另外提一下, volatile 不能保证原子性,而 synchronized 可以。不过 synchronized 保证是的 synchronized 块之间的原子性、可见性、有序性,但是并不保证和那些 非 synchronized 块的关系,这也是不加 volatile 的 double-checked locking 失效的原因之一。

标签: #jschecked失效