# 第十二章 Java内存模型与线程

本章中的内存模型和前面提到的Java内存模型是不一样的，本章中的内存模型主要是针对Java线程而言的，重点是探讨Cache和主存之间的关系。从机器的角度来看主存的速度依然跟不上CPU的运算速度，因此为每个CPU核心都配备了高速缓存称为Cache。这个高速缓存中存储主存中需要多次使用的变量的拷贝值，但是Cache中的变量值并不能代表该变量的真实值，只有将该变量的值写入主存之后才能代表这个变量的值被改变了，这是因为各个CPU核心之间不能访问其他核心的Cache，因此变量值的改变只有显现到主存之中才有意义。

对于Java中线程而言，内存也分为主存和工作内存两种：

* 主存：这和计算机中的主存概念相对应，这个主存是各个线程共享的。假如有一个变量存储在主存中，则各个线程都能够访问到这个变量。但是线程对变量的访问并不是直接从主存中读取变量的值，这显得太没有效率了。通常的做法是将变量的值拷贝到工作内存中，然后线程再对工作内存中的变量进行读写，如果变量是一个对象型，那么则会将该对象的某一个字段拷贝入工作内存中。

* 工作内存：这个概念和计算机中的Cache相对应。这个是各个线程独有的，其他的线程不能访问非本线程占有的Cache。当线程需要读取或写入变量的时候就会直接操作工作内存，而工作内存中的值是主存中提取而来的。

当然，这样的内存模型会带来一个问题，那就是A线程对变量V进行了写入，但此时写入还停留在Cache中，B线程对变量V也进行了写入，此时写入也还停留在Cache中。当两个写入都要进入主存时就会出现困难，这就是并发性问题。解决这个问题的关键就是对变量的加锁处理。首先要明确问题的所在：

* 原子性问题：并发场景中原子性是一个非常严重的问题，很多操作由于不是原子性的就可能会被其他操作抢占，造成最终结果的不一致性。

* 可见性问题：假如两个线程中一个对变量进行了修改，而另一个需要对变量的值进行读取，那么修改是否能够立即可见也成为了一个问题。、

* 有序性问题：通常为了程序执行效率，在保证程序执行正确性的前提下，Java引擎会对指令进行重排。这样的重排在线程内部是无法感知的，也就是线程内部指令执行的串行性，但是在另一个线程看来，指令的执行就是无序的。这种特性会造成假如某一个线程的执行可能会被另一个线程的执行的中间结果影响，那么就会造成问题。（例如：现在有两个线程，一个线程用于读配置文件，读取完成后将一个标志位设置为真。另一个线程循环检测该标志位，一旦检测为真就会使用配置文件。但是设置标志位为真的这个操作在另一个线程看来其出现时机并不是确定的，也就是说可能会出现读取线程还没有读取配置文件标志位就置为真的情况出现，那么这样就可能会造成另一个线程发生错误）

## 内存间相互操作

前面说了Java中的内存模型，正是由于这种主存，工作内存的模型，Java定义了8种内存操作，这些内存操作都是原子性的，但是在对`long`或`int`型时可能会出现非原子性的特性，这种特性被叫做非原子性协定，这种协定在现代Java虚拟机中已经不使用了，因此可以认为这8种内存操作都是百分百原子性的。这八种内存操作分别是：

* `lock`（锁定）：作用于主存的变量，它把变量标识成线程独占的状态。

* `unlock`（解锁）：作用于主存的变量，它把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他变量锁定。

* `read`（读取）：作用于主存的变量，它把一个变量从主存传输到线程的工作内存中，以便随后的`load`动作使用。

* `load`（载入）：作用于工作内存的变量，它把`read`操作从主存中得到的变量值放入工作内存的变量副本中。

* `use`（使用）：作用于工作内存的变量中，它把工作内存中一个变量的值传递给执行引擎，每当虚拟机遇到一个需要使用到变量的值的字节码指令时将会执行这个操作。

* `assign`（赋值）：作用域工作内存的变量，它把执行引擎传递给工作内存中一个变量的值，每当虚拟机遇到一个给变量赋值的的字节码指令时执行这个操作。

* `store`（存储）：作用于工作内存的变量，它把工作内存中的一个变量的值传送到主内存中，以便随后的`write`使用。

* `write`（写入）：作用于主内存的变量，它把`store`操作用工作内存中得到的变量的值放入主内存的变量中。

这八种操作之间有一定的偏序关系，也就是说他们的执行顺序是有一定规定的。比如说在使用`use`之前必须经过`load`操作，在`write`之前必须经过`store`操作。但是仅仅是定义了其偏序关系，并没有强制规定操作和操作之间连续执行，也就是说：操作和操作之间可以插入其他的操作。

## `volatile`操作

`volatile`是Java中最轻量级的一种并发同步措施，他起到的作用只有两个：

* 保证可见性：通常我们说Java中8种内存操作虽然存在偏序关系，但是并没有规定其连续执行，这就带来了一个问题：一个线程对变量的修改并不能马上生效。但是`volatile`却保证了8种内存操作的某几种组合不但偏序执行而且连续执行，这就保证了线程对有`volatile`修饰的变量的修改可以立即生效，因为一旦一个变量的修改被更新到主存，那么其他线程对这个变量的工作内存引用就会立即失效，迫使他们读取新的值。

* 保证有序性：因为线程内部存在指令重排的问题，因此很可能会出现当一个线程需要用到另一个线程的中间结果时由于指令重排的问题导致信号传递不正确。这时候使用`volatile`关键字修饰需要共享的变量就能够避免这种情况。这个关键字会保证使用该变量的指令不会被虚拟机引擎重排。

基于以上两个特点，Java中的单例模式就可以使用`volatile`来实现：

```Java
public class Singleton{
    private static volatile Singleton instance;
    public static Singleton getInstance(){
        if (instance == null){
            synchronized(Singleton.class){
                if (instance == null){
                    instance = new Singleton();
                }
            }
        }
        return instance;
    }
}
```
这是Java单例模式最好的写法，需要注意的是：这里的`instance`的`volatile`关键字是不能去掉的，因为虽然在方法中使用了`synchornized`关键字进行了加锁，而且这种锁在`unlock`也就是花括号结束的时候会强制将锁变量写入内存，但是这里的锁变量是`Singleton.class`并不是我们的需要的单例对象`instance`。这样就有一种可能：A线程对`instance`进行了初始化，但是这个改变没有被刷入内存就释放了`Singleton.class`。此时线程B也获得了锁，此时他发现`instance`依然是空，这就会造成错误。因此，使用`volatile`就能够保证某一个线程对单例对象的初始化会立刻生效。

需要注意的是：`volatile`关键字本身并不保证原子性，其修饰的变量在操作中并不保证原子性。

## 先行发生原则（happens-before）

先行发生原则表述的是Java内存操作中的某种偏序关系，在`volatile`关键字修饰的变量中就拥有很多`happens-before`关系，例如只有线程A对变量V执行的前一个操作是`load`的时候，线程A才能够对变量执行`use`操作。这样的`happens-before`操作是保证`volatile`关键字有序性和可见性的关键，这种规则也是Java执行引擎实现的。Java中还有一些天然的先行发生关系，比如说在单线程程序中写在前面的代码语句必定比写在后面的代码语句要先执行；当一个线程对某一个变量`lock`（锁定）时，对同一个变量的`unlock`（解锁）操作必定发生于`lock`操作之后。

当然，Java中的先行发生规则主要还是依靠`volatile`和`synchornized`来彰显。

## Java中的线程

Java中的线程有三种类型：

* 使用内核线程实现：这种线程也被称作是轻量级线程，直接采用操作系统提供的系统调用直接产生，这样的轻量级线程直接受到操作系统的调度，因此是代价高昂的，线程的调度，创建，杀死都需要进入内核态才能完成，这就意味着需要频繁地在内核态和用户态切换。这种线程模式由于轻量级进程和内核线程是一一对应的关系，因此也被叫做一对一的线程模型。

* 使用用户线程实现：这种模式不依赖于内核线程，内核完全感受不到用户线程的存在。这样的线程实现模型由于其不需要频繁的系统调用因此效率非常高。但是也因为其调度，销毁，创建等完全不需要内核的参与，因此实现起来比较复杂，有的时候甚至是不可实现的。目前用户态的线程模型使用的越来越少了，几乎被放弃了。由于其用户进程和线程是一对多的关系，因此这种线程模型又被叫做一对多线程模型。

* 使用用户线程加轻量级进程实现：这种情况下轻量级进程和用户态线程同时存在，用户态线程依然建立在用户空间中，其创建，切换和销毁等操作依然廉价，而轻量级进程（其实也就是高级系统调用）作为用户态线程和内核线程的桥梁，让用户态线程能够简单快捷地调度。由于用户态线程和内核线程的数目是多对多的，因此这种线程模型又叫做多对多线程模型。

Java的线程调度有两种模式：

* 协同式线程调度：这种线程调度个人觉得类似于线程之间使用`notify`和`wait`操作。也就是说一个线程会尽量执行，当执行到一定程度的时候会唤醒其他线程继续执行，这样协同式地执行。但是这种调度模式可能会出现某一个线程长时间执行的情况。

* 抢占式线程调度：这种调度模式就是通常的调度模式，线程可以通过设置优先级的方式来改变自己被调度执行的概率，但是这种方式往往是很没有效率的。

# 第十三章 线程安全与锁优化

本章主要探讨两个问题，一个是Java中的线程安全问题，另一个问题是Java中的锁。

## 线程安全的级别

Java中的线程安全从级别高到低分别是：

* 不可变：由于线程安全通常是多个线程对共享资源进行了并发更改导致竞争条件，因此只要一个资源被声明是不可变的就不会存在线程安全问题。在Java中不可变通常被关键字`final`来修饰。除此之外，Java中的某些对象，例如`java.lang.String`也是不可变的，我们调用它的方法时仅仅是创建一个新的对象，而并非是更改了原有的对象。这样的不可变对象即是线程安全的，而且是最顶级的线程安全。

* 绝对线程安全：这一类线程安全的要求是非常严苛的，他要求一个共享资源“不管运行环境如何，调用者都不需要任何额外的同步措施”。这样的要求在Java中是非常难以达到，甚至是不可能达到的。因为即使是声明为线程安全的对象，例如`java.util.Vector`也需要在并发访问时进行额外的同步措施，因为虽然这个对象的各个方法都被声明为线程安全，但是如果多个线程并发访问，还是可能会出现一个线程访问的索引是刚刚另一个线程删除的，而这种删除还没有全部完成，因此会出现该索引失效的异常情况。

* 相对线程安全：这种线程安全级别就是Java中非常常见的级别，通常我们说一个容器是线程安全的，指的就是它是相对线程安全。例如`java.util.Vector`对象，这个对象的每一个方法都被`sychronized`关键字修饰，是可以多线程并发访问的，不会出现多个线程同时调用同一个方法的情况。但是也并不是说这种线程安全对象就能够不作任何同步措施就进行并发使用了，依然会出现**绝对线程安全**中的情况。

* 线程兼容：这种是针对绝大部分的Java容器对象而言的，这些对象本身并不是线程安全的，例如`HashMap`对象等。但是可以通过使用`synchronized`来进行加锁，使其达到线程安全的状态，这种线程安全级别被叫做**线程兼容**

* 线程对立：这种状态就是所谓的无论采取什么样的措施都无法保证线程安全的状态，由于Java中本身就是支持多线程的，因此这种状态非常少见。

## 线程安全的实现方法

线程安全的实现方法有很多，分别有以下几种主要的手段：

* 互斥同步（阻塞同步）：互斥同步就是经常所谓的加锁同步，在Java中的操作对应就是使用`synchronized`代码块。Java中使用管程来对线程进行管理，在`synchronized`代码块的进入对应着`monitorenter`操作，在代码块的结束对应着`monitorexit`操作，分别代表着进入管程和退出管程。当线程获得一个对象的锁的时候别的线程就无法再获取同一个对象的锁，当其他线程尝试要获取已经加锁对象的锁时会被阻止并且进入到内核态被操作系统挂起（这是一个代价非常大的操作，因此`synchronized`操作要谨慎使用），当然，如果这个尝试获得锁的线程就是加锁线程本身，那么会成功地获取到，这叫做锁的可重入性，这也就保证了线程不会被自己锁死。除了`synchronized`代码块之外，还可以使用`java.util.concurrent`的`ReentrantLock`锁，这是重入锁，它和`synchronized`的作用相似，但是有三点不同：
  1. 等待可中断：如果线程等待一个重入锁的时间过长，可以选择放弃等待转而去做其他的事。
  2. 公平锁：当有多个线程同时申请重入锁时，线程获取锁的顺序是按照线程等待的时间来定的，也就是说越早等待的线程就会越先获得锁。在`synchrionzed`中则不具备这种公平性。
  3. 锁绑定多个条件：这个本人也没搞清楚是个什么意思
  
  在性能上，`synchronized`和`ReentrantLock`已经没有什么区别。但是虚拟机还是倾向于使用`synchronized`代码块来实现互斥同步的。
* 非阻塞同步：上面的互斥同步基于这样的一种前提：如果不进行同步那么程序的执行肯定要出错，这种互斥方法就是典型的**悲观锁**。还有一种互斥思路是所谓的**乐观锁**，这是一种基于冲突监测的方式，通俗的说就是先对共享资源进行操作，如果没有其他线程的争用那么这个操作就是成功的，否则就采取其他的补救措施（通常是重复执行直到成功）。这种同步需要硬件的支持，因为非阻塞同步的**“冲突检测”**和**“操作”**需要具有原子性。在这里介绍一个机器指令`CAS`这个操作有三个参数分别记做$V$ $A$ $B$，$V$代表变量的地址，$A$代表地址$V$中预期的值，仅当预期的值等于$A$的时候才将$B$的值赋给地址$V$。当然，这个操作是原子性的。在Java中这种非阻塞同步并不是通过特殊的语法实现，而是通过特定的类实现的，也就是说有的类就支持非阻塞同步而不用做更多的事了，例如`AtomicInteger`类。
* 无同步方案：这种方案就是不作任何同步措施。这种通常是针对两种类型的线程：
  1. 可重入代码：这种线程无论什么时候打断执行再恢复，它的执行结果都和原来一样。也就是说这种线程根本没有对共享资源的依赖，只要是相同的输入都会有相同的输出，其输出是可预测的。这种类型的线程不用同步，天生就是线程安全的。
  2. 线程本地存储：这种线程的对数据的访问的代码可以集中在一个线程中完成，或者可以使用`threadLocalMap`来实现线程对数据的独享，这样的线程也是安全的。

## 锁优化

锁优化的措施有很多种：

* 自旋锁：由于传统的加锁模型，如果一个线程无法获得锁那么就会进入内核态被操作系统挂起，这样往往是非常耗时的。自旋锁的优势在于当线程无法获取锁的时候会进入一个死循环而不进行挂起，这样虽然白白占用CPU时间，但是比起挂起的消耗要少很多。当等待一段时间（例如一百个循环）后，如果相应的锁被释放，那么线程就会获得锁，否则就进入内核态让操作系统挂起该线程以避免死循环过多占用过多的CPU时间。

* 锁消除：这是Java虚拟机自动为用户做的优化操作。代码中很多同步加锁操作其实都并非是用户自己做的，而是虚拟机自己出于安全考虑加上的。但是在执行时基于逃逸分析，有的加锁变量并不会被其他线程分享，那么这样的加锁操作反而会让程序的执行变得缓慢，这时候就要使用锁消除技术。

* 锁粗化：这是说有的加锁操作可能发生的很频繁，可能上一条代码刚刚进行完解锁操作，下一条代码就立即进行了加锁操作。这样频繁的加锁解锁操作会造成很大的性能浪费。因此就可以把多个加锁解锁操作“粗化”成一个大的同步代码块，这样效率会更高。

* 轻量级锁：这种锁依然是一种乐观锁，他假设在并发条件下，对于共享资源的争用依然是不激烈的，甚至在使用周期中很少或不出现对共享资源的争用。对于要加锁的对象，其对象头包含了两部分信息，分别是对象头信息以及指向方法区对象类型的指针，对象头信息中包含了该对象的`hashcode`，锁状态等信息，这部分信息被叫做`Mark Word`。在进行轻量级加锁时（此时加锁代码就是Java虚拟机栈的栈顶对应的方法），位于Java虚拟机栈栈顶的栈帧首先在内部开辟出一块名为`Lock Record`的区域，将需要加锁对象的`Mark Word`复制到`Lock Record`中，同时利用`CAS`指令将原来的`Markword`复制为指向`Lock Record`的指针，最后将栈帧某一部分指向对象，如果成功。那么就加锁成功，加锁对象的锁标志位也更改为相应的值。但是如果失败则要么说明之前已经成功，要么说明该对象已经被其他线程的方法锁定，如果是第一种情况，则直接进入同步代码块执行，如果是后一种情况则发生锁的“膨胀”，轻量级锁膨胀为重量级锁（传统的锁）。当轻量级锁需要解除的时候则直接进行加锁的逆操作即可。

* 偏向锁：这种锁相较于轻量级锁更为轻量，他甚至完全没有加锁的过程。所谓偏向就是字面意思上的偏向，当一个共享对象没有被任何线程加锁时，其对象头部存储着其`hashcode`等信息。当第一个加锁请求到来时，对象会将该线程的线程ID直接通过`CAS`操作保存在对象头中，如果该`CAS`操作成功那么就代表着偏向锁加锁成功，如果以后该线程仍需要加锁该对象（前提是这期间没有其他线程加锁该对象）则可以直接宣告加锁成功而不用多余的操作。如果有其他线程想要对该对象加锁，则视情况将对象的偏向锁撤销（该对象没有被加锁）或者退化为轻量级锁（该对象已经被加了轻量级锁）。