# Java语言

### 基础
* java对象在方法中按引用传递，所以在方法体中改变对象的值会在方法外产生影响
* 装箱拆箱：就是将基础类型转换成封装类或者将封装类型转换成基础类型的过程
* List的元素按添加时的顺序排列，HashSet、HashMap的元素是乱序的，TreeSet、TreeMap的元素是字母顺序排序的
* <? extends ClassA> 类型只能是ClassA或它的子类，<? super ClassA> 类型只能是ClassA或它的超类
* 泛型方法优先级高于泛型类，而且泛型方法不需要指定类型调用，static方法可以成为泛型方法，泛型方法定义格式：
<img src='../images/javase/泛型方法定义.png' width='300px'> 指定类型调用泛型方法：在点操作符合方法名之间添加尖括号和类型
* transient阻止自动序列化
* 有序集合的排序对比使用的是compareTo，其他集合使用的是equals
* java多线程由于线程数量过多会导致栈溢出，这时可以调小堆空间或者调大栈空间解决，因为总内存-堆内存-方法区内存=栈内存，给线程分配内存的是栈内存，栈内存大，可分配线程数多，可以多分配线程；堆空间小，栈空间大，可以多分配线程
* HashMap：
    * 一个线性的数组链表，即`Entry[]`，`Entry`是一个静态内部类，是一个链表结构
    * 插入数据，通过key的hashcode取余Entry数组的长度，决定数据存放在数组的哪个位置，当且仅当hashcode相同并且key相同才会判定为同一元素，才会用新值覆盖旧值
    * HashSet的底层是使用HashMap存储数据，所有的元素都存在HashMap的key中
    
### 面向对象
* 重载(overwrite)是相同函数名不同参数，返回值不能区别重载，覆写(override)是子类覆写父类的方法，方法名和参数以及修饰符返回值都必须一模一样
* java初始化顺序，继承结构中的static字段->类继承结构中的非static字段（调用时初始化）->继承结构中的构造器
* private方法隐式指定final，final类中所有字段隐式指定final
* 除了static和final方法，其他方法都是动态绑定，但是申明为final方法对性能提高不大
* 接口的字段是隐式static final的，方法是public的
* java在构造函数中调用多态是会生效，但是要避免
* 协变返回类型，允许多态方法的返回值是同一类类型
<img src='../images/javase/协变返回类型示例.png' width='300px'>
* 内部类声明为static则为嵌套类，表明内部类和外部类之间的this关键字联系被斩断了
* 多态，指同一类型的对象，针对不同的消息，做出不同的反应

### Java8
* https://www.journaldev.com/2389/java-8-features-with-examples


### Java9
* https://www.journaldev.com/13121/java-9-features-with-examples


### Java10
* https://www.journaldev.com/20395/java-10-features

****

# Java NIO
### 缓冲区，Buffer
* 缓冲区操作流程：
    * 注意：缓冲区实际操作的是虚拟内存地址
    * 进程发起READ()系统调用，读取数据到进程空间的缓冲区
    * 内核接受到命令后，向磁盘控制硬件发出命令从磁盘读取数据
    * DMA将磁盘数据直接写入内核内存缓冲区
    * 内核将内核缓冲区中的数据拷贝到进程READ()操作指定的缓冲区中
* Buffer类：
    * 属性
        * Capacity：容量，缓冲区能够容纳的数据元素的最大数量
        * Limit：上界，缓冲区中第一个不能被读或者写的元素
        * Position：下一个要被读或写的元素索引
        * Mark：一个备忘位置，记录当前position的位置
        * `0 <= mark <= position <= limit <= capacity`
    * 方法：
        * get(), put()：读写缓冲区
        * flip()：将limit设置为当前position，然后将position设置为0
        * clear()：将limit设置为capacity，然后将position设置为0
        * compact()：将当前position到limit之间的数据复制到0开始的位置，并将position设置为复制后第一个可读写的位置，limit设置为capacity
        * mark()：将mark标记为当前position
        * reset()：将position标记为当前mark
    * 被认定为相等的方法：
        * buffer的数据类型必须相同
        * buffer的剩余同样数量的元素
        * 通过get操作返回的剩余数据元素必须一致
    * 创建缓冲区：
        * allocate()静态方法
        * wrap()静态方法
        * duplicate()：复制一份一模一样的缓冲区，对一个的改变会影响到另一个，但是各自拥有不同的position, limit等属性
        * slice()：分割缓冲区，创建一个从原始缓冲区position到limit之间的新缓冲区
        * asXXXBuffer()：静态方法返回原缓冲区的视图，同样是共享数据的

### 通道，Channel
* 通道用来建立缓冲区与文件或套接字之间的连接，方便数据的传输，缓冲区是通道内部用来发送和接收数据的端点，通道将数据传输给Buffer对象或者从Buffer对象获取数据
* 通道的关闭：
    * 通道的关闭过程在底层会产生阻塞，即使使用非阻塞的通道，该阻塞操作还是不能避免
    * 当操作通道的线程被中断时，通道也会被关闭
* 发散和汇聚操作：避免多次系统调用
    * Scatter发散是指进程读数据时指定多个缓冲区，将数据分散读到多个缓冲区中
    * Gather汇聚是指进程写数据时指定多个缓冲区，将多个缓冲区中的数据一次性写入到通道中
* 通道的类型
    * 文件通道，FileChannel类：
        * 通过RandomAccessFile, FileInputStream, FileOutputStream的getChannel()方法获取文件通道实例
        * 文件通道是双向，并且只能是阻塞的通道
        * 所有读写文件操作都是直接处理buffer，而不是处理流对象，buffer是可以反复操作的，而流对象是一次性的；buffer意味着一块一块的读，流对象意味着一字节一字节的读
        * 非内存映射文件的读写方式的底层还是需要执行系统调用
        * transferTo()和transferFrom()：将数据在channel和channel之间传输，其中传输的一端必须是FileChannel类型，数据无需经过缓冲区，直接在channel之间进行传输
        * 内存映射文件：
            * 主要是将用户空间的虚拟页和内核空间的虚拟页映射到同一物理页上，避免系统调用和用户空间到内核空间的数据拷贝操作
            * map()：返回MappedByteBuffer对象，该缓冲区的中的数据元素是直接存储在磁盘上的一个文件中，所有的读写操作会立即更新到文件中
            * load()：操作会将映射文件加载到内存中，堆内内存
            * 映射文件使用的是堆外内存
    * socket通道：
        * socket通道是双向，既可以为阻塞的有可以为非阻塞的通道，通过configureBlocking()方法配置，参数true为阻塞模式，false为非阻塞模式
        * ServerSocketChannel：
            * 静态open()方法返回ServerSocketChannel的实例
            * socket()方法返回对等的ServerSocket对象，用来进行绑定操作
            * 如果调用ServerSocket对象的accept方法，总是阻塞并且返回Socket对象
            * 如果调用ServerSocketChannel对象的accept方法，不会阻塞（前提是开启了非阻塞模式），并且返回SocketChannel对象，如果没有连接时，accept方法会返回null
        * SocketChannel：
            * 静态open()方法返回SocketChannel的实例
            * socket()方法返回对等的Socket对象，在Socket对象上调用getChannel()方法可以返回对等的SocketChannel实例
            * 如果使用Socket对象的connect()方法，会阻塞直到连接成功
            * 如果使用SocketChannel对象的connect()方法，不会阻塞（前提是开启了非阻塞模式），连接成功返回true，否则返回false
        * DatagramChannel：
            * 静态open()方法返回DatagramChannel的实例
            * socket()方法返回对等的DatagramSocket对象，用来进行绑定操作
            * DatagramChannel可以不连接就发送数据，这时数据包可以发送给任意目的地址，服务器也可以接受任意地址的数据；如果使用了连接操作，则只会接受连接地址的数据
            * send方法返回的字节数只代表数据被加入到了本地的网络传输队列
            
### 选择器，Selector
* 工作原理：将通道注册到选择器上，同时会返回代表该通道和选择器的键，该键会追踪通道的状态；选择器调用select方法时，会遍历所有注册到该选择器的通道，返回那些已经准备就绪的通道，然后开始执行操作
* Selector：选择器
    * 选择器类管理着一个被注册的通道集合的信息和他们的就绪状态，通道是和选择器一起被注册的，并且使用选择器来更新通道的就绪状态
* SelectableChannel：可选择通道
    * 只有可选择通道可以被注册到选择器上，一个通道可以被注册到多个选择器上，每个选择器只能被注册一次
* SelectionKey：选择键
    * 封装特定的通道与特定选择器的注册关系以及该注册关系关心的通道操作

### 系统底层
* 用户空间和内核空间：
    * 用户空间指常规进程所在的区域，该区域的代码不能直接访问硬件设备，同理硬件设备不能直接访问用户空间的数据
    * 内核空间指操作系统所在的区域，能与设备空间器通讯，控制用户区域的进程运行状态，并且所有的I/O操作直接或者间接通过内核空间完成
* 虚拟内存：操作系统提供给内核空间和用户空间使用
    * 一个以上的虚拟地址可以指向同一个物理内存地址
    * 虚拟内存空间可大于实际可用的硬件内存
    * 内存页面调度过程：
        * CPU引用某内存地址时，MMU负责确定该地址所在页，并将虚拟页号转换为物理页号
        * 当MMU找不到虚拟页号对应的物理页号时，向CPU报错
        * CPU接收到错误时，验证该虚拟页的有效性
            * 如果该虚拟页有效，则会将对应的物理页从磁盘调入内存，并按照一定规则将其他物理页刷入磁盘
            * 如果虚拟页无效，则会产生段错误，应用程序直接强制退出
        * MMU根据调度结果，刷新虚拟页到物理页的映射
    * 虚拟内存页调度下的I/O操作：
        * 确定请求数据分布在系统的哪些页
        * 在内核分配足够的虚拟内存页
        * 将虚拟内存页与磁盘文件系统页建立映射
        * 为虚拟内存页发起页调度请求，将虚拟内存对应的物理页更新到内存中，并更新MMU中的虚拟页到物理页的映射
        * 页调度完成后，将数据加载到虚拟页对应的物理页中，将数据读入内存
        
### Netty实战
* BIO：
    * 同步阻塞IO
    * accept操作会同步阻塞服务端程序
    * 每个accept操作成功后，需要新起一个线程保证服务端的并发性
    * 线程数量的配置就是系统的瓶颈，通过线程池管理线程，可以缓解该问题
    * 读写操作都是同步阻塞的，相对依赖对方的处理能力
* NIO：
    * 同步非阻塞IO
    * 通道链接实际的操作接口，在通道中传输buffer，select负责选择就绪的通道
    * 底层使用的是epoll()系统调用，没有连接句柄的限制，可以一个Select轮训无限个通道
    * 读写操作都是异步的，如果没有数组读写并不会阻塞
* AIO：
    * 异步非阻塞IO
    * 无需Select轮训通道的状态，通过Future接受操作系统的通知，一旦操作系统接收到了通知就会告诉程序去执行Future指定的方法
* 半包处理方式：
    * 消息定长，发送和接收固定长度的消息内容：FixedLengthFrameDecoder
    * 通过增加人为的分隔符进行消息分隔：LineBasedFrameDecoder，DelimiterBasedFrameDecoder
    * 将消息拆分，分为消息头和消息体，消息头表明消息的长度

****

# Java并发编程

#### 并发与并行的区别：
* 并发是指交替执行的程序（单核下的多线程编程），并行是指同时执行的程序（分布式系统，多核下的多线程编程）

#### volatile关键字
* 保证变量值每次都是从主内存中读取，不会读取线程工作内存中的缓存，保证变量的可见性（有线程对变量进行修改，另外的线程可以看到最新的修改）
* volatile关键字声明的变量读写比普通变量的读写开销更大
* volatile不保证操作的原子性，原子性保障还是需要加锁，但是volatile会保障变量在内存模型中读写的原子性（尤其对long和double类型重要）
* 适用于单写多读（其中多度当且仅当只读变量的一种状态，状态监控）或者变量的值一旦被改变并且能读到最新的值的场景

#### synchronized关键字
* synchronized对象内置锁，进入同步代码块自动获得锁，（无论异常正常）退出同步代码块自动释放锁
* synchronized对象内置锁可以重入：某个线程请求获得一个已经由它持有的锁时，会成功，否则会失败并导致线程阻塞
* synchronized对象内置锁，既保证加锁，又保证可见性
* 在底层会生成一个监控器对象保证同步操作，有用户态到内核态的切换

#### ReentrantLock类
* Lock接口的实现类
* 显示锁，需要手动调用lock和unlock方法，实现方法必须包含在try-finally代码块中，并且在finally中调用unlock方法
* 提供公平性获取锁的方式，会让等待时间最长的线程先获得锁，初始化时指定fair属性
* tryLock方法尝试获取锁，减少线程阻塞时间（如果当前锁志愿被占用则会立刻返回），带上时间参数可以避免无限等待锁资源
* 可以获取所有在等待该锁的线程

#### ReentrantReadWriteLock类
* ReadWriteLock接口的实现类
* 显示读写锁，维护一对关联的锁，一个用于只读操作一个用于写
* 在没有写线程的情况下一个读锁可能会同时被多个读线程持有
* 最多支持65535个写锁和65535个读锁
* 与普通显示锁用法一致，要区分读锁和写锁，只有读-读可以共同持有读锁，其他都是互斥的操作

#### Condition类
* 当使用ReentrantLock显示锁时，用来实现线程之间的通信，await和signal操作等同于synchronized中的wait和notify
* 锁代码块结束后，被signal的线程才会开始竞争锁资源
* ReentrantLock.lock()将线程加入AQS队列，Condition.await()会将线程从AQS队列中移除释放锁，同时将线程加入到Condition队列中等待signal操作
* Condition.signal操作将线程从Condition队列中删除，并将其加入到AQS队列中，等待下一次的锁竞争
* 一个ReentrantLock可以生成多个不同的Condition条件谓词，等待不同的事件

#### wait, notify, notifyAll方法
* 主要用来作为对象在线程之间通信，例如消费者和生产者模式中
* wait会释放锁，进入wait操作之前会释放当前对象的锁，退出wait操作之前会重新获取该对象的锁
* notify操作会唤醒等待对应对象锁（资源）的一个线程，notifyAll会唤醒等待对应对象锁（资源）的所有线程，并且等同步块结束后被通知的线程才会开始竞争锁
* 如果等待的所有线程在满足条件时只有一个线程可以执行，则使用notify好于notifyAll，因为即使使用notifyAll通知唤醒所有线程，最终还是只有一个线程可以获得执行条件，其他的线程又会被等待，这样白白浪费CPU时间（注意：notify有可能导致其他的线程吞掉重要的通知而通知不到真正需要被通知的线程，notifyAll不会）
* 三个方法都需要在同步块中调用，因为调用它们会释放底层的监视器对象

#### yield方法：只是释放CPU资源，让线程调度器可以选择新的线程执行

#### sleep方法：将当前线程暂停一段时间，并不会释放已经获得的锁

#### join方法：join方法会阻塞当前线程，直到新join的线程执行完成

#### setDaemon方法：将线程设为守护线程，在后台执行，只要前台线程执行完成，将会自动退出，且不影响JVM的退出

#### interrupted, isInterrupted方法
* interrupt()中断目标线程，如果要保存线程中断状态，需要在finally中在调用一次本线程的interrupt()方法
* interrupted()来检查中断状态时，中断状态会被清零
* isInterrupted()用来查询其它线程的中断状态且不会改变中断状态标识
* 阻塞方法sleep和wait都会检查中断状态，响应中断时会提前结束线程，抛出InterruptedException，并且将中断标志清除
* 通过在线程所有者调用interrupt()，结束那些在线程中调用阻塞方法的线程（这种情况一般是因为标志位由于阻塞的存在而无效）

#### CountDownLatch类
* 计数器表示要等待的事件数量，该计数无法重置，无法重复利用
* 减数方式表示对应事件已经发生
* 当计数为0时，唤醒所有等待该资源的线程
* countDown()将计数减1，await()方法只进行阻塞，对计数没影响
* 主要是用于等待事件（其他线程完成对应的工作便将计数减1，且计数减1后会继续后续的执行，当计数为0时，表示事件全部处理完成，可以汇总结果了）

#### CyclicBarrier类
* 计数器表示要等待的事件数量，可以重复利用
* 从0开始计数，当计数达到指定数字时，计数器恢复到0重新开始计数
* 当计数达到指定数值时，释放所有等待线程，并唤醒CyclicBarrier构造函数中指定的任务
* await()将对应计数器加1
* 主要是用于等待线程（其他线程完成初始化工作后调用await()将计数加1，且线程会阻塞在此处，直到计数达到指定值后，所有线程都完成初始化，这些线程可以继续工作）

#### Semaphore类
* 计数器表示虚拟的许可数量，通过构造函数传入，表示同时最多有多少线程开始操作
* acquire()会将许可计数减1（如果当前没有可用的许可将会被阻塞）；release()会将许可计数加1（如果当前没有可以被释放的许可将会被阻塞）
* 实用将容器构造成有界阻塞容器

#### FutureTask类
* 通过封装Callable完成计算
* 包括等待运行，正在运行，运行完成三种状态（运行完成状态是不可逆的，正常结算，取消任务，异常结束运行完成）
* get操作如果任务执行完成立即返回，否则会被阻塞直到任务完成

#### CompletionService类：实践
* 对Executor和BlockQueue进行封装
* 将任务提交给Executor执行，当执行完成后添加到BlockQueue中，这是里通过FutureTask的子类QueueingFuture重新done方法实现
* 通过BlockQueue的take操作获取已经完成的任务

#### Runnable和Callable接口
* Runnable无返回值，无法抛出受检查的异常，主要是run方法
* Callable可以返回执行结果，可以抛出受检查的异常，主要是call方法

#### Thread Dump文件、线程堆栈信息调试线程
* 获取到线程的pid，可以通过使用jps命令，在Linux环境下还可以使用ps -ef | grep java
* 打印线程堆栈，可以通过使用jstack pid命令，在Linux环境下还可以使用kill -3 pid

#### AbstractQueuedSynchronizer类
* 同步器类实现的基类，主要通过覆写tryAcquire(), tryRelease(), tryAcquireShared(), tryReleaseShared(), acquire(), release(), acquireShared(), releaseShared()等方法，修改线程同步状态，表示线程是否被锁占用，或者说线程目前处于什么状态
* 维护一个队列，存放被阻塞的线程
* ReentrantLock，Semaphore，ReentrantReadWriteLock，CountDownLatch，SynchronousQueue，FutureTask都是基于此类实现

#### 线程安全
* 保障线程安全，本质是保证线程间共享数据时的安全
    * 将变量修改为不可变变量（可变性）
        * 不可变变量，创建后状态就不可变，所有的域都是final类型，创建对象时this没有逸出
        * 事实不可变对象指的是对象本身并不是不可变对象，但是在使用中不去改变它的值，把它当不可变对象使用
        * 如果将可变对象封装到不可变对象中（加上volatile关键字保证可见性），也是线程安全的
        * 不可变对象可以随便发布，事实不可变对象必须通过安全方式发布，可变对象必须是通过安全方式发布，并且是线程安全的或由锁保护起来
            * 发布是指将类对象的作用域扩大到其他类当中去，包括组合，全局静态变量，逃逸是指某个不该被发布的对象被发布出去了，不要在构造函数中启动线程造成this逸出）
            * 在静态初始化函数中初始化对象
            * 将对象引用保存到AtomicReferance中或声明为volatile类型
            * 将对象定义为final域
            * 将对象保存到有锁的域中（所有线程安全的容器，Hashtable，SynchronizedMap，ConcurrentMap，Vector，CopyOnWriteArrayList，CopyOnWriteArraySet，SynchronizedList，SynchronizedSet，BlockingQueue，ConcurrentLinkedQueue），但是对象本身的线程安全还是需要同步机制保障
    * 线程封闭：
        * 栈封闭，也就是数据变量使用局部变量
        * ThreadLocal类，保障变量在线程中有一份独立的副本，将变量转化成线程独有
    * 实例封闭：将线程不安全的对象封装在另一个类中，并对不安全对象访问加锁保证同步
    * 在访问变量时使用同步机制（原子性，可见性）
        * 同步机制包括：synchronized加锁，volatile类型变量，显示锁，原子变量
* 无状态变量、不可变变量一定是线程安全的
* 需要保障原子性操作的情况：竞态条件（由于执行顺序不同导致结果不一致，典型例子：先检查后执行），加锁保障原子性操作
* 线程泄露问题：当TimerTask抛出未检查异常时，将会终止定时线程，并且Timer会取消执行，这时已经被调度的TimerTask不会被执行了，新任务也不会被调度，尽量使用ScheduledThreadPoolExecutor避免这种现象

#### 容器
* 同步容器：Vector，Hashtable，是通过对其操作的时候加锁保证同步
    * 同步容器本身是线程安全的，但是对于同步容器的复合操作仍然需要加锁保证线程安全：例如容器的迭代，修改容器的大小
        * 可以让克隆同步容器，生成同步容器的局部变量，在容器的副本上进行操作
* 并发容器：
    * ConcurrentLinkedQueue：非阻塞同步队列，通过CAS保证入队列和出队列操作的一致性
    * ConcurrentHashMap：采取分段锁，可以同时多线程读和写，size，isEmpty操作都是估算值，并且加入了部分检查后在执行的原子操作
    * CopyOnWriteArrayList：每次写的时候会复制底层数组，生成一份新的副本
    * BlockingQueue：阻塞队列，当队列为空时，take操作将会被阻塞；当队列满了后put操作将会被阻塞，offer和poll操作是非阻塞，适用生产者消费者模式
        * LinkedBlockingQueue，ArrayBlockingQueue：FIFO队列，对应LinkedList和ArrayList
        * PriorityBlockingQueue：优先级队列，根据元素的优先级排序（实现Comparable接口），也可以按Comparator排序
        * SynchronousQueue：同步队列，没有为队列中的元素准备存储空间，而是维护一组线程，这些线程在等待入队或出队操作
        * DelayQueue：延迟队列，每个对象都有一个延迟时间，配合ScheduledThreadPoolExecutor完成调度
    * BlockingDeque：双端队列，队列头和队列尾都可以插入和读取的阻塞队列，适用工作密取模式
        * LinkedBlockingDeque，ArrayDeque：FIFO队列，对应LinkedList和ArrayList
    * ConcurrentSkipListMap，ConcurrentSkipListSet：对应SortedMap和SortedSet

#### 线程池管理
* 无限制创建线程的不足：
    * 线程生命周期的开销很大，会影响响应时间
    * 消耗资源，线程数多于处理器数量会导致线程闲置，闲置的线程也会耗费资源，线程竞争也会增加开销，如果CPU已经满负荷了，再添加线程是无意义的
    * 导致程序不稳定，线程数量太多会导致OutofMemoryError，不能超过JVM的限制或者操作系统的限制
* 线程池应用的策略：
    * 线程池不适应于一下几种任务类型：
        * 线程之间的任务有依赖性：如果线程池不够大，依赖的任务被放入了任务队列，有可能造成死锁
        * 对响应时间敏感的任务：如果线程池不够大，任务会被加入任务队列，因此增加了响应时间
        * 只有同类型且相互独立的任务，线程池的性能才能达到最大
    * 线程池线程数量大小设定参考公式：（计算密集型的任务，线程池大小等于CPU数量+1最优）
        <img src='../images/javase/线程池大小计算公式.png' width='350px'>
* Executor接口，管理线程池的基础接口：
    * 只有execute方法，执行runnable接口任务
    * 采用消费者-生产者模式管理线程，提交任务的线程是生产者，执行任务的线程是消费者，工作队列管理任务，完全将任务的提交和任务的执行解耦
    * 线程池的优势：
        * 处理过多请求时，可以分摊线程创建和销毁的时间
        * 避免了线程创建时的时间开销，提高响应速度
        * 调整合适的线程池大小，可以避免无限制创建线程而导致的问题
    * 四种线程池策略：
        * newFixedThreadPool：固定线程数大小的线程池，当线程数量达到最大线程数就会停止创建新线程（无界队列）
        * newCachedThreadPool： 无限制大小的线程池，当线程数超过需要处理的任务时，线程会被回收（同步队列）
        * newSingleThreadPool：只创建一个线程执行任务，因此任务会堆积在工作队列中（无界队列）
        * newScheduledThreadPool：跟固定线程数大小的线程池类似，只不过多了一个Timer触发线程的执行（延迟队列）
    * Executor执行任务的四个周期：创建任务，提交任务，开始任务，完成任务
    * ExecutorService继承Executor接口，完成线程池生命周期的管理，必须关闭线程池，应用程序才会正常退出
        * ExecutorService创建成功即进入运行状态
        * shutdown平缓关闭线程池，停止接受新任务提交，同时等待那些还未完成的任务执行完，包括在任务队列中等待的任务
        * shutdownNow粗暴关闭线程池，取消所有正在执行的任务，在任务队列中等待的任务也不再执行
        * 线程池关闭后，将进入terminate终止状态，可以通过awaitTermination等待该状态，或者轮询isTerminate判断是否达到该状态
        * 线程池关闭后，再提交任务要么交给RejectedExecutionHandler处理，要么抛出RejectedExecutionException
    * ThreadPoolExecutor实现ExecutorService接口，提供个性化的线程池构造方法：
        ``` java
            public ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime,
                                      TimeUnit unit, BlockingQueue<Runnable> workQueue,
                                      ThreadFactory threadFactory, RejectedExecutionHandler handler)
         ```
        * ```corePoolSize```：线程池核心线程数大小
            * 当线程池中的线程数没达到该值时，直接创建线程处理新提交的任务
            * 当线程数达到该值后还有新任务提交则将任务添加的阻塞队列中
        * ```maximumPoolSize```：线程池中线程数最大值
            * 当线程池中的线程数达到corePoolSize时，并且阻塞队列已满，还有新任务提交进来，则继续创建线程处理，直到线程数达到该值为止
            * 当任务队列处理完后，会标记线程的空闲时间是否超过存活时间，并对应的标记线程为可回收
            * 线程池回收线程的数量在$maximumPoolSize-corePoolSize$之间
        * ```keepAliveTime```：线程存活时间
        * ```unit```：线程存活时间的单位
        * ```workQueue```：阻塞式任务队列，分为有界队列，无界队列，同步移交队列和延迟队列四种
        * ```handler```：当线程池中的线程数达到最大值，且任务队列也满，将采用饱和策略，分为如下四种
            * AbortPolicy：终止策略，默认值，抛出RejectedExecutionException
            * DiscardPolicy：抛弃策略，不做任何实现，直接将新任务抛弃
            * DiscardOldestPolicy：抛弃最旧的策略，将会移除目前队列头的任务，然后提交新任务
            * CallerRunsPolicy：调用者运行策略，新任务将会在主线程中被执行（线程池的调用者）
        * ```threadFactory```：创建线程的工厂，可以自定义创建线程的过程（多打日志，修改配置信息等）

#### 线程活跃性问题
* 基础概念：
    <table>
        <tr>
            <td><center>线程状态：</center><img src='../images/javase/线程状态.png' width='500px'></td>
            <td><center>死锁产生的条件：</center><img src='../images/javase/死锁条件.png' width='500px'></td>
        </tr>
    </table>
* 死锁分类
    * 获取锁顺序相关的死锁
        * 锁顺序死锁（方法级别）：两个线程以不同的顺序调用两个方法获取相同的锁；如果所有线程都以固定的顺序获得锁，就不会出现锁顺序死锁的问题
        * 动态的锁顺序死锁（参数级别）：方法对参数A和参数B分别加锁，调用方法时使用不同的顺序传入参数A和参数造成死锁
        * 协作对象之间发生死锁（类级别）：A对象中某加锁方法调用B对象某加锁方法，同时B对象另一个加锁方法调用A对象另一个加锁方法，当线程分别调用这两个不同的方法时会产生死锁
            * 开放调用：如果在调用某个方法时不需要持有锁，那么这种方法被称为开放调用；把同步代码块范围缩小，不要直接把整个方法都锁定
    * 资源死锁
        * A线程拥有B线程的资源并且在等待B线程释放另一个资源，同时B线程拥有A线程的资源且也在等待A线程释放资源
        * 饥饿死锁：如果所有正在执行任务的线程都由于等待其他处于工作队列中的任务而阻塞，就叫饥饿死锁
* 活锁：过度的恢复代码导致，任务失败后重新放入任务队列重试（此时的失败是不可恢复的），失败重试就成了死循环，导致后面的任务无法得到执行

#### 性能与可伸缩性
* 性能指标：服务时间，延迟时间，吞吐量，响应性，效率，可伸缩性，容量
    * 服务时间，等待时间衡量运行速度，指单个任务要多快才能处理完成
    * 生产量，吞吐率衡量处理能力，在计算资源一定的情况下，能完成多少任务
    * 在调整性能时，多快和多少两种类型的调优大部分是冲突的，多快要求任务都集中处理，多少要求尽可能把任务拆分
    * 可伸缩性：当增加技术资源时（CPU，内存，存储容量，IO带宽），程序的吞吐量或处理能力相应增加
* Amdahl定律判断程序最多提速多少：加速比$=SpeedUp \leq \frac{1}{F + \frac{1-F}{N}}$，F是程序必须串行执行的部分，N是处理器个数
* 减少锁竞争可以同时提高性能和可伸缩性，有如下方式：
    * 缩小锁的范围：
        * 尽可能缩短锁的持有时间，通过缩小同步块的范围实现
    * 减小锁的粒度
        * 尽可能降低线程请求锁的频率
        * 锁分解：如果一个锁需要保护多个独立的状态变量，那么可以将这个锁分解为多个锁，并且每个锁只保护一个变量
        * 锁分段：在锁分解技术的基础上，进一步扩展为对一组独立对象上的锁进行分解
        * 锁分解意味着一个锁管理两个变量，从而分解成两个锁分别管理这两个对象；锁分段意味着一个锁管理一个变量时，将这个变量分为多个段，然后对应的锁也分解为多个锁，通过多个锁管理一个变量的多个分段，例如ConcurrentHashMap

#### 原子变量，非阻塞同步机制
* CAS操作原理，乐观锁：比较并交换，在内存记录上次的数据V，对比线程目前的值A，如果A==V，则将V更新为B，并且无论A是否等于V都将返回V原有的值
* AtomicXXX：原子变量都支持CAS操作
* 高度竞争情况下，锁并发性好，一般竞争情况下，原子变量并发性好

****

# 多线程编程实战
### 案列一：生产消息和消费消息
* 问题分析：
    * 生产者主程序在一定时间内启动多个线程随机产生Topic或者Queue类型的消息，超过时间强行kill主程序
    * 消费者主程序启动多个消费者线程消费生产者生产的消息，要求每个消费者线程绑定一个Queue类型的消息和多个Topic类型的消息
    * 消费Queue类型消息时，直接消费
    * 消费Topic类型消息时，需要找出该Topic消息绑定的Queue消息（标记Queue在Topic中的位置，并从该位置开始消费Topic消息）
* 生产者的解决方案：
    * 现有的解决方案：
        * 消息的结构：HeaderLength|HeaderKey:HeaderValie|PropertyLength|PropertyKey:PropertyValue|BodyLength|Body|
        * 每种类型的消息单独存文件，以消息索引为文件名
        * 只有一个线程在处理发送消息、消息编码、存储消息，几个步骤是串行发生
    * 赛后思考改进方案：
        * 优化思路不对，在纠结读写文件类的选择，最终选择了RandomAccessFile
        * 考虑了一个文件写不下一类消息的情况，但最终发现没用，删除了
        * 没有考虑将消息编码和存储消息并行处理，可以建立消息编码线程专门处理消息编码队列，消息存储线程专门处理存储队列
        * 处理消息存储队列时，不直接写文件而是写ByteBuffer，只有ByteBuffer满了才往文件里面写，最后将剩下的ByteBuffer刷新到文件
* 消费者的解决方案：
    * 消费Topic消息时，完成Queue消息到Topic消息的绑定，以Queue为key记录已经消费的Topic位置（真正的绑定过程，通过记录Queue在Topic中的
    位置，表明Topic这段消息与Queue消息完成绑定）
    * 现有解决方案：
        * 消费Queue消息时，记录文件位置，下次直接从记录点开始消费消息
        * 消费Topic消息时，以Queue为key记录已经消费的Topic位置（同一个Topic被多个Queue绑定）
        * 反解析消息内容，转换成消息对象
    * 赛后思考改进方案：
        * 并行化消息的消费过程，在最开始绑定消息时，创建对应的消费线程，并将对应的消息读取到解析队列中
        * 解析线程从解析队列中拉取消息，完成解析，并放回对应的消息返回队列
        * 设计消息队列存储结构（建立索引，顺序等），避免消息拉取过程的加锁以及等待
        * 主线程拉取消息时，只需从对应的消息返回队列中拉取新的消息即可
****
### 案列二：
* 问题分析：（与案例一解题思路类似，区别在于消息的生产直接来自文件，消息的消费需要发送给客户端完成消费）
    * 模拟mysql数据库的主备复制过程，数据库的操作分别存储在10个文件中，每个大小1G，重放指定范围内的主键对应数据的最终状态
    * 读文件操作，题目限制只能一个线程读文件
    * 文件解析操作，提取必须的数据，并设计存储结构存储对应的数据，例如操作符，对应的列数据信息
    * 数据回放操作，实时的更新存储结构中的数据状态，例如更新对应主键所属列的数据信息
    * 发送数据操作，服务端将回放完的数据发送给客户端
    * 写结果文件，客户端接收到服务端传送的数据，按顺序写入结果文件
    * 数据格式：
        * 000001:106|1489133349000|test|user|I|id:1:1|NULL|102|name:2:0|NULL|ljh|score:1:0||98|
        * 000001:106|1489133349000|test|user|U|id:1:1|102|102|score:1:0|98|95|        
* 服务端实现思路：主要使用闭锁类CountDownLatch实现线程之间的同步
    * 准备上下文数据集：列索引、列类型，列名称字节数
    * 将范围内的数据和范围外的数据分为32个区，每个区包含```(end - start + 1) / 32```个主键记录，每个分区开始记录该分区最小主键，范围内数据的分区是按从小到大的顺序排列，搜索时通过二分查找，范围外数据的分区是用hash排列（不关心最终的顺序），是用hash查找
    * <b>读文件服务线程：分批读取文件，将ByteBuffer封装成ParseTask，并发送到解析任务队列</b>
        * 设计一个ByteBuffer缓存池，分配128个，每个1M大小的直接内存映射ByteBuffer（避免重复使用系统调用开辟内存）
        * 每次读取文件都从该缓存池中提取一个ByteBuffer读取1M数据，通过一个临时的ByteBuffer处理超读现象（1M数据的结尾不是数行的结尾，读到下一行去了）
        * 构造一个ParseTask，包含该ByteBuffer，并将该ParseTask插入到解析队列中
        * <b>读完最后一个文件，往解析队列插入一个ParseTask.END任务</b>
    * <b>文件解析服务：将ParseTask中ByteBuffer的数据提取出来，添加到ReplayTask中，并发到重放任务队列中</b>
        * <b>包含10个解析线程，每个线程对应如下内容：所有线程共享一个解析队列</b>
        * 为范围内的数据和范围外的数据分配两个ByteBuffer缓存池，每个缓冲池包含128个ByteBuffer，每个大小16KB（2M大小）
        * 分别为范围内和范围外的数据分配一个包含32个ByteBuffer的数组（每个对应一个分区中的数据集），分别从对应的缓存池中获取，用来记录临时结果
        * 分别为范围内和范围外的数据分配一个包含32个ReplayTask的数组，每个重放任务对应一个分区内数据，同时需要记录对应的缓存池（释放内存）
        * <b>构造一个本地LocalByteBuffer，存储ParseTask中的ByteBuffer，并且迅速将该ByteBuffer回收，返回给读文件服务线程</b>
        * <b>如果收到ParseTask.END操作符，将其退回到解析队列中，然后结束线程（保证所有线程都可以正常退出）</b>
        * 解析过程：将ParseTask中ByteBuffer的数据提取出来，添加到ReplayTask中
            * 随机跳过无效数据，跳过一个大概率出现的字节数，然后再判断是否跳对了选择回跳
            * 提取主键，并在分区中查找（二分超载）该主键所属分区，更新操作有新旧两个主键（分开放入各自的分区）
            * 将操作符和列数据加入到对应分区的ByteBuffer中，加入之前判断该ByteBuffer是否已满，如果已满将其添加到对应分区的重放任务中，并且重新从缓存池中拉一个新的（区分范围内数据和范围外数据），重放任务中包含一个ByteBuffer列表
            * 插入操作存储数据：
                * <i>每行数据最多49字节，每列数据8字节</i>
                * <i>数据存储格式：插入操作符1字节，主键8字节，列类型是整形8字节，列类型是字符串：字符串长度2字节，字符串内容6字节</i>
            * 相同主键的更新存储数据：
                * <i>每行数据最多54字节，每列数据9字节（1字节列索引，8字节列内容）</i>
                * <i>数据存储格式：更新操作符1字节，主键8字节，修改列数1字节，列索引1字节，列类型是整形8字节，列类型是字符串：字符串长度2字节，字符串内容6字节</i>
            * 不同主键的更新（主键替换）存储数据：
                * <i>每行数据最多88字节，有两行数据需要记录</i>
                * <i>数据存储格式（第一行总共17字节）：等待操作符1字节，新主键8字节，等待ID8字节</i>
                * <i>数据存储格式（第二行总共71字节）：更新主键操作符1字节，旧主键8字节，新主键8字节，等待ID8字节，修改列数1字节，列索引1字节，列类型是整形8字节，列类型是字符串：字符串长度2字节，字符串内容6字节，总共</i>
            * 删除操作存储数据：
                * <i>每行最多9字节</i>
                * <i>数据存储格式：删除操作符1字节，主键8字节</i>
        * 收尾处理，将解析完的数据，但是还没满的ByteBuffer全部添加到对应分区的ReplayTask中
        * 将ReplayTask添加到对应分区的重放线程的重放任务队列中，要区分范围内数据和范围外的数据
        * <b>所有解析任务完成后，往重放服务的所有重放线程对应的重放队列末尾加入ReplayTask.END任务</b>
    * <b>数据重放服务：将ReplayTask中的ByteBuffer数据更新到IReplayMap中，构建SendTask，并将SendTask发送到发送队列中</b>
        * 分为范围内数据的重放服务和范围外数据的重放服务
        * 所有重放服务共享一个静态的WaitMap，记录主键变更的操作记录，包含等待ID以及待修改oldPK记录的地址以及需要修改的列数据
        * <b>每个服务包含32个重放线程，每个线程对应一个分区，负责重放该分区的数据，且每个线程有自己的重放队列，重放队列存储ReplayTask</b>
        * 范围内的重放线程包含一个IReplayMap
            * <i>记录了该线程所属分区的主键范围（最小主键和最大主键）</i>
            * <i>包含一个主键范围大小的数组（主键Map），记录主键对应数据存放的位置（哪一个ByteBuffer的哪个position）</i>
            * <i>包含一个ByteBuffer列表（每个ByteBuffer大小1M），存放该分区的重放结果，每条记录大小为40字节（只包含列数据）</i>
        * 范围外的重放线程包含一个IReplayMap
            * <i>包含一个普通HashMap（主键Map），记录主键对应数据存放的位置（哪一个ByteBuffer的哪个position）</i>
            * <i>包含一个ByteBuffer列表（每个ByteBuffer大小1M），存放该分区的重放结果，每条记录大小为40字节（只包含列数据）</i>
        * 重放过程：将ReplayTask中的ByteBuffer数据更新到IReplayMap中
            * <b>遍历ReplayTask中的ByteBuffer（来自解析线程，解析好的ByteButter），重放结束后，立即释放该ByteBuffer，还给对应解析线程所属的缓存池</b>
            * 重放插入操作：
                * 将该主键标记到主键范围大小的数组中，作为数组的下标，该元素的值为下一个写入的ByteBuffer的position；如果是范围外数据就将主键作为HashMap的key，value为下一个写入的ByteBuffer的position
                * 从主键返回的写入position开始依次存储每列的值，每列占8字节，列按列索引存储
            * 重放相同主键的更新操作：
                * 从主键Map中找出该主键对应记录的position
                * 根据列索引，找出需要修改的列
                * 直接更新对应列的数据，覆写ByteBuffer该position的值
            * 重放不同主键的更新（主键替换）操作：
                * 从主键Map中找出oldpk对应记录的position
                * 更新该oldPK对应列的列数据，操作同重放相同主键的更新操作一致
                * <i>构建一个Record记录，表示等待的记录，包含该oldPK对应的ByteBuffer，以及该oldPK对应列数据在ByteBuffer中的索引，以及列数据的长度，以等待ID作为Key，值为Record存在静态的WaitMap中（等待操作需要用到）</i>
                * 将该oldPK从对应的记录从IReplayMap中删除
            * 重放等待操作：
                * 从WaitMap获取等待ID对应的Record，循环等待，直到该等待ID的数据出现
                * 从WaitMap中删除该等待ID，表示该等待ID对应的Record已经完成了更新
                * 将新主键加入到主键Map中，并将Record中的ByteBuffer内容更新到新主键对应的position
            * 重放删除操作
                * 从主键Map中删除主键对应的记录
        * 如果该重放线程处理的是范围内的数据，则将重放好的IReplayMap和对应的分区ID封装成SendTask，并插入到发送队列中
        * <b>所有重放任务完成后，往发送服务的发送线程的发送队列中插入SendTask.END任务</b>
    * <b>发送数据服务：将IReplayMap中所有ByteBuffer合并成分区ByteBuffer，并发送到客户端</b>
        * <b>1个发送线程，拥有一个发送队列</b>
        * 不保证发送顺序，避免等待，那个分区先重放完，那个分区就先发送给客户端，每个SendTask中包含一个分区的数据
        * <i>每个分区的数据存储格式：分区数据总长度4字节，分区ID4字节，行记录（主键8字节，列记录40字节）</i>
        * 一次发送一个分区的数据
        * <b>所有的分区数据发送完毕后，给客户端发送结束标志</b>
* 客户端实现思路
    * <b>主程序：接受服务端过来的分区ByteBuffer，构造成ParseTask，并发送到解析队列中</b>
        * 负责接收数据，通过分区数据总长度判断一个分区数据需要读取次数
        * 将读取的数据wrap成ByteBuffer，并封装成ParseTask，发送到解析队列中
        * <i>数据存储格式：分区ID4字节，行记录（主键8字节，列记录40字节）</i>
        * <b>当读到结束标志则关闭通讯，往解析队列中发送ParseTask.END任务</b>
    * <b>解析线程：将ParseTask中的ByteBuffer，还原成String，结合分区ID，封装成WriteTask，并发送到写队列中</b>
        * <b>8个解析线程，所有线程共享一个解析队列</b>
        * 将ParseTask中的ByteBuffer组成String，每条记录一行，并将该String和对应的分区ID封装成WriteTask，发送到写任务队列中
        * <i>数据存储格式：|pk|\t|col1|\t|col2|\t|col3|\t|col4|\t|colt5|\n|，备注|是不存在的</i>
        * <b>如果收到ParseTask.END操作，将其退回到解析队列中，然后结束线程（保证所有线程都可以正常退出）</b>
        * <b>所有解析任务完成后，往写任务队列中插入WriteTask.END任务</b>
    * <b>写线程：按照分区ID的顺序写入结果文件</b>
        * <b>1个写线程，拥有一个写任务队列</b>
        * 拥有一个本地HashMap，强制控制写顺序，必须从分区ID为0的记录开始写，接下来是1，依次类推
        * 每次从HashMap中顺序获取分区ID对应的String，然后将其写入结果文件中
        * <b>如果收到WriteTask.END操作，结束写线程</b>
        
### 线程池调整线程数量
* 高并发、任务执行时间短的业务，线程池线程数可以设置为CPU核数+1，减少线程上下文的切换
* 并发不高、任务执行时间长的业务要区分开看：
    * 假如是业务时间长集中在IO操作上，也就是IO密集型的任务，因为IO操作并不占用CPU，所以不要让所有的CPU闲下来，可以加大线程池中的线程数目，让CPU处理更多的业务
    * 假如是业务时间长集中在计算操作上，也就是计算密集型任务，这个就没办法了，和（1）一样吧，线程池中的线程数设置得少一些，减少线程上下文的切换
* 并发高、业务执行时间长，解决这种类型任务的关键不在于线程池而在于整体架构的设计，
    * 看看这些业务里面某些数据是否能做缓存是第一步
    * 增加服务器是第二步，至于线程池的设置，参数第二点
    * 最后，业务执行时间长的问题，也可能需要分析一下，看看能不能使用中间件对任务进行拆分和解耦。