# Java语言

### 基础
* JDK是java开发工具，提供了允许需要的JRE，Lib，和工具；JRE是java程序运行环境，也就是JVM和以及核心类库
* 一切皆对象，对象的标识符为对象的引用，引用是存在堆栈中的，对象是存在堆中的
* 基本类型占用内存大小：<img src="../images/javase/基本类型大小.png" width="400px">
* 类基本成员默认值，只有基本类型作为类成员时才会被初始化，临时变量不具备该功能：
<img src="../images/javase/基本类型默认值.png" width="300px">
* java对象在方法中按引用传递，所以在方法体中改变对象的值会在方法外产生影响
* 基本类型的赋值就是复制，赋值后不会对原变量产生影响，而类对象赋值，本质是复制引用，使引用指向同一地址空间，因此赋值后的对象是会影响原对象
* ==操作比较的是引用值，equals默认也是比较引用值，但是可以覆写比较具体的内容（一般类库都实现了覆写equals）
* java中的io操作：
    * InputStream和OutputStream：字节操作
    * Reader和Writer：字符操作
    * File：文件磁盘操作
    * Socket：网络操作
    * InputStreamReader和OutputStreamWriter：字节操作和字符操作互换的接口
* 文件的访问形式：
    * 标准访问方式：通过操作系统读取文件，存在用户态到内核态的切换
    * 直接IO方式：应用程序缓存文件数据，如数据库管理系统，如果缓存失效，会造成很大的性能影响，减少内核态到用户态的切换
    * 同步访问文件方式：数据的读和写是同步的，与标准访问方式的区别是只有当操作系统真正将数据写回磁盘才通知应用程序写文件完成
    * 异步访问文件方式：线程发起读取文件的请求后就执行其他指令，对真实的IO操作没有提高性能
    * 内存映射方式：操作系统将内存的某块区域与磁盘文件关联起来，减少内核态到用户态的切换
* NIO，非阻塞式IO
    * Channel、Selector、Buffer：Channel相当于通信通道，是一个很具体的操作对象，Selector可以轮询Channel的状态，Buffer是在Channel中流通的数据
    * FileChannel打开文件和内存的通道，而ByteBuff是该通道内唯一流通的数据结构，MappedByteBuffer内存映射文件读写文件
    * Buffer的状态量：capacity缓冲区总长度，position下一个操作数的位置，limit缓冲区中不可操作的下一个位置（limit <= capacity），mark记录当前position的前一个位置默认为0
    * flip()操作将limit设置为当前position的位置，reset()操作position将恢复到mark标记的位置
    * 内存映射文件是将文件映射到内存中，相当于直接在内存中操作文件，使用的是堆外内存，避免了用户态到内核态的切换，适合读取大文件
* 装箱拆箱：就是将基础类型转换成封装类或者将封装类型转换成基础类型的过程
    
### 面向对象
* 重载使用的是静态绑定、覆写使用的是动态绑定（和C++一样，是通过虚表实现，类继承结构有虚表记录每个方法的真实调用关系）
* 重载(overwrite)是相同函数名不同参数，返回值不能区别重载，覆写(override)是子类覆写父类的方法，方法名和参数以及修饰符返回值都必须一模一样
* 静态方法不能调用非静态方法，原因很简单，静态对象初始化早于非静态对象
* 垃圾回收器执行时会执行类的finalize()方法，并在下次回收动作发生时才真正的回收对象内存，记住不是同时发生的
* java解释器会在classpath下面查找*.class类文件，IDE会把workspace临时加入classpath中
* 每个类文件只能包含一个公共类，公共类的类名必须和类文件相同
* 定义属性对象时就初始化，会比在构造函数中初始化对象更早
* 组合大于继承，但是需要思考对象之间是否需要向上转型，如果需要则要使用继承
* private方法隐式指定final，final类中所有字段隐式指定final
* java初始化顺序，继承结构中的static字段->类继承结构中的非static字段（调用时初始化）->继承结构中的构造器
* 除了static和final方法，其他方法都是动态绑定，但是申明为final方法对性能提高不大
* java在构造函数中调用多态是会生效，但是要避免
* 协变返回类型，允许多态方法的返回值是同一类类型
<img src='../images/javase/协变返回类型示例.png' width='400px'>
* 接口的字段是隐式static final的，方法是public的
* 内部类声明为static则为嵌套类，表明内部类和外部类之间的this关键字联系被斩断了
* 多态，指同一类型的对象，针对不同的消息，做出不同的反应

### 集合操作
* Collection.addAll()初始化列表快
* List的元素按添加时的顺序排列，HashSet、HashMap的元素是乱序的，TreeSet、TreeMap的元素是字母顺序排序的，LinkedHashSet、LinkedHashMap的元素按添加时的顺序排序
* 即使return，finally也会执行，但是在finally中return，则会丢失异常信息
* String是不可变的，因此字符串拼接强烈建议使用StringBuilder
* 当程序创建第一个对类的静态成员的引用时，才会加载该类，包括两层意思，第一，new一个对象，因为构造函数其实是static的；第二，调用类的静态成员也会导致类被加载。注意Class.class不会导致类被加载，Class.forName()会导致类被加载
* <? extends ClassA> 类型只能是ClassA或它的子类，<? super ClassA> 类型只能是ClassA或它的超类
* 泛型方法优先级高于泛型类，而且泛型方法不需要指定类型调用，static方法可以成为泛型方法，泛型方法定义格式：
<img src='../images/javase/泛型方法定义.png' width='400px'> 指定类型调用泛型方法：在点操作符合方法名之间添加尖括号和类型

### 并发操作
* 小型机低位优先，大型机高位优先
* tryLock非阻塞锁，lock阻塞锁，而且还可以锁定部分文件内容，synchronized内置锁也是将操作强制为原子性，每个对象都有synchronized内置锁，如果调用对象的synchronized方法则会被加锁，其他的线程就必须等待且是由可视性的，细腻度高，可以锁定方法级别，也可以锁定代码块，Lock显式锁性能好于synchronized内置锁，ReadWriteLock用户多线程读
* transient阻止自动序列化，volatile将变量的操作强制为原子性操作，且该关键字增强了可视性，也就是说对应的修改会立刻刷新到主存中，其他线程马上可以看到，而没添加该关键字的原子性操作不会(除long double以外的基础类型)，AtomicXXX原子类
* 注解处理工具apt，当指定一个apt需要的工厂类，则该工具会帮你生成所有的注解解释器
* 并发中的核心问题，加锁（乐观锁，版本控制），同步，资源竞争，资源共享
* Thread.yield()告诉jvm本线程可以被切换了
* setDaemon设置为后台线程并且当非后台线程结束时，后台线程立刻退出
* 在线程内部调用另一个线程join方法，该线程会被挂起，直到join的线程执行结束或者被interrupt
* 线程状态：<img src='../images/javase/线程状态.png' width='500px'>
* 死锁产生的条件：<img src='../images/javase/死锁条件.png' width='500px'>
* Thread.interrupt方法只是告诉某个线程执行到某个地方时可以暂停一下，但并不会确保其他线程会真的暂停，在发生InterruptException的时候调用自己的interrupt方法可以恢复中断

****

# 高效Java
* 静态工厂方法替代构造器，调用时也建议这样
    * 静态工厂方法更表意
    * 可以避免频繁创建对象的开销
    * 缺点在于不可被子类化
    * valueOf, of, newInstance, getInstance, getType, newType
* 当构造类参数过多时，考虑用建造者模式，可以更好的封装类避免控制线程安全等问题
* 覆盖equals方法需要满足自反性，对称性，传递性，一致性，非空性，并且总要覆盖hashCode，保证散列值一直，在HashMap, HashSet中可用
* 覆盖clone方法要小心栈溢出，最好用静态工厂方法替代
* 有序集合的排序对比使用的是compareTo，其他集合使用的是equals
* 测试测私有方法时，可以把私有方法改成包可见，把测试和实现类放到同一包中
* 枚举代替int常量，EmunSet，EmunMap操作枚举集合
* 建议参数类型assert在方法一开始就检查
* 返回0长度的数组或列表，而不要返回null
* foreach > for > while
* 捕获低级抽象异常，抛出高级抽象异常
* java多线程由于线程数量过多会导致栈溢出，这时可以调小堆空间或者调大栈空间解决，因为总内存-堆内存-方法区内存=栈内存，给线程分配内存的是栈内存，栈内存大，可分配线程数多，可以多分配线程；堆空间小，栈空间大，可以多分配线程

****

# Java并发编程
### 线程安全
* 无状态的对象一定是线程安全的
* 如果要保持对象的状态一致，需要在单个原子操作中更新所有相关的状态变量
* 在线程没有同步的情况下，编译器和处理器以及运行时会对线程的执行顺序做优化，所以就无法确定读写的值确保是一致的
* jvm内存模型允许将64位的long和double类型操作分解为两个32位的操作，所以没有加volatile关键字的long和double变量不是线程安全的，并且在访问volatile类型的变量时，总能看到变量的最新值
* 对象内置锁synchronized不光是添加锁，确定临界区，而且还有可见性，而volatile变量只能保证可见性(只有简化锁的应用代码时候才用，对写入操作不依赖变量的当前值，确保只有单个线程更新变量，访问变量时不需要加锁)
* 安全发布：
    * 发布是指将类对象的作用域扩大到其他类当中去，包括组合，全局静态变量；逃逸是指某个不该被发布的对象被发布出去了，不要在构造函数中启动线程造成this逸出
    * 线程封闭数据就不需要同步，把数据处理全部放在单独的线程中操作，如ThreadLocal类就是用来将变量分装在线程内部的
    * 栈封闭，也就是数据变量使用局部变量，与ThreadLocal意义不同，这个类使得变量在线程中有一份独立的副本
    * 不可变对象，创建后状态就不可变，所有的域都是final类型，创建对象时this没有逸出，如果将可变对象封装到不可变对象中（加上volatile关键字保证可见性），也是线程安全的；事实不可变对象指的是对象本身并不是不可变对象，但是在使用中不去改变它的值，把它当不可变对象使用
    * 安全发布方式，在静态初始化中初始化对象，将对象引用保存到AtomicReferance中或volatile类型，将对象保存为final域，将对象保存到有锁的域中
    * 不可变对象可以随便发布，事实不可变对象必须通过安全方式发布，可变对象必须是通过安全方式发布，并且是线程安全的或由锁保护起来
* 线程安全策略：<img src='../images/javase/线程安全策略.png' width='450px'>

### 对象的组合
* 设计线程安全的类，找出构造对象状态所有的变量（所有字段），找出约束对象不变性条件（方法），建立对象并发访问管理策略
* 实例封闭，保障实例只能被一个线程访问，或者用锁来保护该实例对象的访问
    * 将数据都封装到对象中，把对数据的访问限制在对象的方法上（一般使用内置锁，锁定方法，锁要加在操作的对象上），确保线程在访问数据时有正确的锁策略
    * 示列：<img src='../images/javase/实例封闭示例.png' width='400px'>
    * java监视器模式，就是把数据封装在对象中且为final类型，并给该对象提供一个共有的私有锁，所有的数据访问都用该锁来保护：<img src='../images/javase/监视器模式示例.png' width='400px'>
* 需要同步的操作：
    * 先检查，后执行操作（线程不安全），需要加锁保证其原子性
    * 若没有，则添加操作（线程不安全），需要加锁保证其原子性
    * 若相等，则移除
    * 若相等，则替换

### 容器
* 同步容器：
    * Vertor，Hashtable：getLast，deleteLast不安全，迭代不安全，因此，hashCode，equals，containsAll，removeAll，retainAll也不是线程安全的
    * Hashtable，synchronizedMap，ConcurrentMap
    * Vector，CopyOnWriteArrayList，CopyOnWriteArraySet，synchronizedList，synchronizedSet
    * BlockingQueue，ConcurrentLinkedQueue
* 并发容器：
    * ConcurrentHashMap，CopyOnWriteArrayList，ConcurrentLinkedQueue，BlockingQueue，LinkedBlockingQueue(无界队列)，PriorityBlockingQueue(无界队列)，ArrayBlockingQueue(有界队列)，ConcurrentSkipListMap，ConcurrentSkipListSet，BlockingDeque，ArrayDeque，LinkedBlockingDeque，SynchronousQueue
    * ConcurrentHashMap采取分段锁，可以同时多线程读和写，size，isEmpty操作都是估算值
    * CopyOnWriteArrayList每次写的时候会生成一份复制备份
* 生产者-消费者模式，详情请见《Java并发编程实践》87页
    * 阻塞队列在put操作时，如果队列已满则会阻塞，take操作时如果队列为空则会阻塞，所有消费者共享一个任务队列
    * 高级版本工作密取队列，消费者有自己单独的任务队列，当自己队列内工作完成后会去其他消费者队列末尾获取工作
* 同步工具类：
    * 闭锁：等待某些资源准备好了以后，线程才开始执行。CountDownLatch，FutureTask的get操作会等待任务执行完程序才继续执行
        <table>
            <tr>
                <td><img src='../images/javase/闭锁示例.png' width='400px'></td>
                <td><img src='../images/javase/futureTask示例.png' width='400px'></td>
            </tr>
        </table>
    * 信号量：Semaphore
         <table>
            <tr>
                <td><img src='../images/javase/信号量示例1.png' width='400px'></td>
                <td><img src='../images/javase/信号量示例2.png' width='400px'></td>
            </tr>
        </table>
    * 栅栏：类似闭锁，阻塞某个时间，直到条件满足，闭锁用于等待事件的发生，栅栏用于等待其他线程都就绪（所有的线程都等到同一栅栏位置才执行）。CyclicBarrier
     <table>
        <tr>
            <td><img src='../images/javase/栅栏示例1.png' width='400px'></td>
            <td><img src='../images/javase/栅栏示例2.png' width='400px'></td>
        </tr>
    </table>

### 任务执行
* 无限制创建线程的不足：
    * 线程生命周期的开销很大
    * 消耗资源，线程数太多多于处理器数量会导致线程闲置，闲置的线程也会耗费资源，线程竞争也会增加开销
    * 稳定性，线程数量太多会导致OutofMemoryError，不能超过JVM的限制或者操作系统的限制
* Executor框架：采用消费者-生产者模式管理线程
    * 线程池：newFixedThreadPool，newCachedThreadPool，newSingleThreadPool，newScheduledThreadPool
    * 线程池好处：重复利用线程资源，并保证线程不会超过系统限制而导致的性能下降
    * Executor执行任务的生命周期：创建，提交，开始，完成
    <img src='../images/javase/executor示例.png' width='400px'>
* ExecutorService管理Executor生命周期：运行，关闭，已终止
* Timer只会开启一个线程执行任务，当遇到多任务timer时执行时间不精确，且不处理异常，一旦出现异常会将所有的Timer都中断，newScheduledThreadPool解决这些问题
    * 线程泄露，就是当Timer中的某个任务发生异常后，Timer会立即停止调度，导致其他已经被调度但没执行过的线程任务和新线程任务都不会执行
* Future和Callable允许线程返回值
    <img src='../images/javase/future示例.png' width='400px'>

### 取消与关闭
* 发生中断异常时，要么把中断异常传出去，要么调用interrupt恢复中断
* 线程关闭：设置关闭标志停止线程，使用ExecutorService调用shutdown，在队列中设置结束标志

### 线程池的使用
* 执行策略不适合的线程任务：线程之间的任务有依赖性（死锁），线程执行强制为串行的，对响应时间敏感的任务（造成拥塞）
* 饥饿死锁：如果一个任务将另一个任务提交到Executor中并等待其执行结果，通常会发生死锁，因为第二个任务在等待第一个任务完成，而第一个任务在等待第二个任务的结果，如果所有的线程都在等待其他处于工作队列中的线程而阻塞，就叫饥饿死锁
* 计算密集型的任务，线程池大小等于CPU数量+1最优，线程池大小计算公式：<img src='../images/javase/线程池大小计算公式.png' width='350px'>
* ThreadPoolExecutor：自定义线程池，详情参考《Java并发编程实战》第156页
    <img src='../images/javase/ThreadPoolExecutor示例.png' width='400px'>


### 避免活跃性危险
* 死锁
    * 锁顺序死锁：获取锁的顺序相反可能导致死锁，如果所有线程都以固定的顺序获得锁，就不会出现锁顺序死锁的问题
    * 动态的锁顺序死锁：方法对参数A和参数B分别加锁，但是传给参数A和参数B的内容可以互换，并产生死锁，可以利用对象的hash值确保无论传给参数A和参数B的顺序怎样，方法内部都要对参数A和参数B排序加锁
    * 协作对象之间发生死锁：A对象中某加锁方法调用对象B某加锁方法，同时对象B另一个加锁方法调用对象A另一个加锁方法，当线程分别调用这两个不同的方法是会产生死锁
        * 开放调用：如果在调用某个方法时不需要持有锁，那么这种方法被称为开放调用，也就是说把同步代码块范围缩小，不要直接把整个方法都锁定
    * 资源死锁（饥饿死锁）：与锁顺序死锁不一样的是线程在等待不同的资源时发生死锁，比如同时请求两个数据库连接池时就有可能发生
* 分析和避免死锁
    * 使用显示锁对锁加定时器
    * 通过线程转储存信息分析死锁
* 活锁：某任务反复重试，占用线程队列，导致其他的线程无法执行

### 性能与可伸缩性
* 线程消耗资源的地方：线程之间的协调（加锁，触发信号，内存同步），上下文切换，线程的创建和销毁，线程的调度
* 性能指标：服务时间，延迟时间，吞吐量，响应性，效率，可伸缩性，容量
    * 服务时间，等待时间衡量运行速度
    * 生产量，吞吐率衡量处理能力
* Amdahl定律：加速比$=SpeedUp \leq \frac{1}{F + \frac{1-F}{N}}$，F是程序必须串行执行的部分，N是处理器个数
* 可伸缩性：当增加技术资源时（CPU，内存，存储容量，IO带宽），程序的吞吐量或处理能力相应增加
* 减少锁竞争
    * 缩小锁的范围，实际是减少串行代码的部分
    * 减小锁的粒度，降低线程请求锁的频率
        * 锁分解，给每个独立的变量分别加锁
        * 锁分段，将锁分解技术进一步扩展为对一组独立的对象上的锁进行分解，也就是说构造N个对象锁，每次请求的都是不同的对象锁
* 并发测试步骤：基础单元测试测试功能准确性，对阻塞操作的测试（测试也是并发的），安全性测试，资源管理的测试
* 性能测试：一定要对测试对象打点计时
* 静态代码分析工具： FindBugs

### 显示锁
* Lock和ReentrantLock
    * 需要自己手动加锁和释放锁
    * tryLock获得轮询锁和定时锁，指定时间参数则为定时锁
    * 读-写锁分离
* 条件对象：<img src='../images/javase/条件锁示例.png' width='400px'>

### 原子变量，避免加锁同步
* Happens-Before规则：<img src='../images/javase/HappensBefore规则.png' width='400px'>
* 安全构造：所有final字段在构造函数中初始化，非final字段必须加锁访问
* 原子变量（非阻塞式）：AtomicXXX，实现原理是CAS，比较并交换，在内存记录上次的数据V，对比线程目前的值A，如果A==V，则将V更新为B，并且无论A是否等于V都将返回V原有的值，乐观锁，比volatile关键字效率高
    * 高度竞争情况下，锁并发性好，一般竞争情况下，原子变量并发性好

****

# 多线程编程实战
### 案列一：生产消息和消费消息
* 问题分析：
    * 生产者主程序在一定时间内启动多个线程随机产生Topic或者Queue类型的消息，超过时间强行kill主程序
    * 消费者主程序启动多个消费者线程消费生产者生产的消息，要求每个消费者线程绑定一个Queue类型的消息和多个Topic类型的消息
    * 消费Queue类型消息时，直接消费
    * 消费Topic类型消息时，需要找出该Topic消息绑定的Queue消息（标记Queue在Topic中的位置，并从该位置开始消费Topic消息）
* 生产者的解决方案：
    * 现有的解决方案：
        * 消息的结构：HeaderLength|HeaderKey:HeaderValie|PropertyLength|PropertyKey:PropertyValue|BodyLength|Body|
        * 每种类型的消息单独存文件，以消息索引为文件名
        * 只有一个线程在处理发送消息、消息编码、存储消息，几个步骤是串行发生
    * 赛后思考改进方案：
        * 优化思路不对，在纠结读写文件类的选择，最终选择了RandomAccessFile
        * 考虑了一个文件写不下一类消息的情况，但最终发现没用，删除了
        * 没有考虑将消息编码和存储消息并行处理，可以建立消息编码线程专门处理消息编码队列，消息存储线程专门处理存储队列
        * 处理消息存储队列时，不直接写文件而是写ByteBuffer，只有ByteBuffer满了才往文件里面写，最后将剩下的ByteBuffer刷新到文件
* 消费者的解决方案：
    * 消费Topic消息时，完成Queue消息到Topic消息的绑定，以Queue为key记录已经消费的Topic位置（真正的绑定过程，通过记录Queue在Topic中的
    位置，表明Topic这段消息与Queue消息完成绑定）
    * 现有解决方案：
        * 消费Queue消息时，记录文件位置，下次直接从记录点开始消费消息
        * 消费Topic消息时，以Queue为key记录已经消费的Topic位置（同一个Topic被多个Queue绑定）
        * 反解析消息内容，转换成消息对象
    * 赛后思考改进方案：
        * 并行化消息的消费过程，在最开始绑定消息时，创建对应的消费线程，并将对应的消息读取到解析队列中
        * 解析线程从解析队列中拉取消息，完成解析，并放回对应的消息返回队列
        * 设计消息队列存储结构（建立索引，顺序等），避免消息拉取过程的加锁以及等待
        * 主线程拉取消息时，只需从对应的消息返回队列中拉取新的消息即可
****
### 案列二：
* 问题分析：（与案例一解题思路类似，区别在于消息的生产直接来自文件，消息的消费需要发送给客户端完成消费）
    * 模拟mysql数据库的主备复制过程，数据库的操作分别存储在10个文件中，每个大小1G，重放指定范围内的主键对应数据的最终状态
    * 读文件操作，题目限制只能一个线程读文件
    * 文件解析操作，提取必须的数据，并设计存储结构存储对应的数据，例如操作符，对应的列数据信息
    * 数据回放操作，实时的更新存储结构中的数据状态，例如更新对应主键所属列的数据信息
    * 发送数据操作，服务端将回放完的数据发送给客户端
    * 写结果文件，客户端接收到服务端传送的数据，按顺序写入结果文件
    * 数据格式：
        * 000001:106|1489133349000|test|user|I|id:1:1|NULL|102|name:2:0|NULL|ljh|score:1:0||98|
        * 000001:106|1489133349000|test|user|U|id:1:1|102|102|score:1:0|98|95|        
* 服务端实现思路：主要使用闭锁类CountDownLatch实现线程之间的同步
    * 准备上下文数据集：列索引、列类型，列名称字节数
    * 将范围内的数据和范围外的数据分为32个区，每个区包含```(end - start + 1) / 32```个主键记录，每个分区开始记录该分区最小主键，范围内数据的分区是按从小到大的顺序排列，搜索时通过二分查找，范围外数据的分区是用hash排列（不关心最终的顺序），是用hash查找
    * <b>读文件服务线程：分批读取文件，将ByteBuffer封装成ParseTask，并发送到解析任务队列</b>
        * 设计一个ByteBuffer缓存池，分配128个，每个1M大小的直接内存映射ByteBuffer（避免重复使用系统调用开辟内存）
        * 每次读取文件都从该缓存池中提取一个ByteBuffer读取1M数据，通过一个临时的ByteBuffer处理超读现象（1M数据的结尾不是数行的结尾，读到下一行去了）
        * 构造一个ParseTask，包含该ByteBuffer，并将该ParseTask插入到解析队列中
        * <b>读完最后一个文件，往解析队列插入一个ParseTask.END任务</b>
    * <b>文件解析服务：将ParseTask中ByteBuffer的数据提取出来，添加到ReplayTask中，并发到重放任务队列中</b>
        * <b>包含10个解析线程，每个线程对应如下内容：所有线程共享一个解析队列</b>
        * 为范围内的数据和范围外的数据分配两个ByteBuffer缓存池，每个缓冲池包含128个ByteBuffer，每个大小16KB（2M大小）
        * 分别为范围内和范围外的数据分配一个包含32个ByteBuffer的数组（每个对应一个分区中的数据集），分别从对应的缓存池中获取，用来记录临时结果
        * 分别为范围内和范围外的数据分配一个包含32个ReplayTask的数组，每个重放任务对应一个分区内数据，同时需要记录对应的缓存池（释放内存）
        * <b>构造一个本地LocalByteBuffer，存储ParseTask中的ByteBuffer，并且迅速将该ByteBuffer回收，返回给读文件服务线程</b>
        * <b>如果收到ParseTask.END操作符，将其退回到解析队列中，然后结束线程（保证所有线程都可以正常退出）</b>
        * 解析过程：将ParseTask中ByteBuffer的数据提取出来，添加到ReplayTask中
            * 随机跳过无效数据，跳过一个大概率出现的字节数，然后再判断是否跳对了选择回跳
            * 提取主键，并在分区中查找（二分超载）该主键所属分区，更新操作有新旧两个主键（分开放入各自的分区）
            * 将操作符和列数据加入到对应分区的ByteBuffer中，加入之前判断该ByteBuffer是否已满，如果已满将其添加到对应分区的重放任务中，并且重新从缓存池中拉一个新的（区分范围内数据和范围外数据），重放任务中包含一个ByteBuffer列表
            * 插入操作存储数据：
                * <i>每行数据最多49字节，每列数据8字节</i>
                * <i>数据存储格式：插入操作符1字节，主键8字节，列类型是整形8字节，列类型是字符串：字符串长度2字节，字符串内容6字节</i>
            * 相同主键的更新存储数据：
                * <i>每行数据最多54字节，每列数据9字节（1字节列索引，8字节列内容）</i>
                * <i>数据存储格式：更新操作符1字节，主键8字节，修改列数1字节，列索引1字节，列类型是整形8字节，列类型是字符串：字符串长度2字节，字符串内容6字节</i>
            * 不同主键的更新（主键替换）存储数据：
                * <i>每行数据最多88字节，有两行数据需要记录</i>
                * <i>数据存储格式（第一行总共17字节）：等待操作符1字节，新主键8字节，等待ID8字节</i>
                * <i>数据存储格式（第二行总共71字节）：更新主键操作符1字节，旧主键8字节，新主键8字节，等待ID8字节，修改列数1字节，列索引1字节，列类型是整形8字节，列类型是字符串：字符串长度2字节，字符串内容6字节，总共</i>
            * 删除操作存储数据：
                * <i>每行最多9字节</i>
                * <i>数据存储格式：删除操作符1字节，主键8字节</i>
        * 收尾处理，将解析完的数据，但是还没满的ByteBuffer全部添加到对应分区的ReplayTask中
        * 将ReplayTask添加到对应分区的重放线程的重放任务队列中，要区分范围内数据和范围外的数据
        * <b>所有解析任务完成后，往重放服务的所有重放线程对应的重放队列末尾加入ReplayTask.END任务</b>
    * <b>数据重放服务：将ReplayTask中的ByteBuffer数据更新到IReplayMap中，构建SendTask，并将SendTask发送到发送队列中</b>
        * 分为范围内数据的重放服务和范围外数据的重放服务
        * 所有重放服务共享一个静态的WaitMap，记录主键变更的操作记录，包含等待ID以及待修改oldPK记录的地址以及需要修改的列数据
        * <b>每个服务包含32个重放线程，每个线程对应一个分区，负责重放该分区的数据，且每个线程有自己的重放队列，重放队列存储ReplayTask</b>
        * 范围内的重放线程包含一个IReplayMap
            * <i>记录了该线程所属分区的主键范围（最小主键和最大主键）</i>
            * <i>包含一个主键范围大小的数组（主键Map），记录主键对应数据存放的位置（哪一个ByteBuffer的哪个position）</i>
            * <i>包含一个ByteBuffer列表（每个ByteBuffer大小1M），存放该分区的重放结果，每条记录大小为40字节（只包含列数据）</i>
        * 范围外的重放线程包含一个IReplayMap
            * <i>包含一个普通HashMap（主键Map），记录主键对应数据存放的位置（哪一个ByteBuffer的哪个position）</i>
            * <i>包含一个ByteBuffer列表（每个ByteBuffer大小1M），存放该分区的重放结果，每条记录大小为40字节（只包含列数据）</i>
        * 重放过程：将ReplayTask中的ByteBuffer数据更新到IReplayMap中
            * <b>遍历ReplayTask中的ByteBuffer（来自解析线程，解析好的ByteButter），重放结束后，立即释放该ByteBuffer，还给对应解析线程所属的缓存池</b>
            * 重放插入操作：
                * 将该主键标记到主键范围大小的数组中，作为数组的下标，该元素的值为下一个写入的ByteBuffer的position；如果是范围外数据就将主键作为HashMap的key，value为下一个写入的ByteBuffer的position
                * 从主键返回的写入position开始依次存储每列的值，每列占8字节，列按列索引存储
            * 重放相同主键的更新操作：
                * 从主键Map中找出该主键对应记录的position
                * 根据列索引，找出需要修改的列
                * 直接更新对应列的数据，覆写ByteBuffer该position的值
            * 重放不同主键的更新（主键替换）操作：
                * 从主键Map中找出oldpk对应记录的position
                * 更新该oldPK对应列的列数据，操作同重放相同主键的更新操作一致
                * <i>构建一个Record记录，表示等待的记录，包含该oldPK对应的ByteBuffer，以及该oldPK对应列数据在ByteBuffer中的索引，以及列数据的长度，以等待ID作为Key，值为Record存在静态的WaitMap中（等待操作需要用到）</i>
                * 将该oldPK从对应的记录从IReplayMap中删除
            * 重放等待操作：
                * 从WaitMap获取等待ID对应的Record，循环等待，直到该等待ID的数据出现
                * 从WaitMap中删除该等待ID，表示该等待ID对应的Record已经完成了更新
                * 将新主键加入到主键Map中，并将Record中的ByteBuffer内容更新到新主键对应的position
            * 重放删除操作
                * 从主键Map中删除主键对应的记录
        * 如果该重放线程处理的是范围内的数据，则将重放好的IReplayMap和对应的分区ID封装成SendTask，并插入到发送队列中
        * <b>所有重放任务完成后，往发送服务的发送线程的发送队列中插入SendTask.END任务</b>
    * <b>发送数据服务：将IReplayMap中所有ByteBuffer合并成分区ByteBuffer，并发送到客户端</b>
        * <b>1个发送线程，拥有一个发送队列</b>
        * 不保证发送顺序，避免等待，那个分区先重放完，那个分区就先发送给客户端，每个SendTask中包含一个分区的数据
        * <i>每个分区的数据存储格式：分区数据总长度4字节，分区ID4字节，行记录（主键8字节，列记录40字节）</i>
        * 一次发送一个分区的数据
        * <b>所有的分区数据发送完毕后，给客户端发送结束标志</b>
* 客户端实现思路
    * <b>主程序：接受服务端过来的分区ByteBuffer，构造成ParseTask，并发送到解析队列中</b>
        * 负责接收数据，通过分区数据总长度判断一个分区数据需要读取次数
        * 将读取的数据wrap成ByteBuffer，并封装成ParseTask，发送到解析队列中
        * <i>数据存储格式：分区ID4字节，行记录（主键8字节，列记录40字节）</i>
        * <b>当读到结束标志则关闭通讯，往解析队列中发送ParseTask.END任务</b>
    * <b>解析线程：将ParseTask中的ByteBuffer，还原成String，结合分区ID，封装成WriteTask，并发送到写队列中</b>
        * <b>8个解析线程，所有线程共享一个解析队列</b>
        * 将ParseTask中的ByteBuffer组成String，每条记录一行，并将该String和对应的分区ID封装成WriteTask，发送到写任务队列中
        * <i>数据存储格式：|pk|\t|col1|\t|col2|\t|col3|\t|col4|\t|colt5|\n|，备注|是不存在的</i>
        * <b>如果收到ParseTask.END操作，将其退回到解析队列中，然后结束线程（保证所有线程都可以正常退出）</b>
        * <b>所有解析任务完成后，往写任务队列中插入WriteTask.END任务</b>
    * <b>写线程：按照分区ID的顺序写入结果文件</b>
        * <b>1个写线程，拥有一个写任务队列</b>
        * 拥有一个本地HashMap，强制控制写顺序，必须从分区ID为0的记录开始写，接下来是1，依次类推
        * 每次从HashMap中顺序获取分区ID对应的String，然后将其写入结果文件中
        * <b>如果收到WriteTask.END操作，结束写线程</b>