# JVM体系结构
* 广义jvm：<img src='../images/javase/广义jvm.png' width='400px'>
* JVM体系结构结构图：<img src='../images/javase/jvm体系结构.png' width='400px'>
    * 类加载器，负责将.class中的字节码代码加载到JVM内存中
    * 执行引擎，负责解析字节码，执行字节码获得执行结果
    * 内存管理
* JVM基于栈的架构：避免与操作系统平台产生关系，更好的优化性能，保证指令精简方便网络传输（备注其他的编译器一般是基于寄存器的架构）
* JVM执行引擎架构：<img src='../images/javase/jvm执行引擎结构.png' width='350px'>
    * JVM会为每个java线程生成一个栈（当成一个线性的数组结构），每个线程中调用的方法会创建一个栈帧，并且分配一个PC寄存器用于指定下条即将执行的指令
    * 基于栈架构的JVM任何操作都是结合栈的入栈和出栈操作完成计算，并且每次都会更新PC寄存器的值，保存下次即将操作的指令
    * 在调用方法时，首先是保存PC寄存器的值，然后创建新的栈帧，然后将PC寄存器值清0以便让它指向新栈栈的首行执行指令
    * 调用方法返回时，将方法结果返回给栈元素，并且将PC寄存器的值恢复到进入栈帧之前的值

****

# JVM内存管理
* JVM内存结构：
    * PC寄存器：负责存储下一个即将执行的指令，线程独有，且不共享
    * 虚拟机栈：为线程，本地变量（基本数据变量）、函数参数、对象引用提供存储空间；该区域不是线程共享的区域，其大小在javac编译时已经确定
    * JAVA堆：为java对象提供存储空间，包括类实例和数组；该区域是线程共享该区域，其大小是动态分配的，由JVM负责管理其生命周期
    * 方法区：存储类结构信息，包括常量池、字段、方法数据、方法体、构造函数、类中的专用方法、实例初始化、接口初始化；该区域存放在堆中的永久区中且可以被线程共享
    * 运行时常量池：跟方法区中的常量池是同一个东西，包括编译时期的数字常量、方法或字段的引用
    * 本地方法栈：使得本地C语言方法可以调用Java方法
    * 直接内存：NIO分配内存会导致一次os::malloc系统调用，分配的内存不是JVM内存是系统内存，因此也叫做堆外内存
* JVM内存回收和分配
    * JVM内存分配分类：
        * 静态内存分配（栈空间内存），在编译时期就确认大小，程序加载时一次性提供的内存，包括方法中的局部变量、基础变量、对象引用等
        * 动态内存分配（堆空间内存），对象创建时分配
    * JVM对象内存分配策略：
        * 堆内存分为`Young, Old`，默认比例是1:2，可以通过`–XX:NewRatio`调整该比例
        * `Young`新生代可以再分为`Eden, Survivor from, Survivor to`，使用`Eden, Survivour from`区作为新对象的存储区域，当回收时，把活对象存放到`Survivor to`区，并清理掉`Eden, Survivour from`区，默认情况下`Eden, Survivor from, Survivor to`之间的比例是8:1:1，可以通过`–XX:SurvivorRatio`调整该比例
        * 当回收时，如果`Survivor to`区存不下所有的活对象时，会触发分配担保，将活对象存储到老年代中
        * 当新建对象大于`-XX:PretenureSizeThreshold`时，直接在老年代创建新对象
        * 当存活对象年龄大于`-XX:MaxTenuringThreshold`时，对象会移到老年代中
        * 当`Survivor to`区中相同存活年龄对象的大小超过该区域大小的一半时，年龄大于等于该值的对象都会被移动到老年代中
    * 寻找活对象的方式：
        * 引用计数算法：对每个被引用的对象保持一个简单的使用计数，当计数等于0时就可以将该对象空间回收
            * 无法解决循环引用的问题
        * 可达性分析算法：构造`GC ROOT`对象集合作为寻找活对象的初始集合，然后从这些节点开始搜索其他对象的引用链，如果引用链存在则对象可达
            * 可作为`GC ROOT`对象：
                * 虚拟机栈中引用的对象 
                * 方法区中类静态属性引用的对象 
                * 方法区中常量引用的对象 
                * 本地方法栈中JNI引用的对象
            * 不可达的对象会被判断是否需要执行对象finalize方法，该方法只会执行一次（在该方法中重新将该对象赋值可以避免死亡）
            * HotSpot对该算法的具体实现：
                * 构造`OopMap`结构，记录对象的存储位置，避免全局遍历所有对象
                * 设定安全点（方法调用、循环跳转、异常跳转），只在安全点更新`OopMap`（避免大量的`OopMap`操作影响性能）和判断是否进入GC状态（程序主动轮训GC标志位，并决定是否把自己中断挂起）
                * 设定安全区域（一段代码片段之中，引用不会发生变化），当程序进入安全区域后，如果此时发生GC，则JVM不会管进入安全区域的这段代码，避免程序线程被阻塞无法到达安全点，而影响GC执行的时间点
                * 构造`Remembered Set`结构，记录其他区域对本区域对象的引用，遍历时会将该Set中的对象加入`OopMap`
        * 引用可以分为：强引用、软引用、弱引用、虚引用
        * 判断无用类的条件，满足时可以卸载该类，从方法区中回收该类信息：
            * 该类所有实例都已经被回收
            * 加载该类的ClassLoader已经被回收
            * 该类对应的Class对象没有在任何地方被引用，无法通过反射访问该类的方法
    * 垃圾回收算法，垃圾回收的方法论（详情参考《深入理解java虚拟机》第77页）：JVM都是通过可达性分析算法寻找活对象
        * 标记-清除算法：标记阶段，找出所有需要回收的对象；清除阶段，会在对象的位置就地清理（会产生大量不连续的内存碎片）
        * 复制算法：将内存分为大小相等的两块，当一块内存用完了就将活着的对象复制到另外一块内存上，然后把已经使用的内存全部清理掉（相当于人为的把内存变小了）
        * 标记-整理算法：标记阶段，找出所有需要回收的对象；清理阶段，把所有活对象移动到内存的另一端，然后把现在使用的那段全部清理掉
        * 分代回收算法：将内存分为新生代和老年代，新生代使用复制算法回收对象，老年代使用标记-整理算法回收对象
            * MinorGC指新生代的GC
            * FullGC指老年代的GC，一次FullGC一般会伴随至少一次的MinorGC
    * 垃圾收集器，垃圾回收的具体实现：
        * 并行收集器：收集线程同时工作，并将用户线程停止
        * 并发收集器：用户线程和收集线程交替执行
        * 并发并行收集器：回收时，某些步骤使用并发操作，某些步骤使用并行操作
        * `Serial`收集器（新生代）：
            * 可以与老年代的`CMS`或`Serial Old`收集器组合使用
            * 单线程收集器，回收时会停止所有用户线程
            * JVM在Client模式下的新生代默认收集器
        * `ParNew`收集器（新生代）：并行收集器
            * 可以与老年代的`CMS`或`Serial Old`收集器组合使用
            * 多线程收集器，回收时会停止所有用户线程
            * JVM在Server模式下的新生代默认收集器
        * `Parallel Scavenge`收集器（新生代）：并行收集器
            * 可以与老年代的`Serial Old`或`Parallel Old`收集器组合使用
            * 主要目标是在GC时达到一个可控制的吞吐量（吞吐量=用户线程执行时间+回收线程执行时间/CPU总运行时间，吞吐量优先=用户线程执行时间增大，回收线程执行时间缩小），回收时会停止所有用户线程
        * `Serial Old`收集器（老年代）：`Serial`收集器在老年代中的实现
            * 可以与新生代的`Serial`或`ParNew`或`Parallel Scavenge`收集器组合使用
        * `Parallel Old`收集器（老年代）：`Parallel Scavenge`收集器在老年代中的实现
            * 可以与新生代的`Parallel Scavenge`收集器组合使用
        * `CMS`收集器（老年代）：并发并行收集器
            * 可以与新生代的`Serial`或`ParNew`收集器组合使用，且出现错误时可以使用老年代的`Serial Old`作为后补收集器
            * 主要目标是获取最短GC停顿时间，回收时不会停止所有用户线程
            * 使用标记-清除算法作为垃圾回收算法，分为如下4步：
                * 初始标记：需要将用户线程停止，仅仅标记`GC Root`中关联的对象
                * 并发标记：与用户线程一起交替执行，遍历`GC Root`中对象的引用链（可达性分析）
                * 重新标记：需要将用户线程停止，目的是为了追踪并发标记过程中发生的引用变化
                * 并发清除：与用户线程一起交替执行，就地清除对象内存
            * 缺点：
                * 由于与用户线程一起工作，会降低用户线程的响应能力
                * 在并发清除时会产生浮动垃圾（清理的同时产生新的垃圾），且只能在下次GC时清除浮动垃圾
                * 会产生内存碎片
        * `G1`收集器：并发并行收集器
            * 不在区分老年代和新生代，所有的内容分为不同的Region，不与其他收集器组合使用
            * 主要目标是获取最短GC停顿时间，回收时不会停止所有用户线程，并且可以预测停顿时间（记录内存Region的回收价值，优先回收价值最高的Region）
            * 使用标记-整理算法作为垃圾回收算法，分为如下4步：
                * 初始标记：需要将用户线程停止，仅仅标记`GC Root`中关联的对象
                * 并发标记：与用户线程一起交替执行，遍历`GC Root`中对象的引用链（可达性分析）
                * 最终标记：需要将用户线程停止，目的是为了追踪并发标记过程中发生的引用变化
                * 筛选回收：与用户线程一起交替执行，整理对象内存
* 内存交互协议以及限制：
    <table>
        <tr>
            <td><img src='../images/javase/内存交互1.png' width='350px'></td>
            <td><img src='../images/javase/内存交互2.png' width='350px'></td>
        </tr>
        <tr>
            <td><img src='../images/javase/交互限制1.png' width='350px'></td>
            <td><img src='../images/javase/交互限制2.png' width='350px'></td>
        </tr>
    </table>

****

# JVM解析步骤
* 编译过程（详情参考《深入理解java虚拟机》第279页）：<img src='../images/javase/编译过程.png' width='400px'>
    * 源代码示例：<img src='../images/javase/javac编译源示例代码.png' width='200px'>
    * 词法分析过程，读取源代码，定位关键字，找出规范化的Token流
        * Token流的解析顺序是通过java语言的语法顺序定义
        * 解析完的Token流：<img src='../images/javase/示例代码解析成token流.png' width='400px'>
    * 语法分析过程，解析Token，生成抽象语法树，语法检测发生在这步
        * 将Token流组件成结构化的语法树，也就是形成语句
        * 语法树的节点是XXXTree和JCTree的子类，最终每个节点是JCXXX类，每个类都表示一种特定的操作
        * 最终形成的语法树为：<img src='../images/javase/示例代码解析成语法树.png' width='400px'>
    * 注解处理器
        * 如果需要在编译时期加入注解处理器，需要```javac -processor 注解处理器类```，注解处理器类必须继承AbstractProcessor类，并实现process方法
        * 基础注解器操作参考《深入理解java虚拟机》第297页，区别注解符解析，有待进一步研究通过自己的框架
    * 语义分析过程，将难懂、复杂的语法转化为简单的语法
        * 优化语法树，包括添加默认构造函数、检查变量类型、检查操作语句是否可达、检查异常是否处理、解除语法糖等
        * 标注检查、数据及控制流分析、解释语法糖（语言特有的可省略的或者默认约定的语法，泛型、自动装箱、自动拆箱、遍历循环）
    * 最后将化简过的语法树通过字节码生成器生成字节码
        * 生成.class文件，将java代码会转化为Oolong汇编语言代码，详情在《JavaWeb深入分析技术内幕》145页
        * 可以通过javap生成比Oolong汇编语言代码更易懂的.class文件
* 即时编译器，运行时：（编译器优化等详情参考《深入理解java虚拟机》第308页）
    * 在javac编译完后，执行程序时，如果发现多次调用的方法或者多次执行的循环体会触发，将方法编译成本地方法
    * 执行时先是利用C0（解释器）执行
    * 其次当调用次数达到C1（client编译器）的阈值时，会通过C1将方法编译成本地方法，进行简单优化
    * 当调用次数达到C2（server编译器）的阈值时，会通过C2将方法编译成本地方法，进行深度优化
    * 触发垃圾回收时会触发热度衰减，也就是超过一定的时间限度（这段时间称为半衰周期），方法的调用次数没达到即时编译器的阈值，则会将方法调用器计数减半
    * 即时编译器介入的过程（方法计数器）：<img src='../images/javase/即时编译器介入.png' width='300px'>
    * 对于判断多次循环体，使用回边计数器，逻辑与方法计数器一致，回边计数器没有热度衰减    

****

# JVM类加载机制
* class文件结构，16进制格式，详情参考《深入理解java虚拟机》第159页：
    * 魔数与class文件版本，前4字节时魔数表示该class文件是否能被当前jvm执行，5字节是主版本号，6字节是次版本号
    * 常量池，字面常量（String，Interge），符号引用（类和接口名字、字段名字和描述符、方法的名字和描述符）
    * 访问标志，如是类还是接口，是Public还是Private，多种标志会合并成一个16进制数
    * 类索引、父类索引、接口索引集合
    * 字段表集合，各标志出现顺序与字段定义时的顺序一致
    * 方法表集合，各标志出现顺序与方法定义时的顺序一致；方法返回值不参与重载，但是可以在class文件中作为区别唯一性
    * 属性表集合，用于存放类体，方法体的
* ClassLoader工作原理
    * 双亲委派模型：当类加载器收到加载请求时，会请求父加载器加载，当父类无法完成任务时才会自己处理；但是JNDI, JDBC等实现要求父加载器调用子加载器去加载类（线程级别类加载器），破坏了双亲模型（基础类中需要调用实现类或依赖类中的方法）
    * 主要任务：负责将.class文件加载到JVM内存中、检查哪个类该由谁加载、将.class文件字节码解析成JVM统一要求的对象格式
    * BootstrapClassLoader：加载JVM自身需要的类，完全由JVM控制，无父类和子类
    * ExtClassLoader：加载既不是JVM自身类，也不是应用程序类的其他类，主要是java.ext.dirs目录下的类
    * AppClassLoader：是ExtClassLoader子类，加载应用程序类，除了ExtClassLoader加载的类，所有的类都归该加载器加载
    * JVM加载类的方式：
        * 隐式加载：不通过在代码调用ClassLoader来加载需要的类，而是通过JVM来自动加载需要的类到内存的方式，如普通的new操作
        * 显示加载：在代码中调用ClassLoader来加载需要的类，如```this.getClass.getClassLoader().loadClass(); Class.forName();```
    * .class文件加载到JVM内存的步骤：<img src='../images/javase/class文件加载步骤.png' width='450px'>
        * 加载：
            * 通过类的全限定名来获得此类的二进制字节流，应用实例：<img src='../images/javase/加载过程实例.png' width='300px'>
            * 将字节流代表的静态存储结构转化为方法区的运行时数据结构
            * 在java堆中生成一个代表该类的Class对象，作为方法区这些数据的访问入口
        * 验证：
            * 文件格式验证，验证class文件规范，是否可以被当前本部的虚拟机执行
            * 元数据验证，验证class文件中信息符合java语言规范要求，也就是验证相关的声明
            * 字节码验证，验证class文件中描述的数据流和控制流，也就是验证方法体的具体内容
            * 符号引用验证，验证访问权是否正确等信息
        * 准备：为类变量分配内存并且设置类变量的初始值（静态变量），全部都在方法区中
        * 解析：将常量池中的符号引用替换为直接引用，类或接口解析、字段解析、类方法解析、接口方法解析
        * 初始化：四种实例化才会触发类初始化，其他的都是被动引用
            * 遇到new、getstatic、putstatic、invokestatic四个字节指令（调用new、读取设置静态变量、调用类静态方法）
            * 通过反射对类进行反射调用
            * 初始化时触发父类初始化
            * 虚拟机启动时，指定的要执行的主类
    * 类加载过程中的异常：ClassNotFoundException（显示加载找不到类），NoClassDefFoundError（隐式加载找不到类，new关键字，类中引用其他类、接口），UnsatisfiedLinkError（JVM自己lib被删除），ClassCastException（类型转换异常），ExceptionInInitializerError
    * 当类加载器加载完类后不记录类的状态，即用完就删除，就可以实现解释性语言

****

# JVM参数
* 详细GC配置参数《JavaWeb深入分析技术内幕》第243页
* JVM主要参数列表参考《深入理解java虚拟机》第393页
* JVM参数设置三种方式：<img src='../images/javase/jvm参数设置三种方式.png' width='300px'>
* 自定义存储空间：
    * -Xms：指定堆初始大小
    * -Xmx：指定堆最大值
    * -Xmn：指定Young区域大小
    * -Xss：指定栈大小
    * -XX:PermSize：指定永久代初始大小
    * -XX:MaxPermSize：指定永久代最大值
* GC相关设定
    * XX:+DisableExplicitGC：调整System.gc()
    * -XX:+PrintGCDetails：打印GC日志
    * -XX:+UseSerialGC：指定Serial Collector垃圾回收算法
    * -XX:PretenureSizeThreshold：指定Eden区触发minor GC阈值
    * -XX:HandlePromotionFailure：Young区往Old区转移时是否触发full GC标志
    * -XX:MaxTenuringThreshold：控制minor GC多少次才将对象从Eden区移到Old区：
    * -XX:+UseParNewGC：指定ParNewGC垃圾回收算法
    * -XX:+UseParallelGC： 指定ParallelGC垃圾回收算法
    * -XX:+UseParallelOldGC：指定ParallelOldGC垃圾回收算法
    * -XX:ParallelGCThreads：指定ParallelGC垃圾回收线程数量
    * -XX:SurvivorRatio：指定Eden区与Servivor区的比例
    * -XX:+UseConcMarkSweepGC：指定CMS Collector垃圾回收算法
    * -XX:ParallelCMSThreads：指定CMSParallelGC垃圾回收线程数量
    * -XX:CMSInitiatingOccupancyFraction：指定Old区使用率触发GC
    * -XX:+HeapDumpOnOutOfMemoryError：保存OutOfMemoryError时的快照
    * -XX:MaxDirectMemorySize，不指定与-Xmx保持一致：指定直接内存区大小
    * -verbose:class、-XX:+TraceClassLoading、-XX:+TraceClassUnLoading：查看类加载卸载信息
    * 详细列表：<img src='../images/javase/GC参数.png' width='400px'>
* 即时编译器设置
    * -client：强制指定即时编译器使用client模式
    * -server：强制指定即时编译器使用server模式
    * -Xint：强制即时编译器使用解释模式
    * -Xcomp：强制即时编译器使用编译模式
    * -XX:CompileThreshold：指定调用次数触发即时编译器工作的阈值
    * -XX:-UseCounterDecay：关闭热度衰减
    * -XX:CounterHalfLifeTime：设置半衰周期，单位是秒
* jvm工具集，详情参考《深入理解java虚拟机》第97页，需要实践
    * 命令行工具：
        * jps：虚拟机进程状况工具
        * jstat：虚拟机统计信息监视工具
        * jinfo：java配置信息工具
        * jmap：java内存映射工具
        * jhat：虚拟机堆转储快照分析工具
        * jstack：java堆栈跟踪工具
    * 可视化工具：
        * JConsole：java监视与管理控制台
        * VisualVM：多合一故障处理工具