## 指令格式的优化设计
* 主要目标：节省程序的存储空间；使指令格式尽量规整，便于译码

### 指令的组成
*一般的指令主要由**操作码**和**地址码**组成*
* 地址码包括：
    * 地址：地址码，立即数，寄存器，变址寄存器
    * 地址的附加信息：偏移量，块长度，跳距
    * 寻址方式
* 操作码包括：
    * 操作种类：运算操作、数据传送、移位、输入输出操作
    * 操作数描述：数据类型，进位制、数据字长

### 操作码的优化设计
*目的：节省存储空间*
* 编码方法
    * 固定长度
        * 定长定域：许多RISC处理机采用定长操作码
        * 优点：规整；译码简单
        * 缺点：浪费信息量
       
    * Huffman编码
        * 操作码的最短平均长度：$ H = - \sum_{i=1}^{n} p_i · log_2 p_i $
        * 固定长编码相对于Huffman编码的信息冗余量：$R = 1 - \frac{-\sum_{i=1}^{n} p_i·log_2 p_i}{\left \lceil log_2 n\right \rceil}$
        * 编码步骤：
            * 把所有指令按照操作码出现的概率大小，自左向右顺序排列
            * 把两个概率最小的节点合并到一个概率值是二者之和的新节点，并把这个新节点与其他还没合并的节点形成新的节点集合。
            * 在新的节点集合中，选取最小的两个节点进行合并，如此继续进行下去，直至全部节点合并完毕
            * 最后得到的根节点概率值为1
            * 每个新节点都有两个分支，分别用带有箭头的线表示，并分别用一位代码“0”和“1”标注
            * 从根节点开始，沿尖头所指方向寻找到达属于该指令概率节点的最短路径，把沿线所经过的代码排列起来就得到了这条指令的操作码编码
        * 主要缺点：操作码长度很不规整，硬件译码困难；与地址码组成有规则长度的指令比较困难
    
* 拓展编码
    * 由固定长操作码和Huffman编码相结合形成
    * 等长扩展编码法：
    
        <img src="./等长拓展.png" width = 60%>
    * 不等长操作码编码法
    
        <img src = "./不等长拓展.png" width = 60%>

### 地址码的优化设计
* 地址码个数的选择
    * 各种不同地址数指令的特点及适用场合：
    |地址数目|指令长度|程序存储量|程序执行速度|适用场合|
    |:-----:|:-----:|:-------:|:---------:|:------:|
    |三地址|短|最大|一般|向量，矩阵运算为主|
    |二地址|一般|很大|很低|一般不宜采用|
    |一地址|较长|较大|较低|连续运算，硬件结构简单|
    |零地址|最长|最小|最低|嵌套，递归，变量较多|
    |二地址R型|一般|最小|最快|多累加器，数据传送较多|
* 缩短地址码长度的方法
    *目的是要用一个比较短的地址码表示一个比较大的逻辑地址空间，且要求有比较灵活有效的寻址方式*
    * 用间址寻址方式缩短地址码长度
        - 主存储器的低端存放逻辑地址码
    * 用变址寻址方式缩短地址码长度
        - 将较长的地址码放进变址寄存器
    * 用寄存器间接地址方式缩短地址码长度   ----->最有效的方法