## 树
树是n（n>=0）个结点的有限集.n=0称为空树，在任意一颗非空树中，有且仅有一个称为根的结点；当n>1时，其余结点可分为m（m>0）个互不相交的有限集$T_1,T_2,...,T_m$,其中每一个集合本身又是一棵树，并且称为根的子树。一种一对多的数据结构

### 结点的分类
#### 一些定义
**度** 结点拥有的子树数称为结点的度

**叶结点、终端结点** 度为0的结点

**分支结点、非终端结点** 度不为0的结点

**内部结点** 除根结点外，分支结点也称为内部结点

**树的度** 指树中度最大结点的度

**树的深度** 树中结点的最大层次

**有序树** 如果树中各结点的子树看成从左到右是有次序的，不能互换

**森林** m棵互不相交的数的集合

### 结点间的关系
**孩子 双亲**结点的子树的根称为该结点的孩子，相应的该结点称为双亲

**兄弟**同一个双亲之间的孩子之间称为兄弟结点

**祖先**结点的祖先是从根结点到该结点所经分支上的所有结点

**子孙** 以某结点为根的子树中任一结点都称为该结点的子孙

**结点的层次** 根为第一层，根的孩子为第二层

**堂兄弟** 其双亲在同一层的结点

### 树的存储结构

**双亲表示法** *根据parent指针很容易找到data的双亲*，时间复杂度为O(1)，parent为-1表示找到树结点的根，*但若要知道结点的孩子，则需要遍历整棵树*；若需要关注结点的孩子、兄弟，而且对时间遍历要求比较高，可以将此结构扩展为双亲域、长子域、右兄弟域，树的存储结构非常灵活

下标|data|parent

**孩子表示法** 每个结点有多个指针域，其中每个指针指向指向一棵树的根结点，将这种方法叫做多重链表表示法

|data|child1|child2|...|childd

改进版 degree存储该结点孩子结点个数，这种方法克服了空间浪费的缺点
|data|degree|child1|child2|...|childd

*孩子表示法*把每个结点的孩子结点排列起来，以单链表作为存储结构，则n个结点有n个孩子链表，如果是叶子结点，则此单链表为空，然后n个头指针又组成一个线性表，采用顺序结构，存放在一个数组中。所以需要以下两种数据结构。优点是对查找某个结点的孩子或兄弟很方便；缺点是若想要知道双亲，需遍历整个结构

孩子结点 child存储某个结点在表头数组中的下标，next是指向该结点下一个孩子的指针
|child|next

表头结点 firstchild是头指针域，存储该结点孩子链表的头指针
|data|firstchild

*延伸 双亲孩子表示法*

**孩子兄弟表示法** 这种表示法给查找某个结点的某个孩子带来了方便；这种表示法最大的好处就是将一个复杂的树变成了一棵二叉树

|data|firstchild|rightsib

rightsib 表示指向此结点的右兄弟



## 二叉树
对于某个阶段都是两种结果的情形，都适合用树状结构建模，而这种树是一种很特殊的树状结构，叫做二叉树
**二叉树特点**
+ 每个结点最多有两棵子树
+ 左子树和右子树是有顺序的，不能颠倒
+ 即使某树只有一个子树，也要区分是左子树还是右子树


### 特树二叉树
**斜树** 所有的结点都只有左子树的二叉树叫左斜树，右斜树同理，这两者统称为斜树；斜树的特点是：每一层只有一个结点，树的深度等于结点的个数

**满二叉树** 所有的分支结点都存在左子树与右子树，并且所有的叶子都在同一层上，这样的二叉树称为满二叉树。满二叉树的特点：叶子结点只能在最下一层，非叶子结点的度一定是2，在同样深度的二叉树中，满二叉树的结点个数最多，叶子数最多

**完全二叉树** 对一颗具有n个结点的二叉树按层序编号，如果编号为i（<1<i<n）的结点与同样深度的满二叉树中编号为i的结点在二叉树中位置完全相同，则这棵树称为完全二叉树
*特点*
+ 叶子结点只能出现在最下两层
+ 最下层的叶子一定要集中出现在左部连续位置
+ 倒数第二层，若有叶子结点，一定都在右部连续位置
+ 不存在只有右子树的情况
+ 同样结点数的二叉树，完全二叉树深度最小 （这个不是很懂，满二叉树也是完全二叉树啊！）

### 二叉树的性质
+ 在二叉树的第i层上最多有$2^{i-1}$个结点（i>=1）
+ 深度为k的二叉树最多有$2^k-1$个结点(k>=1）
+ 对任何一棵二叉树T，一定满足$n_0 = n_2+1$ $n_0$表示度为0的结点数，即叶子结点；$n_1$表示度为1的结点数，$n_2$表示度为2的结点数

**推导**设n为树的总结点树，则$n=n_0+n_1+n_2$，而分支总数等于n-1（根结点没有分支进入），分支的代数计算为$n-1=n_1+2n_2$,联立两个等式即可得到
+ 具有n个结点的完全二叉树深度为$\left \lfloor log_2 n \right \rfloor+1$

**推导** $2^{k-1}-1<n<=2^k-1$ &==》& $2^{k-1}=<n<2^k$

+ 如果对一棵有n个结点的完全二叉树（其深度为$\left \lfloor log_2 n \right \rfloor+1$）的结点按层序编号（从第一层到$\left \lfloor log_2 n \right \rfloor+1$层，每层从左到右），对任一结点i（1<=i<=n）有：
   + 若i=1，则结点是二叉树的根，无双亲；i>1,则其双亲是$\left \lfloor \frac{i}{2}\right \rfloor$
   + 若2i>n, 则结点i无左孩子（i为叶子结点）；否则其左孩子是结点2i
   + 若2i+1 > n, 则结点i无右孩子；否则，其右孩子结点数为2i+1
   






### 二叉树的顺序存储结构
用一维数组存储二叉树的结点，并且结点的存储位置,也即是数组的下标要体现结点之间的逻辑关系，比如双亲与孩子的关系，左右兄弟的关系等；顺序存储结构一般只用于完全二叉树

### 二叉链表
|lchild|data|rchild|

### 遍历二叉树
从根结点出发，按照某种次序依次访问二叉树中所有结点，使得每个结点被访问一次且仅被访问一次
**前序遍历** 若二叉树为空，则返回空操作；否则先访问根结点，然后前序遍历左子树，在前序遍历右子树
**详细步骤**  先访问根结点，再遍历左子树，最后遍历右子树；并且在遍历左右子树时，仍需先遍历左子树（将所有的左子树遍历完！！），然后访问根结点，最后遍历右子树。{仍是先访问左子树的根结点，遍历左子树，遍历右子树，相当于一个递归的过程。}*有点自顶向下的感觉*

**中序遍历** 若二叉树为空，则返回空操作；否则从根结点开始（并不是先访问根结点），中序遍历左子树，然后是访问根结点，最后中序遍历右子树
**详细步骤** 先遍历左子树、然后访问根结点，最后遍历右子树；并且在遍历左右子树的时候。仍然是先遍历左子树，然后访问根结点，最后遍历右子树。*有点自底向上的感觉*

**后序遍历** 若二叉树为空，则返回空操作；否则从左到右先叶子后结点的方式遍历访问左右子树，最后访问根结点
**详细步骤**  先遍历左子树，然后遍历右子树，最后访问根结点；同样，在遍历左右子树的时候同样要先遍历左子树，然后遍历右子树，最后访问根结点。*也是一种自底向上的感觉*

**层序遍历** 若二叉树为空，则返回空操作；否则从树的第一层，也即是根结点开始访问，从上而下逐层遍历，在同一层中，按从左到右的顺序对结点逐个访问

**总结** 三种遍历都是从根结点开始的，前序遍历是先打印，再递归左右子树，所以已知前序和中序时，前序第一个即为根结点，然后根据该结点在中序中的位置，前面是左子树，后面是右子树分析即可。若是已知中序和后序，受限根据后序的最后一个结点是根结点，然后再根据根结点在中序序列中的位置，前边是左子树，后边是右子树。然后再根据后序序列的特点，子树的根结点也在最后！

**二叉树遍历的性质**
+ 已知前序和中序遍历序列，可以唯一确定一棵二叉树
+ 已知中序和后序遍历序列，可以唯一确定一棵二叉树

[python二叉树实现](http://blog.csdn.net/wshn13/article/details/8241261)




## 二叉树的建立
利用扩展二叉树在内存中建立一个二叉链表，因为扩展二叉树就可以做到一个遍历序列确定一棵二叉树

[python二叉树的建立](http://blog.csdn.net/u010439949/article/details/8908087)

## 线索二叉树
利用二叉树的空地址，存放指向结点在某种遍历次序下的前驱和后继结点的地址。将这种指向前驱和后继的指针称为线索，加上线索的二叉链表称为线索链表，相应的二叉树称为线索二叉树，线索二叉树等于把一棵二叉树转化为双向链表，这样对我们插入、删除、查找某个结点都带来了方便。将二叉树以某种次序遍历使其变为线索二叉树的过程就是线索化


## 树 森林于二叉树的转换
树或森林与二叉树之间有一个自然的一一对应关系。任何一个森林或一棵树可惟一地对应到一棵二叉树；反之，任何一棵二叉树也能惟一地对应到一个森林或一棵树。
### 树转二叉树
+ 加线 在所有兄弟之间加一条直线
+ 去线 对调整前树中的每个结点，只保留他与第一个孩子结点间的连线，删除其他连线
+ 层次调整 以根结点为轴心，将整棵树顺时针旋转一定角度，使之结构层次分明。注意，调整时，兄弟转化过来的孩子是结点的右孩子

<img src=http://pic002.cnblogs.com/images/2012/457289/2012110417011138.jpg>
[动态演示](http://student.zjzk.cn/course_ware/data_structure/web/flashhtml/zhuanhuan.htm)

### 森林转二叉树
将森林中的每棵树视为兄弟，可以按照兄弟的处理办法处理
+ 把每棵树转化为二叉树
+ 第一课二叉树不动，从第二棵二叉树开始，**依次**把后一棵二叉树的根结点作为前一棵二叉树根结点的右孩子，用线连接起来，当所有的二叉树连接起来后就得到了有森林转换过来的二叉树

<img src=http://pic002.cnblogs.com/images/2012/457289/2012110417004247.jpg>

### 二叉树转树
+ 加线 若某结点的左孩子结点存在，则将该结点的左孩子的所有右孩子结点作为此结点的孩子，将该结点与与这些右孩子结点用线连起来即可
+ 去线 删除原二叉树中所有结点与有孩子结点的连线
+ 层次调整 使之结构层次分明（这里没有过多的限制）
<img src=http://pic002.cnblogs.com/images/2012/457289/2012110417011138.jpg>
### 二叉树转森林
判断一棵二叉树能够转换成一棵树还是森林，只需看这棵二叉树的根结点有没有有孩子，有就是森林，没有就是一棵树。
+ 去线得分离二叉树 从根节点开始，若有孩子存在，则把与右孩子结点的连线删除；在查看分离后的二叉树，若右孩子存在，则连线删除。。。，直到所有的右孩子删除
+ 分离二叉树转树
<img src=http://pic002.cnblogs.com/images/2012/457289/2012110417014911.jpg>

### 树与森林的遍历
#### 树的遍历
+ 先根遍历树 先访问树的根结点，然后**依次**先跟遍历根的每课子树
+ 后跟遍历树 先**依次**后跟遍历每课子树，然后再访问根结点
#### 森林遍历
+ 前序遍历 先访问森林第一棵树的根结点，然后再依次先根遍历根的每课子树，再以同样的方式访问剩下的树；和二叉树的前序遍历结果相同
+ 后序遍历 先访问森林中的第一棵树，后根遍历的方式遍历每课子树，然后再访问根结点，再以同样的方式访问剩下的树；和二叉树的中序遍历结果相同

**结论** 当以二叉链表作为树的存储结构时，

## 赫夫曼树
**路径长度**从树中一个结点到另一个结点之间的分支构成两个结点之间的路径，路径上的**分支数目**称作路径长度

**树的路径长度**从树根到每一结点的路径长度之和

**结点的带权路径长度** 从该结点到树根之间的路径长度与结点上权的乘积

**树的带权路径长度** 树中所有*叶子结点*的带权路径长度之和

**赫夫曼树** 带权路径长度WPL最小的二叉树称为赫夫曼树，或者叫做最优二叉树

**构造赫夫曼树**
+ 根据给定的n个权值{w1，w2，w3，….wn}，构造n棵只有根结点的二叉树。
+ 在森林中选取两棵根结点权值最小的树作左右子树，构造一棵新的二叉树，置新二叉树根结点权值为其左右子树根结点权值之和。
+ 在森林中删除这两颗树，同时将新得到的二叉树加入森林中。
+ 重复上述两步，直到只含一棵树为止，这棵树即赫夫曼树

[赫夫曼树构造](https://yq.aliyun.com/articles/9840)



## 赫夫曼编码
一般的，设需要编码的字符集$\{d_1,d_2,\cdots,d_n\}$,各个字符在电文中出现的频率或次数集合为$\{w_1,w_2,\cdots,w_d\}$,以$d_1,d_2,\cdots,d_n$作为叶子结点，$w_1,w_2,\cdots,w_d$作为相应叶子结点的权值构造一棵哈夫曼树。规定哈夫曼树左分支代表0，右分支代表1，则从根节点到叶子结点所经过的路径分支组成的0 1 序列，便为该结点对应字符的编码，这就是哈夫曼编码