# 树回归

## 9.1 复杂数据的局部性建模

### 树回归
1. 优点：可以对复杂和非线性的数据建模
2. 缺点：结果不易理解
3. 适用数据类型：数值型和标称型数据

### 树回归的一般方法
1. 收集数据：采用任意方法收集数据
2. 准备数据：需要数值型的数据，标称型数据应该映射成二值型数据
3. 分析数据：绘出数据的二维可视化显示结果，以字典方式生成树
4. 训练算法：大部分时间都花费在叶节点树模型的构建上
5. 测试算法：适用测试数据上的R的平方来分析模型的效果
6. 使用算法：使用训练出的树做预测，预测结果还可以用来做很多事情

## 9.2 连续和离散型特征树的构建

### 这里使用一部字典来存储树的数据结构，该字典包括以下四个元素
1. 待切分的特征
2. 待切分的特征值
3. 右子树。当不再需要切分的时候，也可以是单个值
4. 左子树。与右子树类似

In [8]:
## CART算法的实现代码
from numpy import *
def loadDataSet(fileName):
    dataMat = []
    with open(fileName) as fr:
        for line in fr.readlines():
            curLine = line.strip().split('\t')
            # 将每行映射成浮点数
            fltLine = list(map(float,curLine))
            dataMat.append(fltLine)
    return dataMat
    
# 切分数据集为两个子集
def binSplitDataSet(dataSet,feature,value):
    '''
    参数：
    数据集
    待切分特征
    特征值
    '''
    # 索引值数组的每一个array均是从一个维度上来描述其索引值
    # 第一个array从行维度来描述索引值；第二个array从列维度来描述索引值。
    mat0 = dataSet[nonzero(dataSet[:,feature] > value)[0],:]
    mat1 = dataSet[nonzero(dataSet[:,feature] <= value)[0],:]
    return mat0,mat1

def createTree(dataSet,leafType=regLeaf,errType=regErr,ops=(1,4)):
    feat,val = chooseBestSplit(dataSet,leafType,errType,ops)
    if feat == None:
        return val
    retTree = {}
    retTree['spInd'] = feat
    retTree['spVal'] = val
    lSet,rSet = binSplitDataSet(dataSet,feat,val)
    retTree['left'] = createTree(lSet,leafType,errType,ops)
    retTree['right'] = createTree(rSet,leafType,errType,ops)
    return retTree

In [5]:
# 测试binSplitDataSet函数
testMat = mat(eye((4)))
print(testMat)
mat0,mat1 = binSplitDataSet(testMat,1,0.5)
print((mat0)[0])
testMat[nonzero(testMat[:,1] > 0.5)[0],:][0]

[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]
[[0. 1. 0. 0.]]


matrix([[0., 1., 0., 0.]])

## 9.3 将CART算法用于回归
chooseBestSplit()函数是为找到数据集切分的最佳位置，它遍历所有的特征及可能的取值来找到误差最小化的切分阈值

In [6]:
## 回归树的切分函数
# 生成叶节点，在回归树中是目标变量特征的均值
def regLeaf(dataSet):
    return mean(dataSet[:,-1])

# 计算误差，回归误差
def regErr(dataSet):
    # 计算目标变量的平方误差，返回的是总方差
    return var(dataSet[:,-1]) * shape(dataSet)[0]

# 二元切分
def chooseBestSplit(dataSet,leafType=regLeaf,errType=regErr,ops=(1,4)):
    '''
    param:
    数据集
    leafType:对创建叶节点的函数的引用
    errType:对总方差计算函数的引用
    ops:一个用户定义的参数的构成的元组
    '''
    #切分特征的参数阈值，用户初始设置好
    tolS = ops[0]  #允许的误差下降值
    tolN = ops[1]  #切分的最小样本数
    #若所有特征值都相同，停止切分
    if len(set(dataSet[:,-1].T.tolist()[0])) == 1:
        return None,leafType(dataSet)
    m,n = shape(dataSet)
    S = errType(dataSet)
    # 记录最小误差
    bestS = inf
    bestIndex = 0
    bestValue = 0
    #遍历数据的每个属性特征
    for featIndex in range(n-1):
        # 遍历每个特征里不同的特征值
        for splitVal in set((dataSet[:, featIndex].T.A.tolist())[0]):
            # 对每个特征进行二元分类
            mat0,mat1 = binSplitDataSet(dataSet,featIndex,splitVal)
            # 判断切分后子集大小，小于最小允许样本数，跳出循环，
            if shape(mat0)[0] < tolN or shape(mat1)[0] < tolN:
                continue
            newS = errType(mat0) + errType(mat1)
            if newS < bestS:
                bestIndex = featIndex
                bestValue = splitVal
                bestS = newS
    #如果切分后误差效果下降不大，则取消切分，直接创建叶结点
    if (S - bestS) < tolS:
        return None,leafType(dataSet)
    mat0,mat1 = binSplitDataSet(dataSet,bestIndex,bestValue)
    #判断切分后子集大小，小于最小允许样本数停止切分
    if (shape(mat0)[0] < tolN) or (shape(mat1)[0] < tolN):
        return None,leafType(dataSet)
    #返回特征编号和用于切分的特征值
    return bestIndex,bestValue

In [9]:
from numpy import *
myDat = loadDataSet('ex00.txt')
myMat = mat(myDat)
myMat[:,0].T.A.tolist()[0]
createTree(myMat)

{'left': 1.0180967672413792,
 'right': -0.04465028571428572,
 'spInd': 0,
 'spVal': 0.48813}

In [10]:
myDat1 = loadDataSet('ex0.txt')
myMat1 = mat(myDat1)
createTree(myMat1)

{'left': {'left': {'left': 3.9871632,
   'right': 2.9836209534883724,
   'spInd': 1,
   'spVal': 0.797583},
  'right': 1.980035071428571,
  'spInd': 1,
  'spVal': 0.582002},
 'right': {'left': 1.0289583666666666,
  'right': -0.023838155555555553,
  'spInd': 1,
  'spVal': 0.197834},
 'spInd': 1,
 'spVal': 0.39435}

## 9.4 树剪枝
1. 一棵树如果节点过多，表明该模型可能对数据进行了“过拟合”
2. 降低决策树的复杂度来避免过拟合的过程称为剪枝

### 预剪枝
例如说提前终止条件，是一种所谓的预剪枝

In [11]:
myDat2 = loadDataSet('ex2.txt')
myMat2 = mat(myDat2)
createTree(myMat2)

{'left': {'left': {'left': {'left': 105.24862350000001,
    'right': 112.42895575000001,
    'spInd': 0,
    'spVal': 0.958512},
   'right': {'left': {'left': {'left': {'left': 87.3103875,
       'right': {'left': {'left': 96.452867,
         'right': {'left': 104.825409,
          'right': {'left': 95.181793,
           'right': 102.25234449999999,
           'spInd': 0,
           'spVal': 0.872883},
          'spInd': 0,
          'spVal': 0.892999},
         'spInd': 0,
         'spVal': 0.910975},
        'right': 95.27584316666666,
        'spInd': 0,
        'spVal': 0.85497},
       'spInd': 0,
       'spVal': 0.944221},
      'right': {'left': 81.110152,
       'right': 88.78449880000001,
       'spInd': 0,
       'spVal': 0.811602},
      'spInd': 0,
      'spVal': 0.833026},
     'right': 102.35780185714285,
     'spInd': 0,
     'spVal': 0.790312},
    'right': 78.08564325,
    'spInd': 0,
    'spVal': 0.759504},
   'spInd': 0,
   'spVal': 0.952833},
  'right': {'left': {'l

> 从上述结果可以看出，数据有很多的叶节点，产生这个现象的原因在于，停止条件tols对误差的数量级十分敏感

### 后剪枝
使用后剪枝方法需要将数据集分成测试集和训练集。首先指定参数，使得构建出的树足够大，足够发咋，便于剪枝。  
接下来从上而下找到叶节点，用测试集来判断将这些叶节点合并是否能降低测试误差

In [12]:
## 回归树剪枝函数
# 判断输入是否为一棵树
def isTree(obj):
    # 若为字典类型返回True
    return type(obj).__name__ == 'dict'

# 从上往下遍历直到叶节点位置，如果找到两个叶节点则计算它们的平均值
def getMean(tree):
    if isTree(tree['right']):
        tree['right'] = getMean(tree['right'])
    if isTree(tree['left']):
        tree['left'] = getMean(tree['left'])
    return (tree['left'] + tree['right']) / 2.0

## 剪枝函数
def prune(tree,testData):
    '''
    paras:
    待剪枝的树，
    剪枝所需的测试数据
    '''
    # 确认测试集非空
    if shape(testData)[0] == 0:
        return getMean(tree)
    # 如左右子集非空，划分测试集
    # 假设发生过拟合，采用测试数据对树进行剪枝
    if (isTree(tree['right']) or isTree(tree['left'])):
        lSet,rSet = binSplitDataSet(testData,tree['spInd'],tree['spVal'])
    if isTree(tree['left']):
        tree['left'] = prune(tree['left'],lSet)
    if isTree(tree['right']):
        tree['right'] = prune(tree['right'],rSet)
    if not isTree(tree['left']) and not isTree(tree['right']):
        lSet,rSet = binSplitDataSet(testData,tree['spInd'],tree['spVal'])
        errorNoMerge = sum(power(lSet[:,-1] - tree['left'],2)) + \
                        sum(power(rSet[:,-1] - tree['right'],2))
        treeMean = (tree['left'] + tree['right']) / 2.0
        errorMerge = sum(power(testData[:,-1] - treeMean,2))
        if errorMerge < errorNoMerge:
            print("合并")
            return treeMean
        else:
            return tree
    else:
        return tree

In [13]:
myTree = createTree(myMat2,ops=(0,1))
myTree

{'left': {'left': {'left': {'left': {'left': 86.399637,
     'right': 98.648346,
     'spInd': 0,
     'spVal': 0.968621},
    'right': {'left': {'left': {'left': 112.386764,
       'right': 123.559747,
       'spInd': 0,
       'spVal': 0.960398},
      'right': 135.837013,
      'spInd': 0,
      'spVal': 0.958512},
     'right': {'left': {'left': 82.016541,
       'right': 100.935789,
       'spInd': 0,
       'spVal': 0.954711},
      'right': 130.92648,
      'spInd': 0,
      'spVal': 0.953902},
     'spInd': 0,
     'spVal': 0.956951},
    'spInd': 0,
    'spVal': 0.965969},
   'right': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': 100.649591,
                'right': 73.520802,
                'spInd': 0,
                'spVal': 0.952377},
               'right': 105.752508,
               'spInd': 0,
               'spVal': 0.949198},
              'right': 69.318649,
              'spInd': 0,
            

In [14]:
myDatTest = loadDataSet('ex2test.txt')
myMat2Test = mat(myDatTest)
prune(myTree,myMat2Test)

合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并
合并


{'left': {'left': {'left': {'left': 92.5239915,
    'right': {'left': {'left': {'left': 112.386764,
       'right': 123.559747,
       'spInd': 0,
       'spVal': 0.960398},
      'right': 135.837013,
      'spInd': 0,
      'spVal': 0.958512},
     'right': 111.2013225,
     'spInd': 0,
     'spVal': 0.956951},
    'spInd': 0,
    'spVal': 0.965969},
   'right': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': {'left': 96.41885225,
              'right': 69.318649,
              'spInd': 0,
              'spVal': 0.948822},
             'right': {'left': {'left': 110.03503850000001,
               'right': {'left': 65.548418,
                'right': {'left': 115.753994,
                 'right': {'left': {'left': 94.3961145,
                   'right': 85.005351,
                   'spInd': 0,
                   'spVal': 0.912161},
                  'right': {'left': {'left': 106.814667,
                    'right': 118.513475,
               

## 9.5 模型树
把叶节点设定为分段线性函数  
1. 模型树的可解释性优于回归树
2. 模型树具有更高的预测准确度

In [15]:
## 模型树的叶节点生成函数
def linearSolve(dataSet):
    m,n = shape(dataSet)
    X = mat(ones((m,n)))
    Y = mat(ones((m,1)))
    X[:,1:n] = dataSet[:,0:n-1]
    Y = dataSet[:,-1]
    xTx = X.T*X
    if linalg.det(xTx) == 0:
        raise NameError('矩阵为奇异矩阵，无法求逆')
    ws = xTx.I * (X.T * Y)
    return ws,X,Y

# 当数据不再切分的时候，它负责生成叶节点的模型
def modelLeaf(dataSet):
    ws,X,Y = linearSolve(dataSet)
    return ws

# 在给定的数据集上计算误差
def modelErr(dataSet):
    ws,X,Y = linearSolve(dataSet)
    yHat = X * ws
    return sum(power(Y - yHat,2))

In [17]:
myMat2 = mat(loadDataSet('exp2.txt'))
right1 = createTree(myMat2,modelLeaf,modelErr,(1,10))['right']

> 模型树、回归树，和一般的回归方法比较哪个模型更好，一个比较客观的方法是计算相关系数，也称为R方，  
    可以通过Numpy库中的命令corrcoef(yHat,y,rowvar=0)来求解，其中yHat是预测值，y是目标变量的实际值

## 9.6 示例：树回归与标准回归的比较

In [16]:
## 用树回归进行预测的代码
# 回归树叶节点
def regTreeEval(model,inDat):
    return float(model)

# 
def modelTreeEval(model,inDat):
    n = shape(inDat)[1]
    X = mat(ones((1,n+1)))
    X[:,1:n+1] = inDat
    # print(model)
    print(X * model)
    return float(X * model)

# 
def treeForeCast(tree,inData,modelEval=regTreeEval):
    '''
    自顶向下遍历整棵树，直到叶节点为止
    '''
    if not isTree(tree):
        return modelEval(tree,inData)
    # 左树，数值大的作为左树的数据集
    if inData[:,tree['spInd']] > tree['spVal']:
        if isTree(tree['left']):
            return treeForeCast(tree['left'],inData,modelEval)
        else:
            return modelEval(tree['left'],inData)
    # 右树
    else:
        if isTree(tree['right']):
            return treeForeCast(tree['right'],inData,modelEval)
        else:
            return modelEval(tree['right'],inData)

# 能够以向量形式返回一组预测值
def createForeCast(tree,testData,modelEval = regTreeEval):
    m = len(testData)
    yHat = mat(zeros((m,1)))
    for i in range(m):
        yHat[i,0] = treeForeCast(tree,mat(testData[i]),modelEval)
    return yHat

In [17]:
trainMat = mat(loadDataSet('bikeSpeedVsIq_train.txt'))
myTree = createTree(trainMat,ops=(1,20))
myTree

{'left': {'left': {'left': 168.34161286956524,
   'right': 157.0484078846154,
   'spInd': 0,
   'spVal': 20.0},
  'right': {'left': 141.06067981481482,
   'right': 122.90893026923078,
   'spInd': 0,
   'spVal': 14.0},
  'spInd': 0,
  'spVal': 17.0},
 'right': {'left': 94.7066578125,
  'right': {'left': 69.02117757692308,
   'right': 50.94683665,
   'spInd': 0,
   'spVal': 5.0},
  'spInd': 0,
  'spVal': 7.0},
 'spInd': 0,
 'spVal': 10.0}

In [18]:
testMat = mat(loadDataSet('bikeSpeedVsIq_test.txt'))
yHat = createForeCast(myTree,testMat[:,0])
# 计算相关系数，也称为R的平方，rowvar=0用于计算各列之间的相关系数
corrcoef(yHat,testMat[:,1],rowvar=0)

array([[1.        , 0.96408523],
       [0.96408523, 1.        ]])

In [21]:
import matplotlib.pyplot as plt
fig = plt.figure()
ax = plt.subplot(111)
ax.scatter(array(testMat[:,0]),array(testMat[:,1]),c='red',marker='o')
plt.show()

KeyboardInterrupt: 

In [23]:
## 再创建一棵模型树
myTree1 = createTree(trainMat,modelLeaf,modelErr,(1,20))
# print(myTree1)
yHat1 = createForeCast(myTree1,testMat[:,0],modelTreeEval) 
print(yHat1)
corrcoef(yHat1,testMat[:,1],rowvar=0)[0,1]

[[119.61969695]]
[[155.97526025]]
[[119.61969695]]
[[139.1075255]]
[[45.2990143]]
[[65.11204425]]
[[33.5134496]]
[[162.20824662]]
[[109.41165214]]
[[163.31013796]]
[[33.5134496]]
[[33.5134496]]
[[126.34819074]]
[[57.08457901]]
[[73.02126975]]
[[73.02126975]]
[[174.33146395]]
[[149.74227389]]
[[97.26891497]]
[[149.74227389]]
[[68.87014372]]
[[139.1075255]]
[[33.5134496]]
[[85.14509236]]
[[73.02126975]]
[[109.41165214]]
[[126.34819074]]
[[51.3905131]]
[[33.5134496]]
[[139.1075255]]
[[155.97526025]]
[[97.26891497]]
[[162.20824662]]
[[109.41165214]]
[[21.72788489]]
[[162.20824662]]
[[149.74227389]]
[[168.82080096]]
[[145.48719288]]
[[143.50928752]]
[[155.97526025]]
[[155.97526025]]
[[174.33146395]]
[[85.14509236]]
[[33.5134496]]
[[145.48719288]]
[[109.41165214]]
[[145.48719288]]
[[119.61969695]]
[[51.3905131]]
[[109.41165214]]
[[33.5134496]]
[[57.08457901]]
[[57.08457901]]
[[126.34819074]]
[[174.33146395]]
[[119.61969695]]
[[85.14509236]]
[[85.14509236]]
[[132.72785812]]
[[33.5134496]]
[[9

0.9760412191380623

> 从相关系数中可以看出模型树比回归树更好

In [22]:
## 标准线性回归效果
ws,X,Y = linearSolve(trainMat)
print(ws)
m,n = shape(trainMat)
yHat = mat(ones((m,1)))
for i in range(m):
    yHat[i] = testMat[i,0]*ws[1,0]+ws[0,0]
print(yHat)
corrcoef(yHat,testMat[:,1],rowvar=0)

[[37.58916794]
 [ 6.18978355]]
[[111.86657056]
 [155.19505542]
 [111.86657056]
 [130.43592122]
 [ 49.96873504]
 [ 74.72786925]
 [ 56.15851859]
 [161.38483897]
 [105.67678701]
 [167.57462253]
 [ 56.15851859]
 [ 56.15851859]
 [118.05635411]
 [ 43.77895149]
 [ 80.9176528 ]
 [ 80.9176528 ]
 [179.95418963]
 [149.00527187]
 [ 93.29721991]
 [149.00527187]
 [ 37.58916794]
 [130.43592122]
 [ 56.15851859]
 [ 87.10743635]
 [ 80.9176528 ]
 [105.67678701]
 [118.05635411]
 [ 68.5380857 ]
 [ 56.15851859]
 [130.43592122]
 [155.19505542]
 [ 93.29721991]
 [161.38483897]
 [105.67678701]
 [ 62.34830215]
 [161.38483897]
 [149.00527187]
 [173.76440608]
 [136.62570477]
 [142.81548832]
 [155.19505542]
 [155.19505542]
 [179.95418963]
 [ 87.10743635]
 [ 56.15851859]
 [136.62570477]
 [105.67678701]
 [136.62570477]
 [111.86657056]
 [ 68.5380857 ]
 [105.67678701]
 [ 56.15851859]
 [ 43.77895149]
 [ 43.77895149]
 [118.05635411]
 [179.95418963]
 [111.86657056]
 [ 87.10743635]
 [ 87.10743635]
 [124.24613766]
 [ 56.158

array([[1.        , 0.94346842],
       [0.94346842, 1.        ]])

> 在R方上可以看出标准的线性回归效果不如两种树回归方法

## 9.7 使用 Python 的 Tkinter 库创建GUI
可以同时支持数据呈现和用户交互

### 示例： 利用GUI对回归树的调优
1. 收集数据： 所提供的文本文件
2. 准备数据： 用Python解析上述文件，得到数值型的数据
3. 分析数据： 用Tkinter构建一个GUI来展示模型和数据
4. 训练算法： 训练一棵回归树和一棵模型树，并与数据集一起展示出来
5. 测试算法： 这里不需要测试过程
6. 使用算法： GUI使得人们在预剪枝时测试不同参数的影响，还可以帮助我们选择模型的类型

### 9.7.1 用Tkinter创建GUI


In [23]:
from tkinter import * 
# 建立一个窗口
root = Tk() # 这时会出现一个小窗口
# 标签控件
myLabel = Label(root,text="Hello world")
# 控件的布局
## grid()方法会把小部件安排在一个二维表格中，用户可以设定每个小部件所在的行列位置
## 若没有设定，myLabel会默认显示在0行0列
myLabel.grid()
#使程序完整：
root.mainloop()

KeyboardInterrupt: 

## Tkinter 的 GUI 由一些小控件组成
1. 文本框(Text Box)
2. 按钮(Buttion)
3. 标签(Label)
4. 复选按钮(Check Button)
...

In [None]:
## 用于构建树管理器界面的Tkinter小部件
from numpy import * 
from tkinter import * 
def reDraw(tolS,tolN):
    # 清楚画布
    reDraw.f.clf()
    # 重新添加新图
    reDraw.a = reDraw.f.add_subplot(111)
    # 检查modelTree是否被选中
    if chkBtnVar.get():
        if tolN < 2:
            tolN = 2
        myTree = createTree(reDraw.rawDat,modelLeaf,modelErr,(tolS,tolN))
        yHat = createForeCast(myTree,reDraw.testDat,modelTreeEval)
    else:
        myTree = createTree(reDraw.rawDat,ops=(tolS,tolN))
        yHat = createForeCast(myTree,reDraw.testDat)
    reDraw.a.scatter(reDraw.rawDat[:,0].tolist(),reDraw.rawDat[:,1].tolist(),s=5)
    reDraw.a.plot(reDraw.testDat,yHat,linewidth=2.0)
    reDraw.canvas.show()
    
def getInputs():
    try:
        #期望输入是整数，为了得到用户输入的值，用.get()方法
        tolN = int(tolNentry.get())
    except:
        tolN = 10
        print("enter Interger for tolN")
        # 删除所有的元素
        tolNentry.delete(0,END)
        # 在文本框开始位置插入10
        tolNentry.insert(0,'10')
    try:
        #期望输入是浮点数
        tolS = float(tolSentry.get())
    except:
        tolS = 1.0
        print("enter float for tolS")
        # 删除所有的元素
        tolSentry.delete(0,END)
        # 在文本框开始位置插入1.0
        tolSentry.insert(0,'1.0')
    return tolN,tolS
    
def drawNewTree():
    tolN,tolS = getInputs()
    reDraw(tolS,tolN)

# 建立一个窗口
root = Tk()
# 设置标签，并用grid设置行与列的位置，columnspan跨3列

# 创建画布
reDraw.f = Figure(figsize = (5,4),dpi=100)
reDraw.canvas = FigureCanvasTkAgg(reDraw.f,master=root)
reDraw.canvas.show()
reDraw.canvas.get_tk_widget().grid(row=0,columnspan=3)

Label(root,text = "Plot Place Holder").grid(row=0,columnspan=3)

Label(root,text = "tolN").grid(row=1,column=0)
# 文本输入框Entry()，允许单行文本输入的文本框
tolNentry = Entry(root)
tolNentry.grid(row=1,column=1)
tolNentry.insert(0,'10')
Label(root,text="tolS").grid(row=2,column=0)
tolSentry = Entry(root)
tolSentry.grid(row=2,column=1)
tolSentry.insert(0,'1.0')
## 按钮控件，rowspan跨3行
Button(root,text = "ReDraw",command=drawNewTree).grid(row=1,column=2,rowspan=3)
# IntVar按钮整数值,保存一个整型变量，默认值为0
chkBtnVar = IntVar()
# checkButton为复选框，variable控制变量，跟踪Checkbutton的状态，On(1)，Off(0)
chkBtn = Checkbutton(root,text="Model Tree",variable = chkBtnVar)
chkBtn.grid(row=3,column=0,columnspan=2)
reDraw.rawDat = mat(loadDataSet('sine.txt'))
reDraw.testDat = arange(min(reDraw.rawDat[:,0]),max(reDraw.rawDat[:,0]),0.01)
reDraw(1.0,1.0)
root.mainloop()

### 9.7.2 集成Matplotlib和Tkinter
Matplotlib 的构建程序包含一个前端，如plot() 和 scatter() 方法  
通过改变后端可以将图像绘制在PNG、PDF、SVG等格式的文件上  
将后端设置为TkAgg(Agg是一个C++的库，可以从图像创建光栅图）TkAgg可在所选GUI框架上调用Agg，把Agg呈现在画布上

In [24]:
## Matplotlib 和 Tkinter的代码集成
import matplotlib
matplotlib.use('TkAgg')
# 两个import声明将TkAgg和Matplotlib链接起来
from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg
from matplotlib.figure import Figure