## 梯度提升機
### Q：隨機森林與梯度提升機的特徵重要性結果不相同？

> A： 決策樹計算特徵重要性的概念是，觀察某⼀特徵被
⽤來切分的次數⽽定。假設有兩個⼀模⼀樣的特徵，在
隨機森林中每棵樹皆為獨立，因此兩個特徵皆有可能被
使⽤，最終統計出來的次數會被均分。在梯度提升機
中，每棵樹皆有關連，因此模型僅會使⽤其中⼀個特
徵，另⼀個相同特徵的重要性則會消失
>
>[參考資料](https://www.quora.com/Is-multicollinearity-a-problem-with-gradient-boosted-trees)

### 延伸閱讀
完整調參數攻略-如何使⽤ Python 調整梯度提升機的超參數 (英⽂)
[complete-guide-parameter-tuning-gradient-boosting-gbm](https://www.analyticsvidhya.com/blog/2016/02/complete-guide-parameter-tuning-gradient-boosting-gbm-python/)

### 作業
目前已經學過許多的模型，相信大家對整體流程應該比較掌握了，這次作業請改用**手寫辨識資料集**，步驟流程都是一樣的，請試著自己撰寫程式碼來完成所有步驟

In [1]:
from sklearn import datasets, metrics
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.model_selection import train_test_split

digits = datasets.load_digits()
x_train, x_test, y_train, y_test = train_test_split(
    digits.data, digits.target, test_size=0.2, random_state=9487)

gb = GradientBoostingClassifier(
        loss="deviance", #Loss 的選擇，若改為 exponential 則會變成Adaboosting 演算法
                         #，概念相同但實作稍微不同
    
        learning_rate=0.1, #每棵樹對最終結果的影響，應與 n_estimators 成反比
        n_estimators=100 #決策樹的數量
    ).fit(x_train, y_train)
preds = gb.predict(x_test)
metrics.accuracy_score(y_test, preds)

0.9583333333333334

## 來看看究竟是哪些圖被誤判)

In [2]:
import matplotlib.pyplot as plt
error_set_index = preds != y_test
error_set = x_test[error_set_index]
miss = preds[error_set_index]
real = y_test[error_set_index]

plt.figure(figsize=(10,10))
for i, (e, m, r) in enumerate(zip(error_set, miss, real)):
    if i+1 > 9:
        break
    plt.subplot(3, 3, i+1)
    plt.title(f'Real:{r}, Miss:{m}')
    plt.imshow(e.reshape(8,8), cmap='gray')