# XGBoost(eXtreme Gradient Boosting）
「決定木を多数組み合わせて、より強力なモデルを作る」手法  
「勾配ブースティング（Gradient Boosting）」を改良した 高速かつ高性能な決定木ベースの機械学習アルゴリズム
## XGBoost の基本概念
弱い決定木（Weak Learners）を少しずつ改良しながら、最終的に強いモデルを作る  
### 勾配ブースティングとは
誤差を少しずつ修正する決定木を連続的に作成する  
各決定木は、前のモデルの誤差を減らすように学習  
ランダムフォレストとは違い、決定木が逐次的（順番に）作成される
## XGBoost の仕組み
### 1.最初のモデルを作成
まず、単純な決定木（モデル1）を作成 し、各データの予測値を得る
### 2.誤差を計算
実際の値（y）と予測値（𝑦^）の差（残差）を計算
### 3.残差を学習する決定木を追加
次の決定木は、残差（誤差）を予測するように学習
### 4.予測値を更新
各決定木の予測を 足し合わせて予測値を更新
### 5.上記を繰り返し、精度を向上
決定木を順番に増やしながら、誤差を減らしていく
## 特徴
過学習を抑えるための正則化（L1, L2）  
決定木の計算を最適化  
欠損値に強い（自動的に処理）  
特徴量の重要度を可視化できる  

In [None]:
import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

#データの準備
iris = load_iris()
X, y = iris.data, iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

#XGBoost モデルの作成
model = xgb.XGBClassifier(n_estimators=100, learning_rate=0.1, max_depth=3)
model.fit(X_train, y_train)

#予測と評価
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"XGBoostの分類精度: {accuracy:.4f}")


XGBoostの分類精度: 1.0000
