In [1]:
# LightGBM

# XGBoost'un eğitim süresi performansını arttırmaya yönelik geliştirilen bir diğer GBM türüdür.
# Level-wise büyüme stratejisi yerine Leaf-wise büyüme strayejisi ile daha hızlıdır.

import warnings
import numpy as np
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier, VotingClassifier
from sklearn.model_selection import GridSearchCV, cross_validate, RandomizedSearchCV, validation_curve

#from xgboost import XGBClassifier
#from lightgbm import LGBMClassifier
#from catboost import CatBoostClassifier

pd.set_option("display.max_columns",None)
warnings.simplefilter(action="ignore", category=Warning)

df = pd.read_csv("diabetes.csv")
y = df["Outcome"]
X = df.drop(["Outcome"], axis=1)

In [None]:
lgbm_model = LGBMClassifier(random_state=17)
lgbm_model.get_params()

# Cross Validation Yöntemi ile Başarı Değerlendirme
cv_result = cross_validate(lgbm_model, X, y, cv=5, scoring=["accuracy","f1","roc_auc"])

cv_result["test_accuracy"].mean()
#0.74
cv_result["test_f1"].mean()
#0.62
cv_result["test_roc_auc"].mean()
#0.79

In [None]:
# Hiperparametre Optimizasyonu

# Kullanılacak parametre kombinasyonlarını belirlemek için kullanılır.
lgbm_params = {"learning_rate":[0.01, 0.1],
             "n_estimators": [100, 300, 500, 1000],
             "colsample_bytree":[0.5, 0.7, 1]}

# Bu parametre kombinasyonları genellikle GridSearchCV gibi hiperparametre optimizasyon teknikleri kullanılarak
# en iyi performansı sağlayacak şekilde seçilir.

lgbm_best_grid = GridSearchCV(lgbm_model, lgbm_params, cv=5, n_jobs=-1, verbose=True).fit(X,y)

# En iyi değişkenler
lgbm_best_grid.best_params_

In [None]:
# Final model
lgbm_final = lgbm_model.set_params(**lgbm_best_grid.best_params_, random_state=17).fit(X,y)