# Gradient Boosting Machines (GBM)


### Gradient Boosting Machines (GBM), regresyon ve sınıflandırma problemlerinde kullanılan bir makine öğrenme algoritmasıdır. GBM, zayıf tahmincilerin (genellikle karar ağaçları) birleşimini kullanarak güçlü bir tahminci oluşturur. Her bir tahminci, önceki tahmincilerin hatalarını düzeltmek için eğitilir. Bu şekilde, GBM, hataları düzeltmek ve nihai tahmini iyileştirmek için adım adım öğrenme yeteneğine sahiptir.

## GBM, aşağıdaki temel bileşenlerden oluşur:

### Zayıf Tahminciler: GBM, genellikle karar ağaçları gibi zayıf tahminciler kullanır. Karar ağaçları, veri kümesindeki desenleri öğrenerek ve kararlar vererek tahmin yaparlar. GBM, genellikle birçok küçük ve basit karar ağacını birleştirir, böylece daha karmaşık ilişkileri ve etkileşimleri modelleyebilir.

### Gradient Descent (Gradyan İnişi): GBM, her bir tahminciyi, önceki tahmincilerin hatalarını en aza indirecek şekilde eğitmek için gradyan iniş kullanır. Gradyan inişi, bir fonksiyonun en küçük değerine ulaşmak için adım adım kademeli bir yaklaşımı temsil eder. GBM'de, gradyan inişi kullanılarak her bir tahmincinin hataları hesaplanır ve sonraki tahmincinin bu hataları düzeltmek için eğitilir.

### Öğrenme Oranı (Learning Rate): GBM'de, her bir tahmincinin sonucunu nihai tahmine katarken bir öğrenme oranı belirtilir. Öğrenme oranı, her bir tahmincinin katkısını kontrol eder. Düşük bir öğrenme oranı, modelin daha yavaş öğrenmesini sağlar, ancak daha fazla kararlılık ve genelleme yeteneği sağlar. Yüksek bir öğrenme oranı ise modelin daha hızlı öğrenmesini sağlar, ancak aşırı uyum (overfitting) riskini artırır.


## GBM'nin bazı avantajları şunlardır:

### Yüksek Tahmin Gücü: GBM, karmaşık ilişkileri ve etkileşimleri modelleyebilen güçlü tahminciler oluşturabilir. Bu nedenle, yüksek tahmin gücüne sahiptir ve genellikle makine öğrenme yarışmalarında ve gerçek dünya problemlerinde başarılı sonuçlar verir.

### Esneklik: GBM, farklı kayıp fonksiyonları ve ölçütler kullanarak çeşitli problemlerde uygulanabilir. Regresyon problemlerinde kullanılan GBM'ler, sürekli bir hedef değişkenini tahminlemek için idealdir.

### Ölçeklenebilirlik: GBM, büyük veri setleri üzerinde de etkili bir şekilde çalışabilir. Paralel işleme ve ölçeklenebilirliğe olanak tanıyan özellikler içerir.


## Ancak, GBM'nin bazı dezavantajları da vardır:

### Hiperparametre Ayarı: GBM'nin başarısı, birçok hiperparametrenin doğru şekilde ayarlanmasına bağlıdır. Bu, deneme yanılma yöntemiyle hiperparametre ayarının zaman alıcı olabileceği anlamına gelir.

### Aşırı Uyum Riski: Yüksek öğrenme oranları veya çok fazla tahminci kullanılması durumunda GBM, eğitim verilerine aşırı uyum sağlayabilir. Bu durumda, model eğitim verilerinde iyi performans gösterirken, yeni verilerde kötü sonuç verebilir.

### Hesaplama Süresi: GBM, eğitim süresi ve tahmin yapma süresi açısından zaman alıcı olabilir. Özellikle, çok sayıda tahminci kullanıldığında ve büyük veri kümeleri üzerinde çalışıldığında hesaplama süresi artabilir.


### GBM, regresyon problemlerinde genellikle yüksek tahmin gücü ve eseneklik sağlayan etkili bir makine öğrenme algoritmasıdır. Profesyonel bir veri bilimi mühendisi, GBM'nin temel prensiplerini, hiperparametrelerini ve uygulama alanlarını anlamalıdır. Ayrıca, aşırı uyum riski ve hesaplama süresi gibi GBM'nin dezavantajlarını da dikkate almalır.

In [1]:
from sklearn.ensemble import GradientBoostingRegressor

In [2]:
model = GradientBoostingRegressor()
model.get_params()

{'alpha': 0.9,
 'ccp_alpha': 0.0,
 'criterion': 'friedman_mse',
 'init': None,
 'learning_rate': 0.1,
 'loss': 'squared_error',
 'max_depth': 3,
 'max_features': None,
 'max_leaf_nodes': None,
 'min_impurity_decrease': 0.0,
 'min_samples_leaf': 1,
 'min_samples_split': 2,
 'min_weight_fraction_leaf': 0.0,
 'n_estimators': 100,
 'n_iter_no_change': None,
 'random_state': None,
 'subsample': 1.0,
 'tol': 0.0001,
 'validation_fraction': 0.1,
 'verbose': 0,
 'warm_start': False}

### learning_rate: 
#### Öğrenme oranıdır. Her bir tahmincinin katkısını kontrol eder.
#### Değer aralığı: [0, 1]
#### Varsayılan Değer: 0.1

### n_estimators:
#### Oluşturulacak olan tahminci sayısıdır (karar ağacı sayısı).
#### Değer aralığı: Pozitif tamsayı
#### Varsayılan değer: 100

### max_depth:
#### Karar ağacının maksimum derinliğini sınırlar. Karar ağacının daha derin olması, modelin daha karmaşık ilişkileri öğrenmesine olanak sağlar, ancak aşırı uyum (overfitting) riskini artırır.
#### Değer aralığı: Pozitif tamsayı veya None (sınırsız derinlik için)
#### Varsayılan Değer: 3

### min_samples_split:
#### Bir iç düğümün bölünmesi için gereken minimum örnek sayısını belirler.
#### Bu parametre, ağacın dallanmasının kontrol edilmesine yardımcı olur.
#### Değer aralığı: Pozitif tamsayı veya float (örnek yüzdesi olarak ifade edilebilir).
#### Varsayılan değer: 2


### min_samples_leaf:
#### Bir yaprak düğümünün minimum örnek sayısını belirler. Bu parametre, ağacın büyüklüğünü kontrol eder ve aşırı uyumu engellemeye yardımcı olur.
#### Değer aralığı: Pozitif tamsayı veya float (örnek yüzdesi olarak ifade edilebilir).
#### Varsayılan değer: 1


### subsample:
#### Her bir tahmincinin eğitim verilerinin alt kümesini kullanarak eğitilmesine olanak tanır. Daha küçük bir subsample değeri, modelin daha fazla düzensizlik ve varyansı yakalamasına yardımcı olabilir.
#### Değer aralığı: [0, 1]
#### Varsayılan değer: 1.0


### loss:
#### Kayıp fonksiyonunu belirler. Regresyon için varsayılan olarak 'ls' (Least Squares) kullanılır.
#### Diğer seçenekler: 'lad' (Least Absolute Devation), 'huber' (Huber Loss), 'quantile' (Quantile Loss).
#### Varsayılan değer: 'ls'


### criterion:
#### Karar ağacının bölünme noktalarını seçmek için kullanılan kriteri belirler.
#### Değer aralığı: 'friedman_mse' (Friedman MSE), 'mse' (Mean Squared Error), 'mae' (Mean Absolute Error).
#### Varsayılan değer: 'friedman_mse'


### Bu hiperparametreler, GradientBoostingRegressor modelinin davranışını ve performansını etkiler. İyi bir model için bu parametreleri doğru şekilde ayarlamak önemlidir. Ayarlamalar, deneyler ve validasyon süreçleriyle belirlenebilir.