# Davies-Bouldin Index Method

## 1. Giriş

#### Öncelikle şuraya değinmek istiyorum;

*Gözetimli öğrenmenin aksine, gözetimsiz öğrenme sadece bağımsız değişkenlere sahiptir yani bağımlı değişken yoktur. Kısaca, veri etiketsizdir. Bu yüzden gözetimsiz öğrenme problemlerinde hedef değişken olmadığı için modelimizin doğruluğunu test etmemiz ve nerede durmamız gerektiğini belirlememiz de zor. Yine de bu modelleri basitçe test edebiliriz. Kümeleme yaparken hedeflediğimiz ve ya makul olan sonuçları seçebiliriz.*

**“Davies Bouldin Score” ise kümeler arası ortalama benzerliği ölçmek için kullanılır. Bu oran için düşük değerler tercih edilir ve minimum skor değeri 0’dır. Daha düşük değerler daha iyi kümelemeyi gösterir.**

Davies-Bouldin İndeksi (DBİ), kümeleme algoritmalarının başarısını ölçmek amacıyla kullanılan bir metriktir. Bu yöntem, kümelerin içsel kompaktlığı ve kümeler arasındaki ayrım derecesini değerlendirerek, elde edilen kümelenme sonuçlarının ne kadar iyi olduğunu nicelendirir.

## 2. Matematiksel Tanım

Bir veri kümesi $K$ kümeye ayrıldığında, DBİ aşağıdaki formülle hesaplanır:

$$
\mathrm{DBİ} = \frac{1}{K} \sum_{i=1}^{K} \max_{j \neq i} \left( \frac{S_{i} + S_{j}}{M_{ij}} \right)
$$

* $S_{i}$: $i$-inci kümedeki örneklerin kendi küme merkezine olan ortalama uzaklığı.
* $M_{ij}$: $i$ ve $j$ kümelerinin merkezleri arasındaki uzaklık.

Daha düşük bir DBİ değeri, kümelerin birbirinden iyi ayrıldığını ve her bir kümenin kendi içinde kompakt olduğunu gösterir.

## 3. Uygulama Adımları

1. **Veri Hazırlığı:** Kullanılacak veri setini yükleyin ve gerekli ön işlemleri (ölçekleme, eksik değer kontrolü vb.) gerçekleştirin.
2. **Kümeleme:** KMeans veya tercih ettiğiniz başka bir kümeleme algoritması ile veriyi $K$ kümeye ayırın.
3. **DBİ Hesaplama:** Kümeleme sonuç etiketleri üzerinden `davies_bouldin_score` veya manuel hesaplama ile DBİ değerini bulun.
4. **Değerlendirme:** Farklı $K$ değerleri için DBİ’yi karşılaştırarak en uygun küme sayısını belirleyin.

## 4. Notebook’a Dönüştürme

* Yeni bir Jupyter Notebook (ör. `davies_bouldin_example.ipynb`) oluşturun.
* Yukarıda belirtilen adımları kod hücrelerine dönüştürün:

  * Gerekli kütüphanelerin yüklenmesi
  * Veri setinin okunması ve ön işlemler
  * Kümeleme algoritması uygulanması
  * DBİ hesaplama ve sonuçların raporlanması
* Her adımı ayrı bir hücrede çalıştırarak sonuçlarınızı görsel ve sayısal olarak inceleyin.

> **Not:** Kod bloklarını kendi tercihinize göre düzenleyip ekleyebilirsiniz. Bu rehber yalnızca sözel açıklamaları içerir.


In [3]:
from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
from sklearn.metrics import davies_bouldin_score

# 1. Veri Hazırlığı
iris = load_iris()
X = iris.data

# 2. KMeans Kümeleme
kmeans = KMeans(n_clusters=3, random_state=42)
labels = kmeans.fit_predict(X)

# 3. Davies-Bouldin İndeksi Hesaplama
dbi = davies_bouldin_score(X, labels)
print(f"Davies-Bouldin İndeksi: {dbi:.3f}")

Davies-Bouldin İndeksi: 0.666
