# 4-Gürültülü Uygulamaların Yoğunluğa Dayalı Konumsal Kümelenmesi (DBSCAN):

##### DBSCAN, ortalama kaymaya ekseninde, benzer ve yoğunluklu bölgeleri kümeleyen bir algoritmadır, ancak birkaç önemli avantajı vardır. Minimum bölge sayısında ve uzaklıkta maksimum yoğunluk bölgesi oluşturulması hedeflenir. 

![Ekran görüntüsü 2024-05-17 071118](https://github.com/ahmettsimsek/Makine-Ogrenmesi-Temelleri/assets/124433579/84c1fa47-778d-4326-9b84-cb11b8545a25)


##### Algoritma, 2 parametre kullanır:

minPts: Bir bölgenin yoğun olarak kabul edilebilmesi için birlikte kümelenen minimum nokta sayısı (bir eşik).
eps (ε): Herhangi bir noktanın komşuluğundaki noktaları bulmak için kullanılacak bir mesafenin ölçüsü.

 DBSCAN, keyfi bir başlangıç veri noktasıyla başlar. Bu noktanın komşuluğu bir epsilon ε uzaklığı kullanılarak çıkarılır (ε mesafesi içindeki tüm noktalar komşuluk noktalarıdır).

 Bu mahalle içinde yeterli sayıda nokta (minPoints'e göre) varsa, kümeleme işlemi başlar ve mevcut veri noktası yeni kümedeki ilk nokta olur.

 Yeni kümedeki bu ilk nokta için, ε mesafesi komşuluğundaki noktalar da aynı kümenin parçası olur. ε mahallesindeki tüm noktaları aynı kümeye ait yapma prosedürü, küme grubuna yeni eklenen tüm yeni noktalar için tekrarlanır. 

 2. ve 3. adımlardan oluşan bu süreç, kümedeki tüm noktalar belirlenene kadar, yani kümenin ε mahallesindeki tüm noktalar ziyaret edilip etiketlenene kadar tekrar edilir. 

 Bunun sonunda tüm noktalar ziyaret edildiğinden, her nokta bir kümeye ait veya gürültü olarak işaretlenecektir. 

##### DBSCAN, diğer kümeleme algoritmalarına göre bazı büyük avantajlar sunar. İlk olarak, hiç bir küme gerektirmez. Ayrıca, veri noktası çok farklı olsa bile, aykırı değerleri basitçe bir kümeye atan ortalama kaymanın aksine, gürültü olarak tanımlar. Ek olarak, keyfi olarak boyutlandırılmış ve keyfi olarak şekillendirilmiş kümeleri oldukça iyi bulabilir. DBSCAN'ın ana dezavantajı, kümeler farklı yoğunlukta olduğunda diğerleri kadar iyi performans göstermemesidir

-----------

İlk olarak make_blobs fonksiyonunu kullanarak kendimize şöyle bir veri seti oluşturalım:

![Ekran görüntüsü 2024-05-17 071559](https://github.com/ahmettsimsek/Makine-Ogrenmesi-Temelleri/assets/124433579/2a31ef91-f6e9-4acd-9a53-95f4a4dd8372)


Ardından, bu kodla birlikte DBSCAN algoritmasını uygulayarak veri setlerini sınıflandırıp farklı kümeleri farklı renklere boyayalım.

In [None]:
import numpy as np
from sklearn.cluster import DBSCAN
from sklearn import metrics
from sklearn.datasets import make_blobs
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

centers = [[1, 1], [-1, -1], [1, -1]]
X, labels_true = make_blobs(
    n_samples=750, centers=centers, cluster_std=0.4, random_state=0
)
plt.scatter(X[:, 0], X[:, 1], s=50)
plt.show()
X = StandardScaler().fit_transform(X)
db = DBSCAN(eps=0.3, min_samples=10).fit(X)
core_samples_mask = np.zeros_like(db.labels_, dtype=bool)
core_samples_mask[db.core_sample_indices_] = True
labels = db.labels_
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0)
n_noise_ = list(labels).count(-1)
unique_labels = set(labels)
colors = [plt.cm.Spectral(each) for each in np.linspace(0, 1, len(unique_labels))]
for k, col in zip(unique_labels, colors):
    if k == -1:
        # Black used for noise.
        col = [0, 0, 0, 1]

    class_member_mask = labels == k

    xy = X[class_member_mask & core_samples_mask]
    plt.plot(
        xy[:, 0],
        xy[:, 1],
        "o",
        markerfacecolor=tuple(col),
        markeredgecolor="k",
        markersize=14,
    )

    xy = X[class_member_mask & ~core_samples_mask]
    plt.plot(
        xy[:, 0],
        xy[:, 1],
        "o",
        markerfacecolor=tuple(col),
        markeredgecolor="k",
        markersize=6,
    )
plt.show()

Veri setine DBSCAN algoritmasını uyguladıktan sonra grafiğin son hali şöyle:

![Ekran görüntüsü 2024-05-17 071659](https://github.com/ahmettsimsek/Makine-Ogrenmesi-Temelleri/assets/124433579/e3f4045b-5a51-4c05-a32c-9f92ac331ef2)


-------------------------------------

Gürültülü Uygulamaların Yoğunluğa Dayalı Konumsal Kümelenmesi (DBSCAN)  konusunda daha fazla detaya ulaşmak için, benim de örnek için Yararlandığım  sayfaya aşağıdaki linkten ulaşabilirsiniz:

https://medium.com/@mertcengiz2100/dbscan-nedir-f998af60ae70