# Implementace algoritmu DBSCAN

Cílem tohoto projektu je implementovat algoritmus DBSCAN (Density-Based Spatial Clustering of Applications with Noise) v jazyce Python a porovnat jeho výsledky s implementací z knihovny `scikit-learn`.

# Hlavní myšlenka algoritmu

DBSCAN (Density-Based Spatial Clustering of Applications with Noise) je populární shlukovací algoritmus, který je založen na hustotě dat. Oproti jiným metodám, jako je K-means, DBSCAN nevyžaduje předem stanovený počet shluků a dokáže identifikovat shluky libovolného tvaru. Algoritmus pracuje na principu vyhledávání oblastí s vysokou hustotou datových bodů a odlišuje je od oblastí s nižší hustotou, které jsou interpretovány jako šum.

Hlavní předností DBSCANu je jeho schopnost odhalit odlehlé body (outliery) a přiřadit je jako šum, zatímco tradiční shlukovací algoritmy by mohly tyto body zahrnout do shluků.

# Princip algoritmu

DBSCAN identifikuje shluky na základě hustoty datových bodů v okolí. Každý bod je klasifikován jako:
- Core point (jádrový bod): Bod, který má ve svém okolí (dané parametrickým poloměrem ε) alespoň minimální počet bodů (MinPts).
- Border point (okrajový bod): Bod, který leží v okolí jádrového bodu, ale sám nemá dostatek sousedů k tomu, aby byl jádrovým bodem.
- Noise point (bod šumu): Bod, který nepatří do žádného shluku.

Algoritmus začíná s náhodně vybraným bodem. Pokud tento bod splňuje podmínky jádrového bodu, vytvoří se nový shluk. DBSCAN poté iterativně rozšiřuje shluk o všechny body, které jsou v dosahu ε a splňují podmínky MinPts. Proces pokračuje, dokud nejsou zpracovány všechny body v datové sadě.

Důležitými parametry algoritmu jsou poloměr ε a minimální počet bodů MinPts. Tyto parametry ovlivňují, jak citlivý bude algoritmus na detekci shluků a jaká bude jeho schopnost filtrovat šum.

# Implementace algoritmu

## Načtení knihoven

In [None]:
from enum import Enum

## Reprezentace bodu

Pro zjednodušení implementace algoritmu vytvoříme třídu `Point`, která bude reprezentovat jednotlivé body v prostoru. Každý bod bude mít následující atributy:
- **x**: souřadnice x
- **y**: souřadnice y
- **type**: Typ bodu
    - **CORE**: jádrový bod - bod, který má ve svém okolí alespoň MinPts bodů.
    - **BORDER**: okrajový bod - bod, který leží v okolí jádrového bodu, ale sám nemá dostatek sousedů.
    - **NOISE**: bod šumu - bod, který nepatří do žádného shluku.

In [None]:
class PointType(Enum):
    CORE = 0
    BORDER = 1
    NOISE = 2


- **cluster**: císlo shluku, do kterého bod patří
- **neighbors**: seznam sousedů bodu


In [None]:
class Point:
    def __init__(self, x, y):
        self.x = x
        self.y = y
        self.type = None
        self.cluster = None
        self.neighbors = []

## Reprezentace DBSCAN algoritmu

Nyní vytvoříme třídu `DBSCAN`, která bude obsahovat implementaci algoritmu DBSCAN a všechna potřebná nastavení.

Třída `DBSCAN` bude mít následující atributy:
- **epsilon**: poloměr ε
- **min_pts**: minimální počet bodů MinPts
- **points**: seznam bodů v datové sadě

Metody třídy `DBSCAN`: ...


In [None]:
class DBSCAN:
    def __init__(self, epsilon, min_pts):
        self.epsilon = epsilon
        self.min_pts = min_pts
        self.points = []