# Research metod testowych dla drzew decyzyjnych i regresji

## 1.1 Metryki dla klasyfikacji (drzewa decyzyjne)

1. **Accuracy (dokładność)**  
   Procent poprawnie sklasyfikowanych próbek.  

    $\text{Accuracy} = \frac{\text{Liczba poprawnych predykcji}}{\text{Wszystkie próbki}}$


2. **Precision (precyzja)**  
   Liczba prawidłowych pozytywnych wyników podzielona przez wszystkie wyniki sklasyfikowane jako pozytywne. Jest to część prawidłowych pozytywnych przewidywań wśród wszystkich przewidywań pozytywnych.

    $\text{Precision} = \frac{TP}{TP + FP}$


3. **Recall (czułość, pokrycie)**  
   Liczba prawidłowych pozytywnych wyników podzielona przez wszystkie rzeczywiste pozytywne przypadki. Odsetek prawdziwych pozytywnych przypadków, które model poprawnie rozpoznał jako pozytywne.

    $\text{Recall} = \frac{TP}{TP + FN}$


4. **F1-Score**  
   Harmoniczna średnia precyzji i czułości. **F1** służy do zbalansowanej oceny modeli w sytuacjach, gdy ważne jest jednoczesne utrzymanie wysokiej precyzji i czułości.

    $F1 = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}$


5. **ROC-AUC (Area Under Curve)**  
   Pole pod krzywą ROC (Receiver Operating Characteristic), mierzy zdolność modelu do rozróżniania klas.


6. **Log Loss (logarytmiczne straty)**  
   Miara penalizująca modele za przewidywania z niską pewnością (im wyższa niepewność lub nietrafność, tym wyższa kara).

---

### 1.2 Metryki dla regresji

1. **Mean Absolute Error (MAE)**  
   Średnia wartość bezwzględnych różnic między przewidywanymi a rzeczywistymi wartościami. Wskazuje, o ile (średnio) „pudłujemy” w jednostkach wyjściowych (np. zł, USD, km/h). Na przykład: MAE = 1000 zł oznacza, że model pomyli się średnio o 1000 zł względem faktycznej ceny czy wartości.

    $MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|$


2. **Mean Squared Error (MSE)**  
   Średnia kwadratów różnic między przewidywanymi a rzeczywistymi wartościami. MSE zwiększa „karę” za duże błędy, ponieważ każda różnica jest podnoszona do kwadratu, co pomaga wychwycić sytuacje, w których model znacząco się myli.

    $MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2$


3. **Root Mean Squared Error (RMSE)**  
   Pierwiastek kwadratowy z MSE. Wynik jest w tych samych jednostkach co dane wyjściowe (np. dolary, złote czy kilogramy), co często ułatwia interpretację oraz wskazuje, o ile (średnio) model „pudłuje” w przewidywaniach.  

    $RMSE = \sqrt{MSE}$


4. **R-squared (R²)**  
   Informuje o tym, jaka część zmienności (wariancji) zmiennej objaśnianej w próbie pokrywa się z korelacjami ze zmiennymi zawartymi w modelu. Jest on więc miarą stopnia, w jakim model pasuje do próby. Dopasowanie modelu jest tym lepsze, im wartość R² jest bliższa jedności.

    $R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}$


5. **Mean Absolute Percentage Error (MAPE)**  
   Średnia wartość procentowych różnic między przewidywaniami a wartościami rzeczywistymi.Relatywna (względna) wielkość błędu.

    $MAPE = \frac{100\%}{n} \sum_{i=1}^{n} \left|\frac{y_i - \hat{y}_i}{y_i}\right|$

---

## 2. **Jak będzie wyglądał proces testowy?**

1. **Podział danych**  
Podzielimy dane na zbiór treningowy (70-80%) i testowy (20-30%). Dodatkowo można wykorzystać walidację krzyżową (k-fold cross-validation), żeby uzyskać bardziej wiarygodny wynik.

2. **Trening modelu**  
Wytrenujemy drzewo decyzyjne na danych treningowych.  W przypadku regresji, wytrenujemy odpowiedni model (np. regresję liniową, drzewo regresyjne, itp.).

3. **Predykcja**  
Użyjemy danych testowych, by wygenerować przewidywane wartości (regresja) lub klasy (klasyfikacja).

4. **Ocena modelu** 

4.1 **Metryki dla klasyfikacji**
- Obliczamy **Accuracy**, **Precision**, **Recall** i **F1-Score** dla wyników modelu klasyfikacyjnego.  
- Dla wyników modelu regresyjnego mapujemy przewidywane wartości na przedziały za pomocy funkcji values_to_class_labels. Następnie obliczamy te same metryki klasyfikacyjne (na podstawie przypisanych klas).  
- Porównujemy metryki klasyfikacyjne dla obu modeli, aby ocenić ich zdolność do klasyfikowania danych.

Wykres porównania metryk klasyfikacyjnych
- **Cel:** Porównanie Accuracy, Precision, Recall i F1-Score dla modeli klasyfikacyjnego i regresyjnego.
- **Oś X:** Nazwy metryk (Accuracy, Precision, Recall, F1-Score).  
- **Oś Y:** Wartości metryk (w skali od 0 do 1).  
- Dwa zestawy słupków reprezentujące wyniki dla modelu klasyfikacyjnego i regresyjnego. Słupki powinny być wyraźnie opisane i oznaczone legendą.

4.2 **Metryki dla regresji**
- Obliczamy **MSE**, **RMSE**, **MAE**, **MAPE** i **R²** dla wyników modelu regresyjnego.  
- Dla wyników modelu klasyfikacyjnego mapujemy przedziały na pojedyncze wartości (środek przedziału) za pomocy funkcji intervals_to_midpoints. Następnie obliczamy te same metryki regresji.  
- Porównujemy metryki regresyjne dla obu modeli, aby ocenić, który model generuje mniejsze błędy.  
- Szczególną uwagę zwracamy na **MAE** i **MAPE**, ponieważ są one najbardziej intuicyjne i praktyczne w interpretacji (np. średni błąd w złotówkach lub procentach).  

Dodatkowa analiza:
- Oceniamy, czy wielkość błędu (np. **RMSE = 5000 zł**) jest akceptowalna w danym kontekście.  
- Analizujemy, czy różnice między wynikami modeli są **praktycznie istotne**, czy tylko statystyczne.  
- Sprawdzamy rozkład błędów (reszt) w funkcji wartości rzeczywistych:  
  - Czy błędy są losowe, czy mają wzorce (np. większe odchylenia dla wyższych wartości)?  
  - W przypadku wzorców rozważamy korektę modelu lub modyfikację cech.


**Wykres rzeczywiste vs. przewidywane (Actual vs. Predicted)**

   - **Oś X:** wartości przewidywane przez model.  
   - **Oś Y:** rzeczywiste wartości.  
   - Jeśli model jest idealny, punkty powinny leżeć wzdłuż przekątnej (linii $ y = x $).

**Wykres reszt (Residual Plot)**
   - **Oś X:** Przewidywane wartości.  
   - **Oś Y:** Reszty $(y_{\text{rzeczywiste}} - y_{\text{przewidywane}})$.
   - **Cel:** Reszty powinny rozkładać się losowo wokół zera, bez widocznych wzorców.  
   - **Dodatkowa korzyść:** Ułatwia identyfikację problemów, takich jak niedoszacowanie lub przeszacowanie w określonych zakresach wartości.

---