## Rozdział 3: Miary Wydajności Modelu

### 3.1 Wprowadzenie

Ocena wydajności modelu uczenia maszynowego jest kluczowa dla zrozumienia, jak dobrze model radzi sobie z zadaniem, do którego został stworzony. W zależności od rodzaju problemu (klasyfikacja, regresja, klasteryzacja), stosuje się różne miary wydajności. W tym rozdziale omówimy najważniejsze miary wydajności stosowane w modelach klasyfikacyjnych i regresyjnych.

### 3.2 Miary Wydajności dla Klasyfikacji

#### 3.2.1 Macierz Błędów

Macierz błędów (confusion matrix) jest podstawowym narzędziem do oceny wydajności modelu klasyfikacyjnego. Składa się z czterech elementów:

- **TP (True Positives)**: Liczba poprawnie sklasyfikowanych próbek pozytywnych.
- **TN (True Negatives)**: Liczba poprawnie sklasyfikowanych próbek negatywnych.
- **FP (False Positives)**: Liczba niepoprawnie sklasyfikowanych próbek negatywnych jako pozytywne.
- **FN (False Negatives)**: Liczba niepoprawnie sklasyfikowanych próbek pozytywnych jako negatywne.

#### 3.2.2 Dokładność (Accuracy)

Dokładność to stosunek liczby poprawnych przewidywań (TP + TN) do całkowitej liczby próbek.

$$
\text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}
$$

#### 3.2.3 Precyzja (Precision)

Precyzja to stosunek liczby poprawnie przewidywanych pozytywnych próbek (TP) do wszystkich próbek przewidywanych jako pozytywne (TP + FP).

$$
\text{Precision} = \frac{TP}{TP + FP}
$$

#### 3.2.4 Czułość (Recall)

Czułość, znana również jako True Positive Rate (TPR) lub Sensitivity, to stosunek liczby poprawnie przewidywanych pozytywnych próbek (TP) do wszystkich rzeczywistych pozytywnych próbek (TP + FN).

$$
\text{Recall} = \frac{TP}{TP + FN}
$$

#### 3.2.5 F1-Score

F1-Score jest średnią harmoniczną precyzji i czułości, zapewniającą równowagę między nimi.

$$
\text{F1-Score} = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}
$$

#### 3.2.6 Krzywa ROC i AUC

Krzywa ROC (Receiver Operating Characteristic) ilustruje związek między True Positive Rate (TPR) a False Positive Rate (FPR) przy różnych progach decyzyjnych. AUC (Area Under the Curve) jest miarą wydajności modelu, gdzie wartość 1 oznacza idealny model, a 0.5 oznacza model losowy.

### 3.3 Miary Wydajności dla Regresji

#### 3.3.1 Średni Błąd Bezwarunkowy (Mean Absolute Error, MAE)

MAE to średnia wartość bezwzględnych różnic między rzeczywistymi a przewidywanymi wartościami.

$$
\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} | y_i - \hat{y_i} |
$$

#### 3.3.2 Średni Błąd Kwadratowy (Mean Squared Error, MSE)

MSE to średnia wartość kwadratów różnic między rzeczywistymi a przewidywanymi wartościami. Jest bardziej wrażliwa na duże błędy niż MAE.

$$
\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y_i})^2 
$$

#### 3.3.3 Pierwiastek Średniego Błędu Kwadratowego (Root Mean Squared Error, RMSE)

RMSE to pierwiastek kwadratowy z MSE, dający miarę błędu w tych samych jednostkach, co dane.

$$
\text{RMSE} = \sqrt{\text{MSE}}
$$

#### 3.3.4 Współczynnik Determinacji (R²)

R² mierzy, jaka część wariancji w danych jest wyjaśniana przez model. Wartość R² bliska 1 oznacza, że model dobrze wyjaśnia dane, natomiast wartość bliska 0 oznacza, że model nie wyjaśnia danych.

$$
R^2 = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y_i})^2}{\sum_{i=1}^{n} (y_i - \overline{y})^2} 
$$

### 3.4 Porównanie Modeli

Aby wybrać najlepszy model, często porównuje się ich wydajność za pomocą wspomnianych miar. Należy pamiętać, że różne miary mogą prowadzić do różnych wniosków w zależności od specyfiki problemu i danych.

### 3.5 Wybór Miary Wydajności

Wybór odpowiedniej miary wydajności zależy od specyficznych wymagań projektu:

- W przypadku klasyfikacji z niezbalansowanymi danymi precyzja, czułość i F1-Score mogą być bardziej informatywne niż dokładność.
- W przypadku regresji MAE może być bardziej odpowiednia, gdy istotne są jednostkowe różnice, natomiast RMSE może być lepsza, gdy duże błędy są szczególnie istotne.

### 3.6 Zakończenie

Miary wydajności są nieodzownym elementem każdego projektu uczenia maszynowego. Pozwalają one na obiektywną ocenę modelu i jego porównanie z innymi podejściami. Zrozumienie i właściwe stosowanie tych miar jest kluczowe dla tworzenia skutecznych i niezawodnych modeli uczenia maszynowego.