# Matrices de confusión y métodos de evaluación clásicos.

Siempre es importante observar la matriz de confusión.<br>
Aqui vemos lo que daría lugar a nuestra matriz:
<a href="https://imgur.com/RyXbseN"><img src="https://i.imgur.com/RyXbseN.png" title="source: imgur.com" /></a>

Siguiendo la matriz tenemos:<br>
\begin{equation*}
    Exactitud=\frac{TP+TN}{TP+TN+FP+FN}.
\end{equation*}<br>
\begin{equation*}
    Error\,De\,Clasificación=\frac{FP+FN}{TP+TN+FP+FN}.
\end{equation*}<br>
\begin{equation*}
    Recall/Ratio\,TP=\frac{TP}{TP+FN}.
\end{equation*}<br>
\begin{equation*}
    Precisión=\frac{TP}{TP+FP}.
\end{equation*}<br>
\begin{equation*}
    Ratio\,FP=\frac{FP}{TN+FP}.
\end{equation*}

Luego tenemos diversas maneras de trazar nuestra línea:<br>
<a href="https://imgur.com/9wCAUUp"><img src="https://i.imgur.com/9wCAUUp.png" title="source: imgur.com" /></a>
<a href="https://imgur.com/cGdTr6z"><img src="https://i.imgur.com/cGdTr6z.png" title="source: imgur.com" /></a>
<a href="https://imgur.com/eQLvgZ6"><img src="https://i.imgur.com/eQLvgZ6.png" title="source: imgur.com" /></a>

Luego esto da lugar a dos modelos:<br>
* Orientado a Recall.
* Orientado a Precisión.

Se denomina $\textbf{Puntuación F1}$ a la combinación de Precisión y Recall en un número:<br>
\begin{equation*}
    F_1=2\frac{Precisión·Recall}{Precisión+Recall}=\frac{2TP}{2TP+FN+FP}.
\end{equation*}<br>
Se denomina $\textbf{Puntuación F}$ a la generalización de F1:
\begin{equation*}
    F_\beta=(1+\beta^2)\frac{Precisión·Recall}{(\beta^2Precisión)+Recall}=\frac{(1+\beta^2)2TP}{(1+\beta^2)TP+\beta·FN+FP}.
\end{equation*}<br>
Dependiendo del valor de $\beta$:<br>
* Usuarios orientados a Precisión: $\beta$=0.5 (FP perjudica el rendimiento más que FN).
* Usuarios orientados a Recall: $\beta$=2 (FN perjudica el rendimiento más que FP).

In [3]:
%matplotlib notebook
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_digits
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

dataset=load_digits()
X,y=dataset.data,dataset.target
y[y!=1]=0

X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=0)

svm=SVC(kernel='linear',C=1).fit(X_train,y_train)
print('Puntuacion: ',svm.score(X_test,y_test))
confusion=confusion_matrix(y_test,svm.predict(X_test))
print('Usando SVC lineal: \n',confusion)

print('Exactitud: {:.2f}'.format(accuracy_score(y_test,svm.predict(X_test))))
print('Precision: {:.2f}'.format(precision_score(y_test,svm.predict(X_test))))
print('Recall: {:.2f}'.format(recall_score(y_test,svm.predict(X_test))))
print('F1 score: {:.2f}'.format(f1_score(y_test,svm.predict(X_test))))

Puntuacion:  0.9777777777777777
Usando SVC lineal: 
 [[402   5]
 [  5  38]]
Exactitud: 0.98
Precision: 0.88
Recall: 0.88
F1 score: 0.88


In [4]:
from sklearn.metrics import classification_report

print(classification_report(y_test,svm.predict(X_test),target_names=['not 1','1']))

              precision    recall  f1-score   support

       not 1       0.99      0.99      0.99       407
           1       0.88      0.88      0.88        43

   micro avg       0.98      0.98      0.98       450
   macro avg       0.94      0.94      0.94       450
weighted avg       0.98      0.98      0.98       450

