# Métricas

Como hemos explicado, durante el entrenamiento necesitamos una función para saber cómo de bien o mal lo está haciendo nuestra red y así poder entrenarla mediante el algoritmo del descenso del gradiente. Pero estas son funciones para nuestra red, que a nosotros nos puede llegar a costar entender, por lo tanto necesitamos métricas para nosotoros, para que podamos valorar cómo de bien lo está haciendo nuestro modelo

## Métricas para probemas de regresión

En caso de los problemas de regresión podemos usar el error cuadrático medio (MSE - Mean Square Error) o el error absoluto medio o L1 (MAE - Mean Absolute Error), que como ya las hemos visto en el tema de las funciones de pérdida no las vamos a volver a ver

## Métricas para problemas de clasificación

Para los problemas de clasificación hemos visto la entropía cruzada binaria (BCE - Binary Cross Entropy) como función de pérdida, que no nos aporta mucha información. Por lo que aquí si necesitamos funciones para medir lo bien o mal que lo está haciendo nuestro modelo

### Matriz de confusión

Supongamos que tenemos una clasificador que tiene que clasificar perros, gatos y pájaros y obtenemos la siguiente tabla de resultados

<table>
    <thead>
        <tr>
            <th></th>
            <th></th>
            <th colspan=3><center>Real</center></th>
        </tr>
        <tr>
            <th></th>
            <th></th>
            <th><center>Perro</center></th>
            <th><center>Gato</center></th>
            <th><center>Pájaro</center></th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <th rowspan=3>Predicho</th>
            <th>Perro</th>
            <td><center>112</center></td>
            <td><center>28</center></td>
            <td><center>19</center></td>
        </tr>
        <tr>
            <th>Gato</th>
            <td><center>21</center></td>
            <td><center>134</center></td>
            <td><center>7</center></td>
        </tr>
        <tr>
            <th>Pájaro</th>
            <td><center>14</center></td>
            <td><center>25</center></td>
            <td><center>103</center></td>
        </tr>
    </tbody>
</table>

A esta tabla se le llama matriz de confusión, y muestra los aciertos y los fallos de la red

Cuando tenemos la matriz de confución podemos obtener los verdaderos positivos, falsos positivos, falsos negativos y verdaderos negativos de cada clase. Ahora vemos qué es cada cosa:
 * TP (True Positive - Verdadero positivo): Es cuando la red acierta con la predicción. La red predice que un dato pertenece a una clase y de verdad ese dato pertenece a esa clase
 * FP (False Positive - Falso positivo): Es cuando la red predice que un dato pertenece a una clase, pero no pertenece a esa clase
 * FN (False Negative - Falso negativo): Es cuando la red predice que un dato no pertenece a una clase, pero sí pertenece a esa clase
 * TN (True Negative - Verdadero negativo): Es cuando la red predice que un dato no pertenece a una clase y de verdad no pertenece a esa clase

Vamos a verlo con la anterior tabla
 * Clase perro:
   + TP = 112
   + FP = 28 + 19 = 47
   + FN = 21 + 14 = 35
   + TN = 134 + 7 + 25 + 103 = 269
 * Clase Gato:
   + TP = 134
   + FP = 21 + 7 = 28
   + FN = 28 + 25 = 53
   + TN = 112 + 19 + 17 + 103 = 251
 * Clase Pájaro:
   + TP = 103
   + FP = 14 + 25 = 39
   + FN = 19 + 7 = 26
   + TN = 112 + 28 + 21 + 134 = 295
  
Vamos a definir esto en variables para luego usarlo en métricas

In [4]:
TP_perro = 112
FP_perro = 47
FN_perro = 35
TN_perro = 269

TP_gato = 134
FP_gato = 28
FN_gato = 53
TN_gato = 251

TP_pajaro = 103
FP_pajaro = 39
FN_pajaro = 26
TN_pajaro = 295

total_perro = TP_perro + FP_perro + FN_perro + TN_perro
total_gato = TP_gato + FP_gato + FN_gato + TN_gato
total_pajaro = TP_pajaro + FP_pajaro + FN_pajaro + TN_pajaro

total = total_perro + total_gato + total_pajaro

### Accuracy

Es la relación entre el número de predicciones correctas frente al total de predicciones

In [6]:
accuracy = (TP_perro + TP_gato + TP_pajaro) / total
accuracy

0.2507183908045977

### Precision

Cuando el número de muestras no es similar entre clases, se dice que el problema está desbalancecado. Supongamos un problema en el que hay 1000000 muestras de perro, 10 de gato y 10 de pájaro, si usamos una red que le entre lo que le entre siempre diga que es perro va a tener una accuracy de 

$$\frac{1000}{1000+10+10}=0.98$$

Tenemos un accuracy del 98% pero sabemos que la red no está intentando clasificar las muestras. Así que en estos casos se suele usar la precisión que se mide mediante

$$Precision = \frac{TP}{TP+FP}$$

En el ejemplo anterior sería

In [12]:
precision_general = (TP_perro+TP_gato+TP_pajaro) / (TP_perro+TP_gato+TP_pajaro + FP_perro+FP_gato+FP_pajaro)

precision_perro = TP_perro / (TP_perro + FP_perro)
precision_gato = TP_gato / (TP_gato + FP_gato)
precision_pajaro = TP_pajaro / (TP_pajaro + FP_pajaro)

precision_general, precision_perro, precision_gato, precision_pajaro

(0.7537796976241901,
 0.7044025157232704,
 0.8271604938271605,
 0.7253521126760564)

### Recall

Se define como la fracción de muestras de una clase que el modelo predice correctamente. Se calcula mediante

$$Recall = \frac{TP}{TP+FN}$$

In [13]:
recall_perro = TP_perro / (TP_perro + FN_perro)
recall_gato = TP_gato / (TP_gato + FN_gato)
recall_pajaro = TP_pajaro / (TP_pajaro + FN_pajaro)

recall_perro, recall_gato, recall_pajaro

(0.7619047619047619, 0.7165775401069518, 0.7984496124031008)

### F1 Score

Según la aplicación, es posible que desee dar mayor prioridad a la Precision o la Recall. Pero hay muchas aplicaciones en las que tanto la Precision como la Recall son importantes. Por lo tanto, es natural pensar en una forma de combinar estos dos en una sola métrica

$$F1 score = 2\frac{Precision·Recall}{Precision+Recall}$$

In [14]:
f1_perro = 2 * (precision_perro * recall_perro) / (precision_perro + recall_perro)
f1_gato = 2 * (precision_gato * recall_gato) / (precision_gato + recall_gato)
f1_pajaro = 2 * (precision_pajaro * recall_pajaro) / (precision_pajaro + recall_pajaro)

f1_perro, f1_gato, f1_pajaro

(0.7320261437908496, 0.7679083094555874, 0.7601476014760148)

### Especifidad

$$Especifidad = \frac{TN}{TN+FP}$$

In [15]:
especifidad_perro = TN_perro / (TN_perro + FP_perro)
especifidad_gato = TN_gato / (TN_gato + FP_gato)
especifidad_pajaro = TN_pajaro / (TN_pajaro + FP_pajaro)

especifidad_perro, especifidad_gato, especifidad_pajaro

(0.8512658227848101, 0.899641577060932, 0.8832335329341318)

### Area bajo la curva ROC (AUC - Area Under Curve ROC)

La curva ROC se usa solo con clasificadores binarios. Muestra la tasa de TP contra la tasa de FP para varios valores umbral.

Cuando una red de clasificación predice una clase, lo que hace es darte un valor entre 0 y 1. Si da 0 es que pertenece a una clase y si da 1 es que pertenece a otra clase, pero para valores intermedios depende de un valor umbral que establecemos, y que normalmente es 0,5. Pero este valor umbral se puede modificar.

Por ejemplo una red que prediga si una imagen corresponde a un perro (1) o no (0) puede dar las siguientes salidas [0,4; 0,6; 0,7; 0,3] para distintos valores de umbral estas serían sus salidas
 * Umbral de 0,5: [0; 1; 1; 0]
 * Umbral de 0,2: [1; 1; 1; 1]
 * Umbral de 0,8: [0; 0; 0; 0]

Al cambiar el valor umbral cambia la clase predicha. Por lo tanto, se puede entender, que cambiando el valor umbrarl cambiará el número de TP y el de FP, por lo que también cambia el ratio de TPs y FPs.

La curva ROC representa los ratios entre TPs y FPs

![curva ROC](Imagenes/ROC_courve.png)

Lo ideal sería una curva lo más pegada a la izquierda en el eje del ratio de los FPs y lo más arriba posible en el eje de los TPs, ya que si la curva está encima de los ejes, quiere decir que para todos los umbrales el ratio de FPs es siempre 0, es decir, nunca hay falsos positivos, y que para todos los umbrales el ratio de TPs es siempre 1, es decir, siempre acierta la red para todos los humbrales

Como métrica por tanto se usa el área bajo la curva ROC, de manera que mejor será el sistema cuanto más cercano a 1 sea este área

![área bajo la curva ROC](Imagenes/Area_ROC_curve.png)