# Evaluación de algoritmos de clasificación multiclase
En el siguiente notebook vamos a desarrollar un ejemplo de cómo aplicar la matriz de confusión y las métricas derivadas a un problema de clasificación multiclase.

En los problemas de clasificación binaria habitualmente se centran en una clase positiva que queremos detectar (e.g: detección de spam). Por el contrario, en un problema típico de clasificación de multiclase, necesitamos categorizar cada muestra en 1 de N clases diferentes. 
Supongamos que tenemos una colección de fotos. Cada foto muestra un animal: un gato, un pez o una gallina. Nuestro clasificador necesita predecir qué animal se muestra en cada foto. Este es un problema de clasificación con N = 3 clases.

Veamos una matriz de confusión de muestra que se produce después de clasificar 25 fotos:

![multiclase1.png](attachment:multiclase1.png)

De manera similar a la clasificación binaria, podemos definir precisión y recall para cada una de las clases. 

Por ejemplo, la precisión para la clase Gato es el número de fotos Gato predichas correctamente (4) de todas las fotos Gato predichas (4+6+3), lo que equivale a 4/13 = 30.7 %. ¡Así que solo 1/3 de las fotos que nuestro predictor clasifica como gatos son en realidad gatos!

In [1]:
# para Gato
tp = 4
fp = 6 +3
precision = tp / (tp + fp)

In [2]:
precision

0.3076923076923077

Por otro lado, el recall de Gato es el número de fotos de Gato predichas correctamente (4) de la cantidad de fotos de Gato reales (4 + 1 + 1 = 6), que es 4/6 = 66,7%. Esto significa que nuestro clasificador clasificó 2/3 de las fotos de gatos como Gato.

In [3]:
# para gato
fn = 1 + 1
recall = tp / (tp + fn)

print("Recall: ", recall)

Recall:  0.6666666666666666


In [4]:
# para gato

f1 = (2* precision * recall) / (recall + precision)

print("F measure; ",f1)

F measure;  0.42105263157894735


De igual manera podemos calcular los valores de precision y recall para el resto de clases

![multiclase2.png](attachment:multiclase2.png)


En Python encontramos en la libreria scikit funciones para obtener los resultados de un clasificador multiclase.
sklearn.metrics.classification_report. https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html

In [5]:
from sklearn import metrics

# Constants
C="Gato"
F="Pez"
H="Gallina"

# valores Reales 
y_true = [C,C,C,C,C,C, F,F,F,F,F,F,F,F,F,F, H,H,H,H,H,H,H,H,H]
# valores Predichos
y_pred = [C,C,C,C,H,F, C,C,C,C,C,C,H,H,F,F, C,C,C,H,H,H,H,H,H]

# Mostrar confusion matrix
print(metrics.confusion_matrix(y_true, y_pred))

# Mostrar precision and recall, junto con el resto de métricas
print(metrics.classification_report(y_true, y_pred, digits=3))

[[6 3 0]
 [1 4 1]
 [2 6 2]]
              precision    recall  f1-score   support

     Gallina      0.667     0.667     0.667         9
        Gato      0.308     0.667     0.421         6
         Pez      0.667     0.200     0.308        10

    accuracy                          0.480        25
   macro avg      0.547     0.511     0.465        25
weighted avg      0.581     0.480     0.464        25

