# Métricas de clasificación

En este cuaderno deberás implementar varias métricas de clasificación y algunas utilidades para lidiar con la salidas de los modelos.

La mayoría de las soluciones puede implementarse en una o dos líneas, si utilizás las funciones de numpy. No obstante, es más importante que las implementaciones sean fáciles de leer y correctas a que sean eficientes.



## 1 - Conversión entre codificaciones de la salida

Implementá las funciones `onehot2label` y `label2onehot` que convierten una matriz de valores  de salida codificados como un matriz de vectores *onehot* a un vector de etiquetas y viceversa.

Recordá que un vector *onehot*  tiene el valor `0` en todos sus elementos, excepto por el elemento cuyo índice es el de la clase, que tiene valor `1`.

Por ejemplo `[0,0,0,0,1,0,0]` es un vector que indica la clase `4`. Además, como tiene longitud 7, sabemos que hay 7 clases, codificadas de 0 a 6. Por otro lado, observemos la siguiente matriz de salida:

`[[0,0,0,0,0,1],
  [0,0,1,0,0,0]
]`
Esta matriz es de `2x6`, por ende codifica la salida de 2 ejemplos, en un problema de 6 clases. La etiqueta del primer ejemplo sería la `5`, y la del segundo ejemplo la `2`.

Una etiqueta codifica la clase de un ejemplo simplemente con un número. Entonces, si convertimos la matriz anterior a un vector de etiquetas, obtenemos simplemente `[5,2]`.



In [None]:
import numpy as np

def onehot2labels(onehot_matrix):
    n,c=onehot_matrix.shape
    labels = np.zeros(n,dtype=int)
    
    ## TODO calcular las etiquetas
    
    ## FIN TODO
    
    return labels


def labels2onehot(labels):
    n,=labels.shape
    classes=int(labels.max()+1)
    onehot_matrix=np.zeros((n,classes),dtype=int)
    
    ## TODO calcular los vectores onehot
    
    ## FIN TODO
    
    return onehot_matrix



def equal_array(a,b):
    equals=np.all(a==b)
    if equals:
        print("Los arreglos son iguales.")
    else:
        print("Los arreglos no son iguales.")
        print("Debió obtener:")
        print(a)
        print("Obtuvo:")
        print(b)


onehot_test=np.array([[0,0,0,0,0,1],
  [0,0,1,0,0,0]
])
labels_test=np.array([5,2])

print("Probando conversiones, todos los arreglos deben ser iguales:")
equal_array(labels_test,onehot2labels(onehot_test))
equal_array(onehot_test,labels2onehot(labels_test))
# onehot2labels y labels2onehot deben ser funciones inversas entre si.
equal_array(labels_test,onehot2labels(labels2onehot(labels_test)))
equal_array(onehot_test,labels2onehot(onehot2labels(onehot_test)))






## 2 - Conversión de probabilidades a etiquetas.
La salida de un modelo de clasificación con función softmax es un vector de probabilidades para cada ejemplo. Es decir, es una matriz de dimensiones `ejemplos x clases` donde nos indican la probabilidad del modelo para cada clase y ejemplo. Muchas veces queremos convertir esas probabilidades en etiquetas, seleccionando para cada ejemplo la etiqueta de la clase con mayor probabilidad.

Por ejemplo, si la salida que predice un modelo es:

`
y_prob =[[0.5 , 0.2 , 0.3 ],
         [0.1 , 0.3 , 0.6 ],
         [0.05, 0.15, 0.8 ]
        ]
`

Entonces las etiquetas que predice son `y_pred = [0,2,2]`, ya que:
* En la primer fila el valor más alto es el `0.5` (columna 0)
* En la segunda es el valor `0.6` (columna 2)
* En la tercer fila es el valor `0.8` (columna 2)

Implementá la funcion `prob2labels` que convierte una matriz de probabilidades en un vector de etiquetas.

In [None]:
def prob2labels(y_prob):
    n,c=y_prob.shape
    labels=np.zeros(n,dtype=int)
    ## TODO implementar
    
    ## FIN TODO
    return labels


y_prob = np.array(
        [[0.5 , 0.2 , 0.3 ],
         [0.1 , 0.3 , 0.6 ],
         [0.05, 0.15, 0.8 ]
        ])

y_pred=np.array([0,2,2])

equal_array(y_pred,prob2labels(y_prob))


## 3 - Cálculo del accuracy de un modelo
Dado un vector de etiquetas verdaderas de salida `y`, y un vector de etiquetas que predice un modelo `y_pred`, calcula el accuracy del mismo. Recordá que el accuracy es la cantidad de veces que el modelo acierta, o sea, la cantidad de veces que `y[i]=y_pred[i]`

Nota: el accuracy generalmente se codifica como un valor flotante entre 0.0 y 1.0, donde 1.0 es el mejor accuracy (100% de ejemplos bien clasificados), 0.0 el peor (0% de ejemplos bien clasificados), y, por ejemplo, 0.5 indica la mitad de ejemplos bien clasificados (50%).


In [None]:
def accuracy(y,y_pred):
    accuracy=0.0
    ## TODO implementar
    
    ## fin todo
    return accuracy

def equals_flotantes(etiqueta,verdadero,calculado,epsilon=0.01):
    '''
    Verifica que dos flotantes sean aproximadamente iguales
    '''
    equals= abs(verdadero-calculado)<epsilon
    
    if equals:
        print(f"{etiqueta} correcto ({calculado}).")
    else:
        print(f"{etiqueta} INCORRECTO:")
        print(f"    Calculado : {calculado}")
        print(f"    Verdadero : {verdadero}")


y =      np.array([0,1,2,2,2,2,1,0,0,2,2,0,1,0,2])
y_pred = np.array([0,1,2,1,1,1,1,2,0,1,2,1,0,2,1])


accuracy_calculada=accuracy(y,y_pred)
accuracy_verdadera=0.4
equals_flotantes("Accuracy",accuracy_verdadera,accuracy_calculada)
    



## 4 - Matriz de confusión 

La matriz de confusión nos permite conocer con más detalle qué tipo de errores comete nuestro modelo. Para un problema con 5 clases, por ejemplo, la matriz tiene tamaño `5x5`; en general, para `c` clases, tiene tamaño `c x c` (sin importar el número de ejemplos).

El elemento `[i,j]` de esta matriz nos dice la cantidad de veces que el modelo debió predecir la clase `i`, pero predijo la clase `j`.  Es importante notar que esta matriz entonces NO es simétrica respecto de la diagonal, ya que es posible que confunda la clase `1` con la `2`, pero no viceversa. Entonces, tener en cuenta la siguiente correspondencia es crucial para realizar correctamente este ejercicio:

* `i` (fila) => clase verdadera
* `j` (columna) => clase predicha  

Implemente una función que reciba `y` y `y_pred` como en el ejercicio anterior, pero que calcule la matriz de confusión.

In [None]:
def confusion(y,y_pred):
    classes=int(y.max()+1)
    
    matrix=np.zeros( (classes,classes))
    
    n,=y.shape
    
    ## TODO implementar
    
    ## FIN TODO
    return matrix

confusion_calculada=confusion(y,y_pred)
confusion_verdadera=np.array(
[[2, 1, 2],
 [1, 2, 0],
 [0, 5, 2]])

equal_array(confusion_verdadera,confusion_calculada)


## 5 - Accuracy a partir de la matriz de confusión

De la matriz de confusión pueden leerse muchos datos. Uno de ellos es el accuracy. En el siguiente ejercicio, te proponemos calcular el accuracy pero ahora a partir de la matriz de confusión. Considerá que en dicha matriz la diagonal principal tiene los ejemplos clasificados correctamente de cada clase, y el resto de los elementos no-diagonales los errores.

In [None]:
def confusion2accuracy(confusion):
    
    c,c = confusion.shape
    accuracy = 0.0
    ## TODO implementar
    # Pista: investigar la función np.diag()
    
    ## TODO fin 
    return accuracy


matriz_confusion = confusion(y,y_pred)    
accuracy_confusion= confusion2accuracy(matriz_confusion)



equals_flotantes("Accuracy",accuracy_verdadera,accuracy_confusion)



## 6 - Precision, recall y f-measure para problemas binarios

En los problemas de dos clases, podemos computar el `precision` y el `recall`, otras métricas útiles para evaluar un modelo. 

Recordamos que para problemas de 2 clases, podemos ver la matriz de confusión como:

`
TN FP
FN TP
`

Donde:
* TN: True Negative 
* FP: False Positive
* FN: False Negative
* TP: True Positive

En base a estos valores podemos calcular:

* Precision = TP / (TP+FP) 
* Recall    = TP / (TP+FN)

Por otro lado, el `f-measure` o `f-score` es una métrica que balancea las otras dos, y no tiene los problemas del `accuracy`. Recordamos la fórmula `F = 2 * precision * recall / (precision + recall)`

Implementa la función `confusion2metrics` que calcula estos valores a partir de la matriz de confusion.

In [None]:
def confusion2metrics(confusion):
    c,c=confusion.shape
    assert c==2, "El problema de clasificación debe ser binario para calcular estas métricas"
    
    precision=0.0
    recall=0.0
    f=0.0
    ## TODO implementar
    
    ## fin todo
    
    return precision,recall,f


y      = np.array([0,0,1,0,1,1,0,0,0,1,0,0,1,1])
y_pred = np.array([0,0,1,1,1,0,1,0,0,1,0,1,1,0])

matriz_confusion = confusion(y,y_pred)

precision,recall,f=confusion2metrics(matriz_confusion)


equals_flotantes("Precision",precision, 0.57)
equals_flotantes("Recall",recall, 0.66)
equals_flotantes("F-score",f, 0.61)
