# Clasificación Multiclase

Como vimos antes, problema de clasificación se puede resumir en asignar una de $C_k$ clases discretas a un vector dado $\mathbf{x}$. En la mayoría de los casos estas clases son disjuntas, entonces el vector entrada puede asignarse solamente a una clase. 

Tanto para la clasificación binaria vista en las últimas clases como la para la clasificación más de dos clases (multiclase) un punto importante de estudiar es el error de clasificación.  

El error de clasificación lo podemos definir como sigue: $$1/n \sum_i^n I(y_i \not= \hat(y))$$
    
    
Es decir, el total de observaciones para las cuales la clase predicha no es igual a la clase real. 

## Minimizar el error de clasificación

En general, el objetivo del problema de clasificación es encontrar una función f que asigne los vectores de entrada a las clases, de manera que el error de clasificación sea lo más pequeño posible: 
$$ \min_f  \sum_i^n I(y_i \not= \hat{f}(x_i) )$$

## Ejemplo: Clasificación con Iris

Vamos a entrenar un modelo de regresión logística para clasificar observaciones del dataset iris en una de las tres especies: **setosa, virginica y versicolo.**

In [90]:
import pandas as pd
import sklearn 
from sklearn import datasets
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline


In [91]:
iris = datasets.load_iris()


In [92]:
names=[name[0:-5] for name in iris['feature_names']]
dataframe = pd.DataFrame(iris['data'], columns=names)
iris = dataframe.join(pd.DataFrame(iris['target'], columns=['target']))


In [94]:
X = np.array(iris.drop('target', axis=1))
y = np.array(iris['target'])


In [95]:
from sklearn.model_selection import train_test_split


In [122]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.4)


In [97]:
from sklearn.linear_model import LogisticRegression


In [123]:
model  = LogisticRegression()



In [124]:
trained_model = model.fit(X_train, y_train)


In [125]:
pd.DataFrame({'predicted':trained_model.predict(X_test).reshape(1,-1)[0], 'real':y_test}).head(15)



Unnamed: 0,predicted,real
0,0,0
1,0,0
2,0,0
3,2,2
4,2,1
5,0,0
6,2,2
7,2,2
8,0,0
9,0,0


### Demasiado bueno para ser cierto!!!

In [126]:
pd.DataFrame({'predicted':trained_model.predict(X_test).reshape(1,-1)[0], 'real':y_test}).tail(15)

Unnamed: 0,predicted,real
45,1,1
46,2,1
47,0,0
48,1,1
49,1,1
50,2,2
51,2,2
52,2,2
53,1,1
54,1,1


**¿Que tan bueno es el modelo?**

In [127]:
inc = sum(trained_model.predict(X_test)!=y_test)
print("El número de predicciones incorrectas es: "+str(inc)+'\n')

print("La exactitud (accuracy) es: {0:7.3f}".format(trained_model.score(X_test, y_test)))

print(len(y_test))

El número de predicciones incorrectas es: 3

La exactitud (accuracy) es:   0.950
60


Entonces el error de clasificación es 1-0.911 = 0.089

Algo interesante a notar es que podemos obtener las probabilidades de que una observación sea de una clase determinada. 

In [128]:
trained_model.predict_proba(X_test)[0].sum()

1.0

In [129]:
trained_model.predict_proba(X_test)[0]

array([9.20030991e-01, 7.98089641e-02, 1.60045245e-04])

Podemos ver cual es la clase predicha, como vimos debe ser 1

In [130]:
trained_model.predict(X_test)[0]

0

Usemos el clasification report para ver los resultados de la clasificación. 

In [131]:
from sklearn.metrics import classification_report
print(classification_report( y_test, trained_model.predict(X_test)))

             precision    recall  f1-score   support

          0       1.00      1.00      1.00        18
          1       1.00      0.87      0.93        23
          2       0.86      1.00      0.93        19

avg / total       0.96      0.95      0.95        60



Vemos que el algorítmo puede clasificar correctamente a todos los elementos de la clase 0. Eso era de esperarse, pues sabemos que ese grupo de observaciones esta bastante separado del resto.  

Es necesario notar que estos resultados pueden no ser lo suficientemente significativos puesto que el set de prueba es bastante pequeño. Probemos con un test más grande.

Siguiente clases: 
- Ver métodos para reducir dimensionalidad y complejidad de los modelos.
- Ver otros métodos de clasificación: Decision Trees, Random Forests, MLP y NN.       