# KNN reconocimiento de dígitos

A continuación se realizará un modelo para predecir cuando un caracter escrito a mano es 4, y otro modelo para predecir cuando es 6. Se utilizará el dataset de dígitos de sklearn para este proposito, y el algoritmo de KNN.

Para inciar, ralizamos los imports necesarios: en este caso, el dataset de digitos, metricas de sklearn (con el fin de validar las métricas que se calcularán), neighbors para KNN, y numpy para manipular los datos.

In [1]:
from sklearn.datasets import load_digits
from sklearn.metrics import accuracy_score
import numpy as np
from sklearn import neighbors, datasets, model_selection, metrics

## Preparación de los datos

Cargamos los dígitos y construimos las salidas para el modelo predictivo de 4 y de 6 (y4 y y6 respectivamente). Las entradas x se convertiran de matriz a vector, y serán iguales en ambos casos por lo que no es necesario realizar ninguna preparación. Las salidas se llevaran a una forma binaria, uno si corresponde al número que se va a predecir, cero en caso contrario.

In [6]:
# Obtener todos los digitos
digits = load_digits()
# Obtener las entradas
x = digits.images
# se reducen las dimensiones
x = digits.images.reshape((len(x), -1))
# Obtener las salidas
y = digits.target
y4 = []
y6 = []
for i in range(0,len(x)):
    if(y[i]==4):
        y4.append(1)
        y6.append(0)
    elif(y[i]==6):
        y4.append(0)
        y6.append(1)
    else:
        y4.append(0)
        y6.append(0)
print('Se han construido las salidas...')

Se han construido las salidas...


## Modelo predictivo 4

Hacemos split de (x) y (y4) en train y test para entrenar y probar el modelo con KNN respectivamente: Se utilizará 80% de los datos para entrenar y el 20% restante para evaluar

In [7]:
x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y4, test_size=0.2)

Posteriormente, creamos el modelo y realizamos las predicciones

In [8]:
knn = neighbors.KNeighborsClassifier(n_neighbors=10) # Creamos una instancia de Neighbours Classifier
knn.fit(x_train, y_train) # Generamos el modelo con los datos y resultados de entrenamiento
y_pred = knn.predict(x_test) # realizamos una predicción para el 4

Finalmente, calculamos el accuracy obtenido en las predicciones

In [9]:
print('accuracy:   '+ str(accuracy_score(y_test,y_pred)))

accuracy:   1.0


## Modelo predictivo 6

Hacemos split de (x) y (y6) en train y test para entrenar y probar el modelo con KNN respectivamente: se utilizará 80% de los datos para entrenar y el 20% restante para evaluar

In [10]:
x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y6, test_size=0.2)

Posteriormente, creamos el modelo y realizamos las predicciones

In [11]:
knn = neighbors.KNeighborsClassifier(n_neighbors=10) # Creamos una instancia de Neighbours Classifier
knn.fit(x_train, y_train) # Generamos el modelo con los datos y resultados de entrenamiento
y_pred = knn.predict(x_test) # realizamos una predicción para el 6

Finalmente, calculamos el accuracy obtenido en las predicciones

In [12]:
print('accuracy:   '+ str(accuracy_score(y_test,y_pred)))

accuracy:   0.9944444444444445


## Modelo predictivo para todos los numeros

Hacemos split de (x) y (y) en train y test para entrenar y probar el modelo con KNN respectivamente: se utilizará 80% de los datos para entrenar y el 20% restante para evaluar

In [13]:
x_train, x_test, y_train, y_test = model_selection.train_test_split(x, y, test_size=0.2)

Posteriormente, creamos el modelo predictivo y realizamos las predicciones

In [14]:
knn = neighbors.KNeighborsClassifier(n_neighbors=10) # Creamos una instancia de Neighbours Classifier
knn.fit(x_train, y_train) # Generamos el modelo con los datos y resultados de entrenamiento
y_pred = knn.predict(x_test) # realizamos una predicción para el 6

Finalmente, calculamos el accuracy para cada una de las etiquetas de los numeros. Para esto utilizaremos el clasification report de sklearn.

In [15]:
class_report = metrics.classification_report(y_test, y_pred) 
print(class_report)

             precision    recall  f1-score   support

          0       1.00      1.00      1.00        22
          1       0.88      1.00      0.94        29
          2       1.00      1.00      1.00        40
          3       0.98      1.00      0.99        42
          4       1.00      1.00      1.00        40
          5       0.97      1.00      0.98        32
          6       1.00      0.97      0.98        31
          7       1.00      1.00      1.00        41
          8       1.00      0.91      0.95        46
          9       0.97      0.95      0.96        37

avg / total       0.98      0.98      0.98       360

