<a href="https://www.inove.com.ar"><img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/PA%20Banner.png" width="1000" align="center"></a>


# Ejercicio de clasificación con redes neuronales (ANN)

Ejemplo de clasificación utilizando redes neuronales para la clasificación de imagenes<br>

v1.1

In [None]:
import os
import platform

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

import keras
from keras.models import Sequential
from keras.utils import to_categorical

# Recolectar datos
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline1.png" width="1000" align="middle">

In [None]:
from keras.datasets import mnist

# Leer el dataset de mnist
(data_X_train, data_y_train), (data_X_test, data_y_test) = mnist.load_data()

### `MNIST dataset`:
El dataset **`MNIST`** contiene 70.000 imagenes de números escritos a mano (números del 0 al 9, 10 dígitos). Cada imagen es de 28x28 píxeles en escala de grises (1 canal o 1 nivel de profundidad). Es uno de los dataset más utilizados para poner a prueba algoritmos de clasificación de imagenes.<br> [Dataset source](https://keras.io/api/datasets/mnist/)
- La entrada (X) es una variable imagen de 28x28
- La salida (y) es el dígito que representa la imagen en cuestión, un número de 0 al 9


In [None]:
# Visualizar las 100 primeras imagenes
fig = plt.figure(figsize=(16,9))
for i in range(100):
    ax = fig.add_subplot(10, 10, i+1)
    ax.axis('off')
    plt.imshow(data_X_train[i], cmap='Greys')
plt.show()

In [None]:
plt.imshow(data_X_train[0], cmap='gray')
plt.title("Número: " + str(data_y_train[0]))
plt.show()

# Procesar datos
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline2.png" width="1000" align="middle">

In [None]:
# Observar como está representada la imagen, ver fila del medio (14)
print(data_X_train[0][14, :])

In [None]:
# Por los resultados podemos ver que la imagen está representada de 0 a 255
# Normalizamos los datos para que se encuentren entre 0 y 1
X_train_norm = data_X_train / 255
X_test_norm = data_X_test / 255

In [None]:
print('Cantidad de datos en observacion:', X_train_norm.shape[0])

In [None]:
print('Tamaño de la imagen:', X_train_norm[0].shape)

# Explorar datos
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline3.png" width="1000" align="middle">

In [None]:
# Observar el los primeros 10 datos del dataset de y_train
print(data_y_train[:10])

In [None]:
# Exploramos los primeros diez 8 del dataset de train
fig = plt.figure(figsize=(16,9))
j = 0

for i in range(10):
    ax = fig.add_subplot(1, 10, i+1)
    ax.axis('off')
    while True:
        if data_y_train[j] == 8:
            ax.imshow(X_train_norm[j], cmap='Greys')
            j += 1
            break
        j += 1
plt.show()

In [None]:
# Exploramos los primeros diez 8 del dataset de test
fig = plt.figure(figsize=(16,9))
j = 0

for i in range(10):
    ax = fig.add_subplot(1, 10, i+1)
    ax.axis('off')
    while True:
        if data_y_test[j] == 8:
            ax.imshow(X_test_norm[j], cmap='Greys')
            j += 1
            break
        j += 1
plt.show()

#### Transformar los imagenes de 28x28 (2 dimensiones) en un array de una dimensión (28x28 = 784)
Esto se realiza porque las redes neuronales no soportan que se ingrese un array de dos dimensiones, solo soportan ingresar "N" features (un array)

In [None]:
# proceso de flatten --> transformar las imagenes en un vector de 1 dimension

num_pixels = X_train_norm.shape[1] * X_train_norm.shape[2]

X_train = X_train_norm.reshape(X_train_norm.shape[0], num_pixels).astype('float32')
X_test = X_test_norm.reshape(X_test_norm.shape[0], num_pixels).astype('float32')

In [None]:
# ¿Cómo se ve ahora nuestra primera imagen?
fig = plt.figure()
ax = fig.add_subplot()
ax.imshow(X_train[0].reshape(-1,1).T, cmap='gray')
ax.set_xscale("log")
plt.title("Número: " + str(data_y_train[0]))
plt.show()

In [None]:
print('Datos en observacion:', X_train.shape)

Son 60000 vectores, cada vector representa lo mismo que una fila de un dataset. Cada fila o vector tiene 784 columnas

In [None]:
print('Dimensión de cada imagen faltten:', X_train[0].shape)

# Entrenar modelo
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline4.png" width="1000" align="middle">

Los datos ya estan dividios en train y test

In [None]:
# Transformar la salida a oneHotEncoding con to_categorical
y_train = to_categorical(data_y_train)
y_test = to_categorical(data_y_test)
y_train[:10]

In [None]:
# input shape
in_shape = X_train.shape[1]
in_shape

In [None]:
# output shape
out_shape = y_train.shape[1]
out_shape

In [None]:
from keras.layers import Dense

model = Sequential()

model.add(Dense(units=128, activation='sigmoid', input_shape=(in_shape,)))
model.add(Dense(units=out_shape, activation='softmax'))

model.compile(optimizer="Adam",
              loss='categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
model.summary()

In [None]:
history = model.fit(X_train, y_train, validation_split=0.2 , epochs=10, batch_size=128)

In [None]:
epoch_count = range(1, len(history.history['accuracy']) + 1)
sns.lineplot(x=epoch_count,  y=history.history['accuracy'], label='train')
sns.lineplot(x=epoch_count,  y=history.history['val_accuracy'], label='valid')
plt.show()

In [None]:
y_hat_prob = model.predict(X_test)
y_hat_prob[:3]

In [None]:
y_hat = np.argmax(y_hat_prob,axis=1)
y_hat[:3]

# Validar modelo
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline5.png" width="1000" align="middle">

In [None]:
# Calcular la exactitud (accuracy)
scores = model.evaluate(X_test, y_test)
scores[1]

In [None]:
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
cm = confusion_matrix(y_test.argmax(axis=1), y_hat)
cmd = ConfusionMatrixDisplay(cm, display_labels=list(range(10)))
cmd.plot(cmap=plt.cm.Blues)
plt.show()

# Utilizar modelo
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline6.png" width="1000" align="middle">

Es hora de buscar los peores dígitos calificados!<br>
__NOTA__: No se entrará en detalle sobre el codigo utilizado en la función "ranking_peores". Se utilizó una vez para obtener los candidatos para evaluar de forma permanente de aquí en más en diferentes ensayos o notebooks. Los índices ahora se encuentran hardcodeados (invariantes y escritos en el código)

In [None]:
# Se puede ver en la tabla que los números más complejos de clasificar son
# el 8 y el 9 principalmente por su forma, tomemos el número 8
def ranking_peores(numero_observar):
    
    # Crear un array con los índices de cada fila (número de fila)
    index = list(range(X_test.shape[0]))
    index = np.asanyarray(index).reshape(-1, 1)

    # Obtener solo aquellas muestras relacionadas con el
    # numero a observar
    mask = data_y_test == numero_observar
    X_test_num = X_test[mask]
    y_test_num = y_test[mask]
    index_num = index[mask]

    # Evaluar como fue clasificado este numero
    y_hat_prob_num = model.predict(X_test_num)
    y_hat_num = np.argmax(y_hat_prob_num,axis=1)

    # Quedarnos unicamente con las predicciones que no coinciden
    # con la búsqueda del número deseado, es decir,
    # quedarnos con las malas predicciones
    mak_error = y_hat_num != numero_observar
    index_num_error = index_num[mak_error]
    X_test_num_error = X_test_num[mak_error]
    print("Cantidad de", numero_observar, "mal clasificados:", X_test_num_error.shape[0])

    # En este proceso buscaremos los peores mal clasificados
    # Primero obtener la probabilidades de los números mal clasificados
    y_hat_prob_num_error = y_hat_prob_num[mak_error][:, numero_observar-1].reshape(-1, 1)
    # Les agregamos una columna con le indice
    y_hat_prob_num_error = np.concatenate((y_hat_prob_num_error, index_num_error), axis=1)
    # Ordernar la lista de los peores a los mejores calificados
    peores_num = y_hat_prob_num_error[y_hat_prob_num_error[:,0].argsort()]
    # Obtener los peores 10
    ranking_10 = [int(peores_num[i, 1]) for i in range(10)]
    print("Indices de los peores dígitos", numero_observar, "mal clasificados")
    print(ranking_10)
    return ranking_10

__NOTA__: De aquí es más es importante que el alumno pueda continuar el análisis, teniendo en consideración que "ranking_10" posee los indices de los peores 10 clasificados. Esos índices se utilizarán en otros notebooks

In [None]:
ranking_10 = [8183, 6765, 8522, 1325, 582, 9280, 5749, 3567, 3206, 9744]

In [None]:
fig = plt.figure(figsize=(16,9))
j = 0

for i in ranking_10:
    ax = fig.add_subplot(1, 10, j+1)
    ax.axis('off')
    ax.imshow(X_test_norm[i], cmap='Greys')
    j += 1

plt.show()

In [None]:
# Obtener el vector de entrada para evaluar
X_test_peores = X_test[ranking_10]
X_test_peores.shape

In [None]:
# Obtener el vector de salida para evaluar
y_test_peores = y_test[ranking_10]
y_test_peores.shape

In [None]:
# Calcular la exactitud
score = model.evaluate(X_test_peores, y_test_peores)
score[1]

In [None]:
# ¿Qué es lo que el sistema ve?
y_hat_prob_peores = model.predict(X_test_peores)
y_hat_peores = np.argmax(y_hat_prob_peores,axis=1)
y_hat_peores

In [None]:

fig = plt.figure(figsize=(16,9))
j = 0

for i in ranking_10:
    ax = fig.add_subplot(1, 10, j+1)
    ax.axis('off')
    ax.imshow(X_test_norm[i], cmap='Greys')
    ax.set_title("Número: " + str(y_hat_peores[j]))
    j += 1

plt.show()

# Conclusión
<img src="https://raw.githubusercontent.com/InoveAlumnos/dataset_analytics_python/master/images/Pipeline7.png" width="1000" align="middle">

Al utilizar un modelo clásico de redes neuronales (ANN) de una sola capa oculta vemos que el modelo es ineficiente en clasificar aquellos dígitos o números que no están compuestos por rectas y tienen mayor cantidad de curvas. <br>
Este modelo además es incapaz de manejar imagenes a color debido a la necesidad del proceso de flatten.