# Redes Neuronales

En este notebook vamos a construir la unidad básica de las redes neuronales, el Perceptrón. Tiene dos partes:
1. **Perceptrón 2D**: vamos a entrenar un Perceptrón con Keras sobre un dataset ficticio. Exploramos cómo son las fronteras en 2D. Limitaciones del Perceptrón. Generamos un dataset no-linealmente separable y vemos cómo responde el Perceptrón.
2. **MNIST**: vamos a trabajar con este conocido dataset. El objetivo es identificar dígitos, del 0 al 9, escritos a manos. Primero entrenaremos una red neuronal de una capa y luego una Red Neuronal de más capas.

## 1. Perceptrón en 2D

Vamos a generar un dataset sintético con unas funciones que ya vienen incorporadas en scikit-learn.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

import keras
from keras.models import Sequential
from keras.layers import Dense

Using TensorFlow backend.


ModuleNotFoundError: No module named 'tensorflow'

In [None]:
from sklearn.datasets.samples_generator import make_blobs, make_moons
X, y = make_blobs(n_samples=1000, centers=2, n_features=2,
                  random_state=0)

X, y = make_moons(n_samples=1000, random_state=0)

In [None]:
print(X.shape)
print(y.shape)

In [None]:
sns.scatterplot(x = X[:,0], y = X[:,1], hue = y)
plt.show()

Reescalamos los datos

In [None]:
X[:,0] = (X[:,0] - X[:,0].mean())/X[:,0].std()
X[:,1] = (X[:,1] - X[:,1].mean())/X[:,1].std()

In [None]:
sns.scatterplot(x = X[:,0], y = X[:,1], hue = y)
plt.show()

Definimos el modelo a entrenar y volvemos a mirar algunas de sus características.

In [None]:
model = Sequential()
#model.add(Dense(10, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

In [None]:
optimizer = keras.optimizers.Adam(lr=0.001, beta_1=0.0, beta_2=0.0, epsilon=None, decay=0.0, amsgrad=False)
model.compile(optimizer=optimizer,loss='binary_crossentropy',metrics=['accuracy'])

In [None]:
history = model.fit(X, y, epochs=100, validation_split=0.25)

In [None]:
model.summary()

In [None]:
print(history.history.keys())

Notar que se agregaron una keys, asociadas al set de validación. Grafiquemos.

In [None]:
# Plot training & validation accuracy values
plt.plot(history.history['acc'])
plt.plot(history.history['val_acc'])
plt.title('Model accuracy')
plt.ylabel('Accuracy')
plt.xlabel('Epoch')
plt.legend(['Train', 'Test'], loc='upper left')
plt.show()

# Plot training & validation loss values
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('Model loss')
plt.ylabel('Loss')
plt.xlabel('Epoch')
plt.legend(['Train', 'Test'], loc='upper left')
plt.show()

¿Cuántos parámetros tiene ahora el modelo?

In [None]:
print(model.get_weights())

Y graficamos las fronteras de decisión. ¿Notan que ya no es una frontera abrupta, sino que hay una zona de cambio?¿A qué se debe?

In [None]:
plt.figure(figsize = (10,6))

ax = sns.scatterplot(x = X[:,0], y = X[:,1], hue = y)
xlim = ax.get_xlim()
ylim = ax.get_ylim()
xx, yy = np.meshgrid(np.linspace(*xlim, num=200),
                      np.linspace(*ylim, num=200))
Z = model.predict(np.c_[xx.ravel(), yy.ravel()]).reshape(xx.shape)
contours = ax.contourf(xx, yy, Z, levels = 10, alpha=0.3, cmap = 'plasma')
plt.show()

**Ejercicio:** volver a correr esta sección, pero reemplazando la función que genera los datos `make_blobs` por `make_moons`. ¿Qué problema ven en el resultado?

**Ejercicio**: con los datos producidos por `make_moons`, agregar una capa a la red neuronal, con 10 neuronas y función de activación `relu`.

## 2. MNIST

El dataset de MNIST es un dataset muy conocido. Consiste en dígitos escritos a mano. Muchas modelos de redes neuronales son probados primeros en este set. Pueden encontrar una descripción más detallada, y un ranking de modelos con su desempeño, en el siguiente link.

https://en.wikipedia.org/wiki/MNIST_database

Vamos a arrancar con una sola capa, con una activación `softmax`, ya que se trata de diez clases.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set()

import os #esta libreria permite trabajar con funciones del sistema operativo 
import random

from sklearn.model_selection import train_test_split

**1. Carga de datos**

Cada instancia del dataset es una imagen guardada en una carpeta con la etiqueta correspondiente.

In [None]:
directorio = 'Datasets/MNIST/'

Miramos las carpetas que hay adentro de la carpeta MNIST

In [None]:
print(os.listdir(directorio))

Creamos los contenedores vacíos

In [None]:
todas_imagenes = []
y_todas_imagenes = []

y los llenamos.

In [None]:
digitos = np.arange(0,10)
for digito in digitos:
    directorio = 'Datasets/MNIST/' + str(digito) + '/'
    print(digito, directorio)
    print('Hay', len(os.listdir(directorio)),'imagenes')
    for imagen in os.listdir(directorio):
        todas_imagenes.append(plt.imread(directorio + imagen))
        y_todas_imagenes.append(digito)
        
todas_imagenes = np.array(todas_imagenes)
y_todas_imagenes = np.array(y_todas_imagenes)

**2. Preprocesado**

**Ejercicio:** Mirar el `shape` de `X` y responder: ¿Cuántas instancias son?¿Qué ancho y largo tienen las imágenes?¿Cuántas bandas?

In [None]:
print(todas_imagenes.shape, y_todas_imagenes.shape)
n_instancias = todas_imagenes.shape[COMPLETAR]
ancho_imagen = todas_imagenes.shape[COMPLETAR]
largo_imagen = todas_imagenes.shape[COMPLETAR]

Miramos una imagen al azar.

In [None]:
idx_imagen = np.random.randint(0,todas_imagenes.shape[0])
plt.figure(figsize = (6,6))
plt.title('Es un ' + str(y_todas_imagenes[idx_imagen]))
plt.imshow(todas_imagenes[idx_imagen, :, :])
plt.show()

**Ejercicio:** Crear un arreglo `X` que sea igual a `todas_imagenes`, pero de forma `(n_instancias, largo_imagen * ancho_imagen)`.

In [None]:
X = todas_imagenes.reshape(COMPLETAR, COMPLETAR*COMPLETAR)
print(X.shape)

**Ejercicio:** Reescalar las imágenes entre 0 y 1.

In [None]:
X = X/COMPLETAR

**Ejercicio:** usar el `to_categorical` de Keras para llevar `y_todas_imagenes` a una columna con unos y ceros para cada clase `y` (One Hot Encoding).

In [None]:
from keras.utils import to_categorical
y = to_categorical(COMPLETAR)
print(y.shape)

**Ejercicio:** hacer un `train_test_split`. Usar el 20% del dataset como conjunto de test. Fijar el random state en 42.

In [None]:
X_train, X_test, y_train, y_test = COMPLETAR

**3. Entrenamiento del modelo**

Comenzar entrenando un Red Neuronal de una capa, con diez neuronas, función de activación `softmax` y pérdida `categorical_crossentropy`. Usar como optimizador `Adam` y `epoch = 20`.

In [None]:
from keras.models import Sequential
from keras.layers import Dense
import keras

model = COMPLETAR
model.add(COMPLETAR)

optimizador = keras.optimizers.Adam(COMPLETAR)

model.compile(optimizer=COMLPETAR,loss=COMPLETAR,
              metrics=['accuracy'])

history = model.fit(COMPLETAR, COMPLETAR, COMPLETAR, validation_split=0.1)


**Ejercicio:** ¿cuántos parámetros tiene el modelo? Recordar que hay una función de Keras que hace un *informe* de la red neuronal.

In [None]:
model.COMPLETAR()

**Ejercicio:** Graficar la pérdida y la exactitud en función de *epochs* para validación y entrenamiento.

https://keras.io/visualization/

In [None]:
COMPLETAR

**4. Evaluación de los resultados.**

**Ejercicio**: predecir las etiquetas de todo el set de testeo.

In [None]:
y_test_pred = model.COMPLETAR(COMPLETAR)

Esto sirve para pasar de probabilidades a la etiqueta en sí. En este caso, la etiqueta es el dígito, y corresponde al número de columna.

In [None]:
y_test_pred = np.argmax(y_test_pred, axis = 1)
y_test_pred.shape

**Ejercicio:** Calcular exactitud y la matriz de confusión para el conjunto de entrenamiento.

In [None]:
from sklearn.metrics import confusion_matrix

y_test = np.argmax(y_test,axis = 1)

COMPLETAR(COMPLETAR, COMPLETAR)

In [None]:
from sklearn.metrics import accuracy_score

COMPLETAR

**Ejercicio:** ¿Dónde se está confundiendo? Graficar algunos ejemplos.

In [None]:
errores = COMPLETAR != COMPLETAR

In [None]:
imagenes_errores = X_test[COMPLETAR,:]
y_test_errores = y_test[COMPLETAR]
y_test_pred_errores = y_test_pred[COMPLETAR]
print(imagenes_errores.shape)

In [None]:
imagenes_errores = imagenes_errores.reshape(imagenes_errores.shape[0], ancho_imagen, largo_imagen)
print(imagenes_errores.shape)

In [None]:
idx_imagen = np.random.randint(0,imagenes_errores.shape[0])
plt.figure(figsize = (6,6))
plt.title('Es un ' + str(y_test_errores[idx_imagen]) +'. Fue etiquetado como ' + str(y_test_pred_errores[idx_imagen]))
plt.imshow(imagenes_errores[idx_imagen, :, :])
plt.show()

**Ejercicio:** Volver a entrenar, pero agregando una capa con 800 neuronas y función de activación `relu`.