# Instalacion de Librerias
Antes de proceder, necesitamos instalar las librerias necesarias. En nuestro caso, trabajaremos con la Libreria __[scikit-learn](https://scikit-learn.org/stable/index.html)__ en su version __0.24.2__. Esta libreria ofrece una amplia gama de algoritmos y/o tecnicas aplicadas no solo a la inteligencia artificial, sino tambien a otras areas como ciencia de datos. Para poder instalar nuestra libreria en la maquina virtual procederemos a ejecutar el siguiente comando: `!pip install -U scikit-learn==0.24.2`. La ejecucion puede tardar unos momentos.

In [None]:
# Instalacion de libreria
!pip install -U scikit-learn==0.24.2

Ejecute la siguiente celda para comprobar que instalo la version correcta. Debe de poder visualizar el mensaje: `The scikit-learn version is 0.24.2.`

In [None]:
import sklearn
print('The scikit-learn version is {}.'.format(sklearn.__version__))
# Nota: asegurese de que la version sea: 0.24.2

Ejecute la siguiente celda para descargar funciones adicionales conjuntamente con los datos.

In [None]:
!curl -OL https://raw.githubusercontent.com/aguilarls/practicas/main/Practica-Redes-Neuronales/files.tar.xz && tar -xf ./files.tar.xz

# Trabajo-grupal-04: Reconocimiento de Digitos

In [None]:
# Importar librerias
import matplotlib.pyplot as plt
import numpy as np
import joblib
from helper import plot_data
from helper import plot_neurons
from helper import plot_results
from helper import plot_errors
from helper import plot_loss
from sklearn.neural_network import MLPClassifier

# I. Introduccion
En esta aplicacion exploraremos una tarea de clasificacion. Para ello utilizaremos una __sub-seccion__ del dataset llamado [mnist](http://yann.lecun.com/exdb/mnist/). Este dataset esta compuesto por imagenes de digitos. En ciencias de la computacion se suelen representar las imagenes por pixiles, en concreto se habla de matrices. Por ejemplo el dataset contiene digitos en blanco y negro (escala de grises) de tamaño 24 x 24. En la siguiente imagen se observa parte del dataset.

<div align="center">
<img src="https://upload.wikimedia.org/wikipedia/commons/2/27/MnistExamples.png" />
</div>

Nuestra tarea consistira en crear una red neuronal que sea capaz de reconocer los digitos. Para ello debemos primero de comprender la estructura de los datos.

Como primer paso, vamos a cargar el dataset.

In [None]:
# load
X_train = np.load('./sample/train.npy')
X_test = np.load('./sample/test.npy')
y_train = np.load('./sample/y_train.npy')
y_test = np.load('./sample/y_test.npy')
scaler = joblib.load('./sample/scaler.pkl')

Para esta ocacion, contamos con 2 grupos de datos:
* __X_train (entrenamiento)__: Usaremos estos datos para entrenar nuestra red neuronal.
* __X_test (test)__: Los datos de test los dejaremos para la __evaluacion final__ de nuestra red.

Sumados a los datos, estan presentes los targets de cada grupo con `y_train` y `y_test`. Asimismo, los datos __ya han sido pre-procesados__ usando la variable `scaler`.

Ahora comenzaremos a realizar algunas inspecciones. Primero usando el comando `shape` veremos cuantas filas y columnas tenemos en los datos de entrenamiento.

In [None]:
# 1.1. Imprima el total de filas y columnas
################# Ingrese su codigo en esta celda #####################


Ahora procederemos a inspeccionar los datos de test

In [None]:
# 1.2. Imprima el total de filas y columnas
################# Ingrese su codigo en esta celda #####################


### 1. Pregunta: Cual es la cantidad de datos de entrenamiento y test.

# II. Visualizacion

Como ya tenemos los datos divididos procederemos a realizar las visualizaciones. Como podemos notar las imagenes han sido expandidas, ya que contamos con 784 columnas, las cuales se pueden expresar como 28 * 28 = 784. Para ver los datos usaremos una funcion creada llamada `plot_data`

In [None]:
plot_data(X_train, y_train, scaler)

---

# III. Creacion de Red Neuronal

Para esta aplicacion, creara una red neuronal  __diferente de la mostrada en clase__. En ese sentido, debe de seleccionar el numero de neuronas y capas a usar. Como vimos previamente, usaremos la clase [MLPClassifier](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html#sklearn-neural-network-mlpclassifier). Para definir su red neuronal necesitara proporcionar las siguientes variables:

* __capas_neuronas__: En este parametro especificara las capas ocultas. Recuerde que en clase se hablo de una sola capa con __100__ neuronas, en codigo se uso `(100, )`. Si desea agregar mas capas recuerde que necesita especificar los elementos en la tupla.
* __seed__: Utilizaremos esta variable para definir un numero entero que controle la aleatoriedad de la red. Usaremos el valor de `1`.
* __solver__: Utilizaremos esta variable para especificar el algortimo de optimizacion. Existen diversas opciones, para este se le recomienda usar `adam`, no obstante puede elegir otro algoritmo como `sgd`.
* __ratio_aprendizaje__: Utilizaremos esta variable para definir el ratio de aprendizaje usado por el optimizador (solver). Para esta aplicacion se le recomienda usar valores en el intervalo `0.0001` a `0.0009`. Puede intentar con otros valores de ser el caso.
* __iteraciones__: En esta variable, definira el numero de iteraciones que entrenara su red.

In [None]:
# arquitectura
capas_neuronas = ...
seed = ...
solver = ...
ratio_aprendizaje = ...
iteraciones = ...

In [None]:
red_neuronal = MLPClassifier(random_state = seed, max_iter = iteraciones, hidden_layer_sizes = capas_neuronas, learning_rate_init = ratio_aprendizaje, solver = solver)

### 2. Pregunta: Describa la eleccion de los siguientes valores: solver, ratio de aprendizaje e iteraciones.

### 3. Pregunta: Describa la arquitectura de su red. Detalle la eleccion del numero de capas y neuronas.

### 4. Pregunta: Cuales son el ratio de aprendizaje y optimizador usados por su red?
__hint:__ El comando: `red_neuronal.get_params()` muestra la lista de atributos de su red. El ratio de aprendizaje se suele tambien llamar __learning_rate_init__, y el optimizador __solver__.

---

# IV. Entrenamiento

En esta seccion procedera a entrenar su red neuronal. Para ello, un vez que ha creado su red con la clase `MLPClassifier`, podra realizar el entrenamiento usando el comando `fit` de la siguiente manera:

```python
%time red_neuronal.fit(X_train, y_train)
```

Donde __X_train__ e __y_train__ representan los datos de entrenamiento y/o targets. Recuerde, que el comando extra `%time` es usado para medir el lapso de ejecucion. Dependiendo del tamaño de su red, los resultados pueden variar. Note que las salida de este comando es el siguiente: 
```
CPU times: user 23min 18s, sys: 8min 54s, total: 32min 12s
Wall time: 16min 28s
```
La interpretacion de estos los resultados se centra en el lapso requerido para ejecutar un proceso. En este caso, la descripcion `Wall time` hace referencia a cuanto ha pasado desde que se inicio el proceso de entrenamiento. En este caso se indica que son __16 min__ con __28 s__. Este valor cambiara cuando se modifique la arquitectura de la red. Por ejemplo si se agregan mas capas o neuronas el lapso incrementara. Lo contrario sucedera si se remueven capas o disminuye el numero de neuronas.

In [None]:
################# Ingrese su codigo aqui #####################
# 4.1. Entrene su red, recuerde usar %time


Una vez entrenada completado el entrenamiento, procedera a visualizar el error (loss) durante el entrenamiento. Para ello ejecute la siguiente celda.

In [None]:
plot_loss(red_neuronal)

### 5. Pregunta: Cuales fueron los valores de CPU times y Wall time. Cuanto demoro en entrenar su red?

### 6. Pregunta: Observando el plot de su red, cuantas iteraciones realizo su red antes de detenerse?.

# V. Visualizacion de neuronas

En esta seccion procedera a inspeccionar mas detalladamente su red neuronal. Para ello va a explorar la configuracion de 10 neuronas. Ejecute la siguiente celda el numero de veces que considere necesario para visualizar su red. __Note__ que cada visualizacion sera diferente.

In [None]:
plot_neurons(red_neuronal)

El grafico de arriba muestra las neuronas de la capa oculta. La variable __N__ representa el numero de neurona. Como podemos observar se han formado ciertos patrones. Estos patrones permiten a la red realizar la clasificacion de los digitos. Asimismo, debemos notar que estos son frutos del entrenamiento que se ha realizado. Las imagenes se encuentran en escala de grises, en esta configuracion:

* Areas oscuras: Representan valores negativos grandes.
* Areas blancas: Representan valores positivos grandes.
* Areas grices: Representan valores cercanos a cero.

### 7. Pregunta: Observando el grafico, describa y/o interprete los resultados.

# VI. Predicciones

Una vez completada la fase de entrenamiento, procedera a realizar predicciones. Para ello, necesitara proporcionar datos al modelo, es decir: __X_train__ o __X_test__. Para este caso va a usar todos los conjuntos de datos. Asimismo, utilizara variables para almacenar las predicciones de la siguiente manera:

```python
# predicciones de entrenamiento
p_train = red_neuronal.predict(X_train)
# predicciones de test
p_test = red_neuronal.predict(X_test)
```

In [None]:
################# Ingrese su codigo aqui #####################
# 7.1. Predicciones
# predicciones de entrenamiento

# predicciones de test


Ahora procedera a verificar sus predicciones con los datos reales. Primero proceda con los datos de entrenamiento. Para ello ejecute la siguiente celda

In [None]:
# visualizacion en datos de entrenamiento
plot_results(X_train, y_train, p_train, scaler)

En la imagen, en blanco se muestran los valores reales, mientras que la prediccion hecha por la red se muestra en verde. Ahora proceda a la visualizacion de los datos de test.

In [None]:
# visualizacion en datos de test
plot_results(X_test, y_test, p_test, scaler)

### 8. Pregunta: Coincidieron las predicciones para los datos de entrenamiento y test?. Describa una hipotesis acerca del comportamiento observado (si coincidieron o no, y por que?)

---

# VII. Evaluacion

Una vez entrenado el modelo, procedera a __evaluar__ la __presicion (accuracy)__ de las predicciones. Esto se realizara usando el comando `score(X, y)`, donde __X__ representa un conjunto de datos e __y__ los valores reales de ese conjunto. Con esta informacion, procedera a evaluar el modelo con los datos de entrenamiento:

```python
red_neuronal.score(X_train, y_train)
```

Ahora para test:
```python
red_neuronal.score(X_test, y_test)
```

In [None]:
################# Ingrese su codigo aqui #####################
# 7.1 Accuracy para entrenamiento


In [None]:
################# Ingrese su codigo aqui #####################
# 7.1 Accuracy para test


### 9. Pregunta: Cuales son los porcentajes de accuracy para los datos de entrenamiento y test?. Explique el comportamiento observado en terminos de las diferencias entre resultados, elabore hipotesis acerca de este comportamiento.

---

# VII. Errores

En esta seccion visualizara que errores comete su red. Para ello, comenzaremos con los errores en los datos de entrenamiento. Proceda a ejecutar las siguientes celdas.

In [None]:
# errores en entrenamiento
plot_errors(X_train, y_train, p_train, scaler)

Ahora procederemos con los datos de test. Se le recomienda ejecutar varias veces esta celda para ver diferentes errores.

In [None]:
# errores en test
plot_errors(X_test, y_test, p_test, scaler)

### 10. Pregunta: Describa los errores encontrandos en los datos de entrenamiento y test. Elabore una hipotesis explicando los errores.

---

# VIII. Video

En esta seccion vamos a crear un video con las visualizaciones de su red. Para ello ejecute el siguiente codigo.

__Nota:__ Este proceso puede tardar algunos minutos, se le recomienda no cerrar la ventana.

In [None]:
%matplotlib inline
import matplotlib
plt.rcParams["animation.html"] = "jshtml"
from matplotlib.animation import FuncAnimation

neurons = np.transpose(red_neuronal.coefs_[0])
sample = 100
vmin, vmax = red_neuronal.coefs_[0].min(), red_neuronal.coefs_[0].max()
dims = 28
try:
    s = np.random.choice(range(neurons.shape[0]), size = sample, replace = True).astype(int)
except:
    s = np.random.choice(range(neurons.shape[0]), size = sample, replace = False).astype(int)
    
fig, arr = plt.subplots(1, 1, figsize = (15, 5))
ann = arr.annotate('', xy = (0.05, 0.85), xycoords = "axes fraction", color = "white", fontsize = 18)
arr.xaxis.set_visible(False)
arr.yaxis.set_visible(False)
def animate(idx):
    ann.set_text('N: {}'.format(s[idx]))
    arr_plot = arr.imshow(neurons[s[idx], :].reshape(dims, dims), cmap = plt.get_cmap('gray'), interpolation = 'bilinear', vmin=.5 * vmin, vmax=.5 * vmax)
    return arr_plot

ani = FuncAnimation(fig, animate, frames = s.shape[0], interval = 1000, save_count = 50)
Writer = matplotlib.animation.writers['ffmpeg']
writer = Writer(fps = 3, metadata=dict(artist='Me'))
ani.save('video.mp4', writer=writer)
ani

Ahora procedera a bajar el video de su red. Para ello descargara el video usando el siguiente comando.

In [None]:
from google.colab import files
files.download('video.mp4')

# IX. Concluciones:

* En este Notebook ha aprendido cual es el proceso durante el entrenamiento de una red Neuronal.
* Si bien es cierto uso la libreria __scikit-learn__, esta no es la unica alternativa disponible. De hecho existen diversas herramientas (librerias) con las que se puede trabajar. No obstante le recordamos siempre considerar aquellas de __codigo abierto__ (cuando la situacion lo requiera), ya que muchos modelos complejos se entrenan usando __software libre__.
* Entrenar redes es una tarea ardua que involucra muchos factores, como la arquitectura de la red. De hecho diferentes arquitecturas resultan en performances variadas.
* Es importante recordar que los datos de entrenamiento se usan para la red. Los datos de test se usan para evaluar. Es importante que no mezcle los datos, ya que obtendra resultados __sobre estimados__.
* Existen diversas formas de division de datos. En este ejemplo hemos usado un 90-10%, donde 90% para entrenamiento y 10% para test. No obstante alternativas como la validacion cruzada y otras tambien se pueden aplicar.


### 11. Pregunta: Despues de haber completado el Notebook, elabore un resumen resaltando los puntos mas importantes que ha encontrado.

---