<a href="https://colab.research.google.com/github/RodolfoFerro/modulo-deep-learning/blob/main/notebooks/solutions/02_Introducci%C3%B3n_al_aprendizaje_profundo_(resuelto).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Aprendizaje profundo - Sesión 2  🧠**

> **Descripción:** Cuaderno de contenidos del módulo de aprendizaje profundo para el Dimplomado en Ciencia de Datos de la ENES UNAM León, 2024. <br>
> **Autor:** [Rodolfo Ferro](https://github.com/RodolfoFerro) <br>
> **Contacto:** [ferro@cimat.mx](mailto:ferro@cimat.mx)


## Contenido

### Sección I

1. Perceptrón multicapa
2. Retropropagación y optimización del error
3. Exploración del TensorFlow Playground

### Sección II

4. Introducción a TensorFlow
5. Mi primera red neuronal
6. Función de pérdida y optimizador
7. Entrenamiento y predicciones

### Sección III – Ejercicio

8. El dataset a utilizar
9. Preparación de los datos
10. Creación del modelo
11. Entrenamiento del modelo
12. Evaluación y predicción
13. Exploración de TensorFlow

## **Sección I**

### **IMPORTANTE**

El contenido de esta sección ha sido descrito en su totalidad a través de la presentación.

Conviene revisar el material que puedes encontrar en el [repositorio](https://github.com/RodolfoFerro/modulo-deep-learning).

En esta sección nos enfocaremos en explorar el [TensorFlow Playground](https://playground.tensorflow.org/#activation=tanh&batchSize=10&dataset=gauss&regDataset=reg-plane&learningRate=0.03&regularizationRate=0&noise=0&networkShape=1&seed=0.49676&showTestData=false&discretize=false&percTrainData=50&x=true&y=true&xTimesY=false&xSquared=false&ySquared=false&cosX=false&sinX=false&cosY=false&sinY=false&collectStats=false&problem=classification&initZero=false&hideText=false).

<a href="https://playground.tensorflow.org/#activation=tanh&batchSize=10&dataset=gauss&regDataset=reg-plane&learningRate=0.03&regularizationRate=0&noise=0&networkShape=1&seed=0.49676&showTestData=false&discretize=false&percTrainData=50&x=true&y=true&xTimesY=false&xSquared=false&ySquared=false&cosX=false&sinX=false&cosY=false&sinY=false&collectStats=false&problem=classification&initZero=false&hideText=false" target="_blank">
  <button>Abrir Playground</button>
</a>

## **Sección II**

### **Introducción a TensorFlow**

[TensorFlow](https://www.tensorflow.org/) es un framework open-source para Machine Learning desarrollada por Google. Utilizada para construir y entrenar redes neuronales artificiales.

In [None]:
import numpy as np


# TODO: Add sample data
x = np.array([(0, 0), (1, 0), (0, 1), (1, 1)])
y = np.array([0, 1, 1, 0])

In [None]:
import tensorflow as tf

# TODO: Create model
# layer_1 = Dense -> 2, tanh
# layer_2 = Dense -> 1, sigmoid
model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(2, activation='tanh'),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

In [None]:
input_data = np.array([[1, 1]])
model.predict(input_data)

### **Optimizador y función de pérdida**

In [None]:
loss = tf.keras.losses.MeanSquaredError()

$$ \mathrm{MSE}=\frac{1}{N}\cdot\sum_{i=1}^N \left(y_i- \hat{y}_i \right )^2 $$

In [None]:
# TODO: Explore with different vectors
v1 = np.array([1])
v2 = np.array([0])

loss(v1, v2).numpy()

In [None]:
# Create an optimizer
optimizer = tf.keras.optimizers.SGD(learning_rate=0.6)

In [None]:
# TODO: Add optimizer and loss to model compilation
model.compile(optimizer=optimizer, loss='mse', metrics=[loss])

In [None]:
model.summary()

In [None]:
history = model.fit(x, y, epochs=1000)

In [None]:
import plotly.express as px


losses = history.history['loss']
eje_x = np.arange(len(losses))

fig = px.line(
    x=eje_x,
    y=losses,
    title='Historia de entrenamiento',
    labels=dict(x='Épocas', y='Error')
)
fig.show()

In [None]:
# Construcción de una rejilla
x = np.linspace(-0.1, 1.1, 201)
y = np.linspace(-0.1, 1.1, 201)
xy = np.meshgrid(x, y)
zz = np.array(list(zip(*(x.flat for x in xy))))

# Predicción en la rejilla de valores
surface = model.predict(zz)
surface = surface.flatten()

In [None]:
import plotly.graph_objects as go


fig = go.Figure(data=[go.Scatter3d(
    x=zz[:, 0],
    y=zz[:, 1],
    z=surface,
    mode='markers',
    marker=dict(
        size=1,
        color=surface,
        colorscale='Viridis',
        opacity=0.8
    )
)])

# Tight layout
fig.update_layout(margin=dict(l=0, r=0, b=0, t=0))
fig.show()

<center>
    *********
</center>

## **Sección III – Ejercicio**

### El dataset a utilizar: Naranjas vs. Manzanas

El dataset ha sido una adaptación de datos encontrados en [Kaggle](https://www.kaggle.com/datasets/theblackmamba31/apple-orange). Dicho dataset está compuesto por conjuntos de imágenes de naranjas y manzanas que serán un utilizados para entrenar una neurona artificial.


Para cargar los datos, primero los descargaremos de un repositorio donde previamente los preparé para ustedes.

Puedes explorar directamente los archivos fuente del [repositorio en GitHub – `apple-orange-dataset`](https://github.com/RodolfoFerro/apple-orange-dataset).

Puedes también explorar el [script](https://github.com/RodolfoFerro/apple-orange-dataset/blob/main/script.py) que he utilizado para la preparación de los mismos.

In [None]:
!wget https://raw.githubusercontent.com/RodolfoFerro/apple-orange-dataset/main/training_data.csv
!wget https://raw.githubusercontent.com/RodolfoFerro/apple-orange-dataset/main/testing_data.csv

### Preparación de los datos


In [None]:
import pandas as pd


training_df = pd.read_csv('training_data.csv')
testing_df = pd.read_csv('testing_data.csv')

training_df

In [None]:
training_df['class_str'] = training_df['class'].astype('str')
training_df['hover'] = [text.split('/')[-1] for text in training_df['filename']]

testing_df['class_str'] = testing_df['class'].astype('str')
testing_df['hover'] = [text.split('/')[-1] for text in testing_df['filename']]

training_df

### Exploración de los datos

Podemos verificar si el conjunto de datos está balanceado:

In [None]:
training_df.groupby('class').count()

Podemos explorar cómo se ven los datos en un gráfico 3D:

In [None]:
import plotly.express as px


fig = px.scatter_3d(
    training_df,
    x='r', y='g', z='b',
    color='class_str',
    symbol='class_str',
    color_discrete_sequence=['#be0900', '#ffb447'],
    opacity=0.5,
    hover_data=['hover']
)
fig.show()

Puedes explorar las imágenes y sus valores de color utilizando el color picker que ofrece Google: https://g.co/kgs/uarXyu

> **Pregunta clave:** ¿Los datos son linealmente separables? Con lo que hemos explorado hasta ahora, ¿basta una neurona para resolver el problema planteado?


Antes de crear y entrenar el modelo, procedemos a escalar los datos a valores en [0, 1].

In [None]:
training_inputs = training_df[['r', 'g', 'b']].values / 255.
training_output = training_df['class'].values

training_inputs, training_output

In [None]:
testing_inputs = testing_df[['r', 'g', 'b']].values / 255.
testing_output = testing_df['class'].values

testing_inputs, testing_output

### Creación del modelo



In [None]:
mlp_model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(4, activation='relu'), # TODO. Dense -> 4, tanh
    tf.keras.layers.Dense(1, activation='sigmoid') # TODO. Dense -> 1, sigmoid
])

### Entrenamiento del modelo

Para entrenar el modelo, simplemente utilizamos el método `.fit()` del modelo.

In [None]:
mlp_model.compile(
    optimizer=tf.optimizers.SGD(),
    loss='binary_crossentropy',
    metrics=['accuracy']
)

In [None]:
# TODO: Set epochs
epochs = 100
history = mlp_model.fit(training_inputs, training_output, epochs=epochs)


> **Pregunta clave:** ¿Qué sucede con la historia de entrenamiento?

In [None]:
import plotly.express as px


seen = 'accuracy' # or 'loss'

hist_values = history.history[seen]
eje_x = np.arange(len(hist_values))

fig = px.line(
    x=eje_x,
    y=hist_values,
    title='Historia de entrenamiento',
    labels=dict(x='Épocas', y=seen.capitalize())
)
fig.show()


> **Pregunta clave:** ¿Qué sucede con la historia de entrenamiento?

> **Pro-tip:** Exploremos con una nueva función de pérdida, qué tal la utilizada usualemente en una regresión logística: https://developers.google.com/machine-learning/crash-course/logistic-regression/model-training

### Evaluación del modelo

In [None]:
mlp_model.evaluate(testing_inputs, testing_output)

### Predicción


Para predecir un color de ejemplo:

In [None]:
# Preparamos los datos
sample_index = 250

input_sample = np.expand_dims(testing_inputs[sample_index], 0)
print('Color real (transformado):', input_sample)

real_class = testing_output[sample_index]
print('Clase real:', real_class)

In [None]:
mlp_model.predict(input_sample).tolist()

Para evaluar esta tarea, vamos a utilizar funciones de scikit-learn para la que nos permitirán realizar la evaluación de resultados en el conjunto de pruebas. (Utilizar [`sklearn.metrics.accuracy_score`](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html#sklearn.metrics.accuracy_score))

<center>
    *********
</center>

In [None]:
import plotly.express as px


fig = px.scatter_3d(
    testing_df,
    x='r', y='g', z='b',
    color='class_str',
    symbol='class_str',
    color_discrete_sequence=['#be0900', '#ffb447'],
    opacity=0.5,
    hover_data=['hover']
)
fig.show()

In [None]:
def get_predictions(testing_inputs, testing_output, threshold=0.5):
    predictions = []
    predictions = mlp_model.predict(testing_inputs)
    predictions[predictions > threshold] = 1
    predictions[predictions <= threshold] = 0

    return testing_output, predictions

In [None]:
from sklearn.metrics import accuracy_score


testing_output, predictions = get_predictions(testing_inputs, testing_output, threshold=0.5)
result = accuracy_score(testing_output, predictions)
print(f'Accuracy: {result * 100:.6}%')

> **Pregunta clave:** ¿Qué sucede si cambiamos el _threshold_ a 0.7? A veces conviene explorar el valor de umbral que seleccionamos y no siempre dar por hecho que 0.5 va a funcionar todas las veces. <br><br>
> Lee más aquí: https://ploomber.io/blog/threshold/

> **Para resolver el reto:** Mejorar el accuracy obtenido en la clase.

**Puedes explorar:**
- Utilizar 1 a 3 variables (de las dadas).
- Investigar e implementar una nueva función para estimar el error.
- Realizar transformaciones en los datos.
- Entrenar por más épocas.
- Jugar con la arquitectura del modelo.
- Mover el umbral para definir la clase.
- Explorar otras funciones de activación.
- Generar tu nuevo dataset de datos a partir de las imágenes originales.

--------

> Contenido creado por **Rodolfo Ferro**, 2024. <br>
> Para cualquier retroalimentación, puedes contactarme a través del correo [ferro@cimat.mx](mailto:ferro@cimat.mx).