<a href="https://colab.research.google.com/github/mcstllns/UNIR2024/blob/main/Unir_ejemplo01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Bienvenido a colab

En este cuaderno vamos a construir nuestras primeras redes neuronales, vete fijándote en el código y en las explicaciones que se adjuntan porque luego tendrás que hacer un ejercicio en moodle.

Vamos a empezar por las redes más asequibles, los __perceptrones multicapa__, exactamente iguales que los que hemos estado utilizando en [playground](https://playground.tensorflow.org/).

La tarea es identica a la realizada en playground pero ahora en vez de ser un sandbox completamente opaco vamos a programar nuestras redes.

__No te frustres__, a veces escribir código es frustrante porque te da la sensación de que unas veces funciona y otras no. Los ordenadores son deterministas, no tienen opiniones ni les caes mal; si antes te ha funcionado y ahora no es porque hay algo diferente, sigue intentándolo y si ves que no lo consigues consulta con un compañero o con el profesor.

En general, los ejercicios siempre están basados en cosas que han sido explicadas, cuando haya un ejercicio que no te salga, relee los materiales y fíjate despacio en el código previo, es posible que la solución la tengas a la vista. Si aún así no encuentras la solución pregunta a tus compañeros y __no dudes en contactar conmigo__.


# Ejercicio 01. Regresión con datos de felicidad

Se analizan unos datos obtenido de Kaggle.com sobre la encuesta de felicidad de 2021: [enlace](https://www.kaggle.com/datasets/ajaypalsinghlo/world-happiness-report-2021)

Una vez limpiados y preparados la base de datos consta de 9 variables predictoras y una variable criterio:

**Criterio**: Life.Ladder.

**Predictoras**: year, Log.GDP.per.capita, Social.support,	Healthy.life.expectancy.at.birth, Freedom.to.make.life.choices,	Generosity,	Perceptions.of.corruption,	Positive.affect,	Negative.affect.

El mejor modelo calculado con estadística convencional (modelo lineal) da un **MSE de 0.235**



Lo primero que vamos a hacer es cargar un montón de paquetes y librerías de python que vamos a necesitar para que se calculen las redes. No te preocupes por esta parte, no es necesario entender qué o cómo lo hace, simplemente ejecútala. Lo que hace este código es:

Carga los paquetes: numpy, tensorflow2, panda, matplolib, keras y sklearn. Son paquetes básicos para el trabajo con datos y los paquetes relacionados con Deep Learning.

Construímos una función llamada plot_history que nos va a servir para visualizar el progreso en el aprendizaje de la red


Para ejecutar un código puedes pinchar en la flecha de la celda o usar Ctr+Enter en el teclado.

In [None]:
# Paquetes y librerías que vamos a necesitar

import tensorflow as tf

print(tf.__version__)

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.layers import Input

from keras.utils import plot_model

import time

In [None]:
# Definimos algunas funciones que vamos a necesitar

# hace un plot de la historia de ajuste
def plot_history(history):
  hist = pd.DataFrame(history.history)
  hist['epoch'] = history.epoch

  plt.figure()
  plt.xlabel('Epoch')
  plt.ylabel('Mean Square Error')
  plt.plot(hist['epoch'], hist['mse'],'r--',
           label='Training Error')
  # plt.plot(hist['epoch'], hist['val_mse'],'b',
  #          label = 'Validation Error')
  plt.ylim([0,0.5])
  plt.axhline(y=0.235, color='b', linestyle='-')
  plt.legend()
  plt.show() # un €

# normaliza un conjunto de datos
def norm(x, st):
    return((x - st['mean'])/st['std'])

In [None]:
# Cargamos los datos desde mi Github (mcstllns/UNIR2024)

url = 'https://raw.githubusercontent.com/mcstllns/UNIR2024/main/data-happiness.csv'
data  = pd.read_csv(url)
print(data.keys())
data.head()



In [None]:
# El fichero tiene datos perdidos y hay que eliminar las filas
data = data.dropna()


In [None]:
# Creamos los dos conjuntos de datos x son los datos de entrada (variables predictoras) e y es la variable criterio (Ladder)

x = data.drop('Life.Ladder', axis=1)
y = data['Life.Ladder']

print(x.head())
print(y.head())

Construimos la red neuronal, para construirla se siguen los siguientes pasos:

1. Definimos la estructura del modelo con el numero de capas y neuronas que deseemos
1. Compilamos el modelo definiendo la función de pérdida, el algoritmo de aprendizaje y la métrica del ajuste
1.  Iniciamos el ajuste del modelo definiendo el número de épocas (iteraciones) que vamos a calcular

In [None]:
# Modelo --------------------------


# Configuramos la topología

model = Sequential()
model.add(Input(shape=(len(x.keys()),)))
model.add(Dense(4, activation = 'relu'))
# model.add(Dense(64, activation = 'relu'))
model.add(Dense(1, activation = 'linear'))

# summarize layers
print(model.summary())


In [None]:
# normalizamos x para un mejor rendimiento

# x_stats = x.describe().transpose()
# x_norm = norm(x, x_stats)
# x_norm.describe().transpose()

In [None]:
# Compilamos el modelo, definimos los hiperparámetros
#  - Función de pérdida: mse
#  - Algoritmo de aprendizaje: Adam con lr = 0.001
#  - Métricas: mse

model.compile(loss='mse',
              optimizer = tf.keras.optimizers.Adam(learning_rate = 0.001),
              metrics = ['mse'])

In [None]:
history = model.fit(x, y,
                    # x_norm, y,
                    epochs = 200,
                    verbose = 1
                    ) # para evitar que se llene toda la pantalla

In [None]:
# Evaluamos el modelo con el conjunto de validacion
model.evaluate(x,
               # x_norm,
               y)

In [None]:
plot_history(history)