Regresion Logística con Keras

En este ejercicio, tu objetivo será entrenar modelos de Regresión Logística utilizando Keras (y Tensorflow como backend) para familiarizarte con la librería.



In [None]:
%load_ext autoreload
%autoreload 2
%matplotlib 
import matplotlib.pyplot as plt
import utils

# Entrena un modelo de Regresión Logística con Keras para el dataset de estudio 2D

El siguiente código carga un dataset de prueba con 2 dimensiones de entrada y una de salida.

Luego crea un modelo de regresión logística con Keras, y visualiza sus pesos iniciales. 

Es importante notar tres cosas:

1. La métrica utilizada es `'sparse_categorical_crossentropy'`, es decir la entropía cruzada. Esta es la misma métrica vista en la teoría de Regresión Logística Múltiple.

2. El optimizador es una clase que define el algoritmo para minimizar el error cuadrático. En general, son todas variantes de descenso de gradiente. En este caso, estamos utilizando descenso de gradiente estocástico (`keras.optimizers.SGD`), que es igual al descenso de gradiente pero realiza cada actualización de los parámetros con un subconjunto de los ejemplos del dataset. 

3. El método para entrenar el modelo es `fit`. En este caso, el parámetro `lr` lo recibe el optimizador, pero `fit` recibe la cantidad de iteraciones (`epochs`) y el tamaño del batch para el SGD (`batch_size`).


Al finalizar el entrenamiento, observá los valores del vector de pesos `w`. ¿A qué atributo o variable de entrada le da más importancia el modelo?


In [None]:
import tensorflow as tf
import keras
import numpy as np
import utils 

# Carga del dataset
import os
dataset_path=os.path.join("datasets_clasificacion","study_logistic_2d.csv")


data=np.loadtxt(open(dataset_path, "rb"), delimiter=",", skiprows=1)
x,y=data[:,0:2],data[:,2]
# cantidad de ejemplos y dimension de entrada
n,d_in=x.shape


# calcula la cantidad de clases
classes=int(y.max()+1)

print("Información del conjunto de datos:")
print(f"Ejemplos: {n}")
print(f"Variables de entrada: {d_in}")
print(f"Cantidad de clases: {classes}")




# Creación del modelo logítico
print("Inicialización aleatoria del modelo (podes volver a correr esta celda para obtener otros resultados)")
# Creo un modelo lineal
modelo = keras.Sequential([
    # la activación softmax hace que la salida sean probabilidades
    keras.layers.Dense(classes,input_shape=(d_in,), activation='softmax')])

# visualización del modelo inicial
utils.plot_regresion_logistica2D(modelo,x,y,title="Modelo inicial")


modelo.compile(
  optimizer=keras.optimizers.SGD(lr=0.001), 
  loss='sparse_categorical_crossentropy', 
  # metricas para ir calculando en cada iteracion 
  # Agregamos el accuracy del modelo
  metrics=['accuracy'], 
)

# Entrenamiento del modelo
modelo.fit(x,y,epochs=1000,batch_size=16)

# visualiza el modelo y los datos
w,b=modelo.get_weights()
print(f"w: {w}, b: {b}")
utils.plot_regresion_logistica2D(modelo,x,y,title="Modelo Final")





# Reentrenamiento con otro optimizador

En la mayoría de los casos, el modelo no converge adecuadamente, aún cambiando la tasa de aprendizaje. Podemos utilizar el optimizador [Adam](https://arxiv.org/abs/1412.6980) que logra que el modelo converja aún cuando `SGD` no puede.






In [None]:
modelo = keras.Sequential([
    # la activación softmax hace que la salida sean probabilidades
    keras.layers.Dense(classes,input_shape=(d_in,), activation='softmax')])

modelo.compile(
  optimizer='adam', # Cambiamos el optimizador a ADAM
  loss='sparse_categorical_crossentropy', 
  metrics=['accuracy'], 
)

# Entrenamiento del modelo
modelo.fit(x,y,epochs=1000,batch_size=16)

utils.plot_regresion_logistica2D(modelo,x,y,title="Modelo Final con Adam")
w,b=modelo.get_weights()
print(f"w: {w}, b: {b}")


# Entrenamiento con normalización de los datos

Una mejor opción para lograr que el modelo converja es normalizar los datos de entrada. En este caso vemos como dicha normalización permite que el modelo siempre converja. 


Implementa la normalización media/desviación estándar de los datos de la variable x_norm, que es una copia de x.


Al finalizar el entrenamiento, observá los valores del vector de pesos `w`. ¿A qué atributo o variable de entrada le da más importancia el modelo? ¿Cambió con la normalización?

In [None]:
x_norm=x.copy()
# Normalizacion mu/std de los datos de entrada
# TODO
for i in range(d_in):
    # normalizo la columna i restando su media y dividiendo por su desv. est.
    pass
# fin TODO


    
modelo = keras.Sequential([
    # la activación softmax hace que la salida sean probabilidades
    keras.layers.Dense(classes,input_shape=(d_in,), activation='softmax')])



utils.plot_regresion_logistica2D(modelo,x_norm,y,title="Modelo Inicial")

modelo.compile(
  optimizer=keras.optimizers.SGD(lr=0.001), 
  loss='sparse_categorical_crossentropy', 
  metrics=['accuracy'], 
)

# Entrenamiento del modelo
modelo.fit(x_norm,y,epochs=1000,batch_size=16)

# visualiza el modelo y los datos

utils.plot_regresion_logistica2D(modelo,x_norm,y,title="Modelo Final")
w,b=modelo.get_weights()
print(f"w: {w}, b: {b}")