Regresion Logística con Keras

En este ejercicio, tu objetivo será entrenar modelos de Regresión Logística utilizando Keras (y Tensorflow como backend) para familiarizarte con la librería.



In [None]:
%matplotlib notebook
import matplotlib.pyplot as plt
!pip install -q rnutil
import rnutil

# Entrena un modelo de Regresión Logística con Keras para varios datasets



Podés elegir el dataset comentando/descomentando las líneas 9 a 17. Comentá todos los datasets salvo el que quieras usar.

Intenta obtener una buena performance en todos los casos. Prueba activando o no la normalización (últimas líneas) ¿Qué datasets no puede aprender el modelo?

In [None]:
import numpy as np

# Selección del dataset; descomenta el que quieras usar
# Datasets en 2D
dataset = "2_clases_simple.csv"
#dataset = "6_clases_dificil.csv"
#dataset = "moons.csv"
#dataset = "moons_mis-scaled.csv"
# dataset = "circulos.csv"

# Dataset con más de 2 dimensiones
# dataset = "iris.csv"
# dataset = "diabetes.csv"

# Carga del dataset

data=rnutil.load_dataset_numpy(dataset)
x,y=data[:,0:-1],data[:,-1]
# cantidad de ejemplos y dimension de entrada
n,d_in=x.shape
# calcula la cantidad de clases
classes=int(y.max()+1)

print("Información del conjunto de datos:")
print(f"Ejemplos: {n}")
print(f"Variables de entrada: {d_in}")
print(f"Cantidad de clases: {classes}")

# Normalizo las variables de entrada
for i in range(d_in):
    x[:,i]=(x[:,i]-x[:,i].mean())/x[:,i].std()

In [None]:
from tensorflow import keras

# Creación del modelo inicial
print("Inicialización aleatoria del modelo (podes volver a correr esta celda para obtener otros resultados)")

# Creo un modelo logístico
modelo = keras.Sequential([
    # la activación softmax hace que la salida sean probabilidades
    keras.layers.Dense(classes,input_shape=(d_in,), activation='softmax')])

# visualización del modelo inicial (si hay solo 2 variables de entrada)
if d_in==2:
    rnutil.plot_fronteras_keras(modelo,x,y,title=f"Modelo inicial",detail=0.05)



modelo.compile(
  optimizer=keras.optimizers.SGD(learning_rate=0.001), 
  loss='sparse_categorical_crossentropy', 
  # metricas para ir calculando en cada iteracion o batch 
  # Agregamos el accuracy del modelo
  metrics=['accuracy'], 
)

# Entrenamiento del modelo
history = modelo.fit(x,y,epochs=100,batch_size=16,verbose=False)
rnutil.plot_loss_accuracy_keras(history)

# visualización del modelo final (si hay solo 2 variables de entrada)
if d_in==2:
    rnutil.plot_fronteras_keras(modelo,x,y,title=f"Modelo Final",detail=0.05)