# Entrenamiento

In [3]:
#Librerías Base
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from google.colab import drive

#Librerías de Métricas
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.preprocessing import MinMaxScaler

#Librerías de Machine Learning
from keras.models import Sequential
from keras.layers import Dense
from tensorflow.keras.optimizers import Adam, SGD
from keras.utils.np_utils import to_categorical

#Accedemos a Google Drive
drive.mount('/content/drive')

#Trabajaremos con un dataset que clasifica flores según sus características
#Tiene los siguientes campos:
# - sepal_length: Longitud del sépalo
# - sepal_width: Ancho del sépalo
# - petal_length: Longitud del pétalo
# - petal_width: Ancho del pétalo
# - species: Tipo de flor de iris (setosa, versicolor, virginica)
df = pd.read_csv('/content/drive/MyDrive/Data/iris.csv')
df

#Seleccionamos las columnas con las que trabajaremos
df = df[['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']]
df

#Eliminamos valores nulos
df = df.dropna()
df

#Definimos los features (x), es decir los datos que nos ayudan a predecir
dfx = df[['sepal_length', 'sepal_width', 'petal_length', 'petal_width']]
dfx

#Obtenemos la matriz de features
x = dfx.values
x

#Definimos los labels (y), es decir el dato que se predice
#En este caso es una variable categórica
df['species'].unique()

#Le daremos una representación numérica a cada dato
representacion = {
    'setosa' : 0,
    'versicolor' : 1,
    'virginica' : 2,
}

representacion

#Luego mapeamos los valores de "Y" por su representación numérica
dfy = df['species'].map(representacion)
dfy

#Creamos tres columnas de salidas, una para cada categoría
y = to_categorical(dfy)
y

#Dividimos los datos en datos de entrenamiento (x_train, y_train) y datos de validación (x_test, y_test)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2)

#Features de entrenamiento
x_train

#Instanciamos el escalador
sc = MinMaxScaler()

#Aplicamos el escalador con los datos
x_train = sc.fit_transform(x_train)
x_train

#Labels de entrenamiento
y_train

#Features de validación
x_test

#Aplicamos el escalador con los datos
x_test = sc.transform(x_test)
x_test

#Labels de validación
y_test

#Instaciamos un modelo de machine learning vacío con "Sequential"
model = Sequential()

#Agregamos la primera capa de:
# - 3 neuronas
# - 4 inputs
model.add(Dense(3, input_shape=(4,), activation='tanh'))

#Agregamos la segunda capa de:
# - 2 neuronas
model.add(Dense(2, activation='tanh'))

#Como es un problema de clasificación multiclase, la última capa tendrá 3 neuronas, una para cada clase
#Como estamos frente a un problema de clasificación multi-clase, la F.A. más adecuada es la "softmax"
model.add(Dense(3, activation='softmax'))

#Vemos un resumen del modelo
model.summary()

#Compilamos el modelo indicando el tipo de error con el que se calcula la solución
#Como es un modelo de regresión logística, usaremos la función "categorical_crossentropy"
model.compile(Adam(lr=0.1), loss='categorical_crossentropy', metrics=['accuracy'])

#Entrenamos el modelo enviándole los features (x_train) y labels (y_train) de entrenamiento
#Configuramos el número de iteraciones (40)
model.fit(x_train, y_train, epochs=100, validation_split=0.1)

#Con los features (x_train) que usamos para entrenar el modelo, realizamos las predicciones (y_train_prediccion)
y_train_prediccion = model.predict(x_train)
y_train_prediccion.round(3)

#Obtenemos la cateogoría con mayor probabilidad
y_train_prediccion_categorico = np.argmax(y_train_prediccion, axis = 1)
y_train_prediccion_categorico

#Hay tres salidas, debemos quedarnos con los índices máximos
y_train

#Categorizamos la data de test
y_train_categorico = np.argmax(y_train, axis = 1)
y_train_categorico

#Imprimos la matriz de confusión
accuracy_score(y_train_categorico, y_train_prediccion_categorico)

#Con los features (x_test) que no usamos para entrenar al modelo, realizamos las predicciones (y_test_prediccion)
y_test_prediccion = model.predict(x_test)
y_test_prediccion.round(3)

#Obtenemos la cateogoría con mayor probabilidad
y_test_prediccion_categorico = np.argmax(y_test_prediccion, axis = 1)
y_test_prediccion_categorico

#Hay tres salidas, debemos quedarnos con los índices máximos
y_test

#Categorizamos la data de test
y_test_categorico = np.argmax(y_test, axis = 1)
y_test_categorico

#Calculamos el error
#INTERPRETACIÓN: El modelo al ser usado en un entorno productivo, de 100 casos acertará en 80 y se equivocará en 20 casos
accuracy_score(y_test_categorico, y_test_prediccion_categorico)

#El modelo tiene un alto porcentaje de reconocimiento de patrones en los datos (81.25%)
#El modelo tiene un alto porcentaje de aciertos en nuestras predicciones (80.00%)
#La diferencia entre el porcentaje de reconocimiento de patrones (81.25%) y el porcentaje de aciertos (80.00%) es pequeña (1.25%)
#Como la diferencia es pequeña, estamos frente a un modelo que representa y predice muy bien la realidad de negocio
#Es un modelo que podemos usar en un entorno real de producción

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_3 (Dense)              (None, 3)                 15        
_________________________________________________________________
dense_4 (Dense)              (None, 2)                 8         
_________________________________________________________________
dense_5 (Dense)              (None, 3)                 9         
Total params: 32
Trainable params: 32
Non-trainable params: 0
_________________________________________________________________


  "The `lr` argument is deprecated, use `learning_rate` instead.")


Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

0.9666666666666667

# Almacenamiento de modelo

In [4]:
#Almacenamos el modelo entrenado
#El formato H5 significa "HDF5": Hierarchical Data Format v5.0
#Soporta almacenamiento de modelos n-dimensionales (p.e., tensores) y es compatible con plataformas de Big Data
model.save('/content/drive/MyDrive/Data/modelo.h5')

In [5]:
#También deberemos almacenar el escalador para des-escalar cuando el modelo sea usado
#Creamos la estructura del archivo y colocamos los objetos que necesitamos
#También guardamos la metadata que necesitemos, por ejemplo los nombres de las categorías
dataset = {}
dataset['scaler'] = sc
dataset['categories'] = ['setosa', 'versicolor', 'virginica']
dataset_numpy = np.array(dataset)

In [6]:
#Almacenamos el archivo
np.savez('/content/drive/MyDrive/Data/metadata', dataset_numpy)

# Lectura del modelo

In [7]:
#Importamos la librería para leer modelos
from keras.models import load_model

In [8]:
#Leemos el modelo
modelLeido = load_model('/content/drive/MyDrive/Data/modelo.h5')

In [9]:
#Leemos el archivo de metadata
metadataLeida = np.load('/content/drive/MyDrive/Data/metadata.npz', allow_pickle=True)

In [10]:
#Extraemos el escalador
scLeido = metadataLeida['arr_0'][()]['scaler']
scLeido

MinMaxScaler(copy=True, feature_range=(0, 1))

In [11]:
#Extraemos la metadata
categoriasLeida = metadataLeida['arr_0'][()]['categories']
categoriasLeida

['setosa', 'versicolor', 'virginica']

# Uso del modelo leído

In [12]:
#Definimos los features para la predicción en un array
x = [5.1, 3.5, 1.4, 0.2]
x

[5.1, 3.5, 1.4, 0.2]

In [13]:
#Aplicamos el modelo para obtener la predicción
#Colocamos los features como un array, ya que podemos enviarle más de un registro a la vez
y = modelLeido.predict([x])
y

array([[0.3256606 , 0.6711741 , 0.00316529]], dtype=float32)

In [14]:
#Como es un modelo multi-clase, extraemos la posición máxima
indice_max = y.argmax()
indice_max

1

In [15]:
#De la metada leída, verificamos a qué cateogoría corresponde
categoria_prediccion = categoriasLeida[indice_max]
categoria_prediccion

'versicolor'