  # Ejercicio 3.3.1. 
  Estimar con RNF la riqueza de especies de aves invernantes a partir de predictores ambientales, 
  
  a) Optimizar el nº de épocas con checkpoint_callback; 
  
  b) Inferir la riqueza de especies esperable en una nueva localidad (NvLoc). 

In [60]:
import matplotlib.pyplot as plt
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import ModelCheckpoint
import warnings
import pandas as pd
import numpy as np 
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
np.random.seed(3)
import os 
os.chdir('/home/rsoriano/CursoML3/Numspc/')
warnings.filterwarnings('ignore')

In [12]:
Numspc = pd.read_csv('Numspc.csv')
display(Numspc.columns)
data = Numspc.copy()
display(data.head())

Index(['nspp', 'altmed', 'rangoalt', 'shannon', 'tempmin', 'precip'], dtype='object')

Unnamed: 0,nspp,altmed,rangoalt,shannon,tempmin,precip
0,46,310,399,0.93,5.2,128.1
1,36,713,39,1.42,1.6,156.4
2,46,606,1151,2.45,2.1,456.0
3,36,446,330,1.25,5.1,393.5
4,51,342,167,1.37,3.2,272.5


In [45]:
# dividir en train & test data
 # no se preselecciona valdata porque se hace con validation_split = 0.2 en history
 # hay que hacerlo cuando los datos están estructurados para que sean independientes 
 # de los de entrenamiento
X = data.drop(axis=1, columns = ['nspp'])
y = data[['nspp']]
X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.2, random_state=3)

In [53]:
scaler = StandardScaler()
scaler.fit_transform(X_train)

array([[-0.95357352, -0.11819104,  0.44507034,  0.83461717, -0.26003059],
       [-1.46801817, -0.7920888 , -2.17229407,  1.78005017,  0.63995085],
       [ 0.79350085,  1.8226345 ,  1.24882792,  0.01250151,  1.69379615],
       ...,
       [ 0.42676804, -0.47400905,  1.0633454 ,  0.42355934, -1.16611774],
       [-0.33216515, -0.64922247, -0.0495497 , -0.19302741, -0.84556804],
       [-0.7829409 , -0.58452829, -0.33807806,  0.21803042, -0.45480269]])

In [57]:
# Antes se crea una función (no es imprescindible) para poder 
# renovar el modelo con facilidad en cada nueva prueba

def build_model():
    # Se crea un objeto "modelo secuencial" que alojará una pila lineal 
    # de capas en el orden que uno quiera
    model = Sequential()
    
    # Se crean 2 capas ocultas densas (totalmente conectadas porque son FFNN)  
    # con 64 neuronas cada una, cuya FdA es ReLU. 
    
    # En la 1ª se indican las dimensiones del tensor de entrada, dim(traindatax)
    # (799 muestras X 5 CCS), pero se excluye el nº de muestras (799)
    model.add(Dense(units=64, activation='relu', input_shape=(X_train.shape[1],)))

    model.add(Dense(units=64, activation='relu'))

    # Se crea una capa de salida que no tiene FdA porque es regresión
    # units = 1 porque esperamos un solo valor
    model.add(Dense(units=1))

    # Tipo de optimizador Adam y TdA (learning_rate)    
    optimizer = Adam(learning_rate=0.001)

    # La función compile() sirve para configurar el proceso de aprendizaje del modelo.
    # loss = "mse" => La FdP que el algoritmo trata de minimizar.
    # metrics = ["mae"] => una o más metricas para monitorizar el rendimiento 
    # Se obtiene la evolución de loss y metrics sobre las muestras de entrenamiento 
    # (loss y metric) y sobre las muestras de validación (val_loss y val_metrica)
    model.compile(optimizer=optimizer, loss="mse", metrics=["mae"])

    return model

In [58]:
model = build_model()  # se crea el modelo

In [61]:
# Para que guarde automáticamente el mejor modelo (save_best_only = True),
# de acuerdo con la métrica indicada en monitor, val_loss en este caso.
checkpoint = ModelCheckpoint(
    filepath='best_model_NSpc.h5',  # Ubicación donde guardar el modelo
    monitor='val_loss',  # Métrica para indentificar el mejor modelo. Puede ser también 'val_metrica'
    save_best_only=True,  # Guarda solo el modelo que tiene el menor valor de monitor
    verbose=1
)

In [66]:
history = model.fit(
    X_train,            # Conjunto de entrenamiento (features)
    y_train,            # Etiquetas del conjunto de entrenamiento
    epochs=500,         # Número de épocas (iteraciones completas sobre el conjunto de entrenamiento)
    batch_size=16,       # Tamaño del lote (número de ejemplos de entrenamiento utilizados en una iteración)
    validation_split=0.2, # Porcentaje de datos de entrenamiento a utilizar como conjunto de validación
    callbacks=[checkpoint]  # Lista de objetos de callback a aplicar durante el entrenamiento
)

Epoch 1/500
Epoch 1: val_loss improved from inf to 850.96796, saving model to best_model_NSpc.h5
Epoch 2/500
Epoch 2: val_loss improved from 850.96796 to 655.91180, saving model to best_model_NSpc.h5
Epoch 3/500
Epoch 3: val_loss improved from 655.91180 to 627.41553, saving model to best_model_NSpc.h5
Epoch 4/500
Epoch 4: val_loss improved from 627.41553 to 621.07068, saving model to best_model_NSpc.h5
Epoch 5/500
 1/40 [..............................] - ETA: 0s - loss: 329.4783 - mae: 15.4421
Epoch 5: val_loss improved from 621.07068 to 591.15930, saving model to best_model_NSpc.h5
Epoch 6/500
Epoch 6: val_loss improved from 591.15930 to 577.23395, saving model to best_model_NSpc.h5
Epoch 7/500
Epoch 7: val_loss did not improve from 577.23395
Epoch 8/500
Epoch 8: val_loss improved from 577.23395 to 566.24274, saving model to best_model_NSpc.h5
Epoch 9/500
 1/40 [..............................] - ETA: 0s - loss: 526.6134 - mae: 17.9228
Epoch 9: val_loss did not improve from 566.24274
E