### Importamos las librerias y funciones que necesitaremos.

In [1]:
import torch
import torch.nn as nn
from torch.utils.data import DataLoader
from sklearn.model_selection import train_test_split
import numpy as np
import sys
import os
import random
import Modelos
import set_dataset as ds
import verificacion as ver
import plots

ModuleNotFoundError: No module named 'torch'

### Fijamos la semilla

Esto es importante para lograr la reproducibilidad de los experimentos que realicemos, y que no sea un factor de incertidumbre.

In [None]:
Modelos.define_seed(seed=1029)
device = 'cuda' if torch.cuda.is_available() else 'cpu'

Definimos las variables que utilizaremos como entrada (Input) y objetivo (Target) en la red neuronal que utilicemos

Las variable de Input es ctt (Temperatura de tope de nube, [K])

Las variable de Target es rainrate (Tasa de lluvia, [mm/h]) 

In [None]:
Input_name =  "ctt"
Target_name = "rainrate"
Experimento = Input_name+" vs "+ Target_name

### Hiperparametros

Los hiperparametros son definidos, generalmente de forma manual(*), y que determina el entrenamiento de los modelos. En cambio un parametro, es estimado en el entrenamiento.

(*) Existen algoritmos que buscan la optimización de los hiperparametros en un proceso conocido como "selección de modelos". En este curso no entraremos en detalles sobre este punto, pero es importante que conozcan que existe, entre los más usuales se encuentran:

Grid Search - https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html

Random Search - https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.RandomizedSearchCV.html

HyperOpt - https://hyperopt.github.io/hyperopt/
Su paper: https://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.704.3494&rep=rep1&type=pdf

Auto Machine Learning (AutoML) - https://www.automl.org/automl/


In [None]:
Numero_exp = 3 #Una forma de identificar la configuración que utilizamos
device = 'cuda' if torch.cuda.is_available() else 'cpu'

#Hiperparametros
batch_size= 100
max_epochs = 50
learning_rate = 1e-3 ; milestones = [20,40] ; gamma=0.5
weight_decay = 1e-5

#Porcentaje de reparticion de los conjuntos de Train / Validation / Testing
train_ratio = .8
validation_ratio = .1
test_ratio = .1

### Data Augmentation

Es un recurso para aumentar de manera artificial los datos con los cuales entrenamos la red neuronal. Existen diferentes metodologías para llevarlo a cabo, por ejemplo a la imagen original rotarla o añadirle un ruido, que altera suavemente a la imagen, generando una imagen nueva, pero que conserve sus características. En este caso, se deja la opción realizar un data augmentation con rotación alrededor del eje horizontal, vertical y de ambos, de esta forma por cada imagen perteneciente al entrenamiento, se generaran 3 imagenes adicionales, lo cual cuadriplica el tamaño del dataset de entrenamiento.

In [None]:
Data_Aug = False

### Lectura de los datos y DataLoader

In [None]:
Data = ds.get_data("../DATA/datos_WRF_300.npz", Input_name, Target_name) #Levantamos los datos
nx, ny = Data["nx"], Data["ny"] #Obtenemos las dimensiones de las imagenes
dataset = ds.set_up_data(Data) #Esta función permite permite dejar los datos listos para ser utilizados por el DataLoader

#Mostramos por pantalla el rango de los datos de Input y Target
print(dataset.xmin,dataset.xmax,dataset.ymin,dataset.ymax)

indices = range(dataset.y_data.shape[2]) #Con el largo del dataset cuento cuantos hay y genero un vector de indices

train_ids, rest_ids = train_test_split(indices, test_size=1 - train_ratio)
val_ids, test_ids = train_test_split(rest_ids, test_size=test_ratio/(test_ratio + validation_ratio)) 

if Data_Aug:
    #Genero el dataset de entrenamiento con data augmentation
    train_aug_dataset = ds.augment_data(dataset.x_data[:,:,train_ids],dataset.y_data[:,:,train_ids])
    train_aug_dataset = ds.set_up_data(train_aug_dataset) #Enchufo el dataset con augmentation
    trainloader = DataLoader(train_aug_dataset, batch_size=batch_size)          
else:
    #Dataset de entrenamiento sin data augmentation
    train_subsampler = torch.utils.data.SubsetRandomSampler(train_ids)
    trainloader = DataLoader(dataset, batch_size=batch_size, sampler=train_subsampler)
    
test_subsampler = torch.utils.data.SubsetRandomSampler(test_ids)
testloader = DataLoader(dataset, batch_size=batch_size, sampler=test_subsampler)
        
val_subsampler = torch.utils.data.SubsetRandomSampler(val_ids)
valloader = DataLoader(dataset, batch_size=batch_size, sampler=val_subsampler)

dataloaders = {
            'train' : trainloader,
            'valid' : valloader,
            'test' : testloader
            }

print("Muestras de Train/Valid/Test: ",(len(train_ids),len(val_ids),len(test_ids)))


### Definimos el modelo a utilizar

In [None]:
class RNA(nn.Module):
    def __init__(self, nx, ny):
        super().__init__()
        #Con el _init_ definimos los atributos de la clase que estamos definiendo
        #El super() nos permite utilizar la clase y atributos a partir de usar explicitamente su nombre
        self.nx, self.ny, self.dim = nx, ny, nx*ny
        self.Linear_1 = nn.Linear(int(self.dim), int(self.dim/2), bias=True)
        self.Linear_2 = nn.Linear(int(self.dim/2), int(self.dim), bias=True)
        self.activation = nn.Tanh()
    
    def forward(self, x):
        batch = x.shape[0]
        x = x.view(batch,self.nx*self.ny)
        x= self.Linear_1(x)
        x = self.activation(x)
        x= self.Linear_2(x)
        x = x.view(batch,self.nx,self.ny)
        return self.activation(x)

model = RNA(nx = nx, ny = ny)
model.to(device) #De existir GPU se computaría por allí

In [None]:
#Path donde guardaremos las salidas del modelo
Directorio_out = "../salidas_RNA"+"/"+Experimento+" "+str(Numero_exp)+"/" #Ver como crear directorio
 
if not os.path.exists(Directorio_out):
    # Creao un nuevo directorio si no existe (para guardar las imagenes)
    os.makedirs(Directorio_out)
    print("El nuevo directorio asociado a "+ Experimento +" "+str(Numero_exp)+" ha sido creado!")

### Otras configuraciones: Función de costo, Optimizador e Inicialización de pesos.

Estrictamente lo siguiente que definiremos son hiperparametros también. Ya que son configuraciones que definimos en la etapa de pre-entrenamiento, y son sumamente importantes porque configuran el objetivo y forma de entrenamiento. 

A partir del algoritmo de **_Backprogation_** se propagara el costo(loss) y se imputará sobre los parámetros (pesos y bias) de la red neuronal.

El **_Optimizador_** es el método de actualización de los pesos en cada época.

Los pesos se actualizaran siguiendo la idea del algoritmo de descenso del gradiente, donde la función a minimizar es la **_Función de costo (Loss Function)_** que definimos.

El "punto de partida" de los parametros a optimizar para la minimización de la Función de costo, está dada por la **_distribución inicial de los pesos_**. La cual es importante considerar debido a que puede colaborar a lograr una rápida convergencia de la red neuronal hacia el mínimo global de la función de costo (de encontrarse) o por el contrario atentar contra esto y requerir un mayor número de eṕocas para lograr la convergencia.



In [None]:

#Definimos la función de costo que queremos minimizar, y también el método de calculo sobre el batch.
MSE_Loss = torch.nn.MSELoss(reduction='mean')

#Definimos el optimizador
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate, weight_decay=weight_decay) 

Modelos._initialize_weights(model) #Definimos los pesos iniciales con los cuales inicia el modelo antes de entrenarlo

#Definimos el Scheduler para el Learning Rate
scheduler = torch.optim.lr_scheduler.MultiStepLR(optimizer, milestones = milestones, gamma = gamma, verbose = True)

In [None]:
#Listas donde guardamos las metricas y la loss para cada conjunto
RMSE, BIAS, Corr_P, Corr_S = [], [], [], []
loss_train, loss_val, loss_test = [], [], []

### Entrenamiento de la Red Neuronal Artificial

In [None]:
for epoch in range(max_epochs):
    print('Epoca: %d ' % (epoch))
            
    for phase in ['train', 'valid', 'test']:
        print(phase)
        if phase == 'train':
            model.train()
        else:
            model.eval()

        running_loss = 0.0
        batch_counter = 0

        # Iterate over data
        for inputs, labels in dataloaders[phase]:
            inputs, labels = inputs.to(device), labels.to(device)

            optimizer.zero_grad()
                
            if phase == 'train':
                outputs = model(inputs)
            else:
                with torch.no_grad():
                    outputs = model(inputs)

            loss = MSE_Loss(outputs.float(), labels.float())
                    
            if phase == 'train':
                loss.backward()
                optimizer.step()
                    
            running_loss += loss.item()

            if phase == 'test':
                if batch_counter == 0:
                    target_test = ds.denorm(labels.float(),dataset.ymin,dataset.ymax)
                    modelo_test = ds.denorm(outputs,dataset.ymin,dataset.ymax)
                else:
                    target_test = np.append(target_test,ds.denorm(labels.float(),dataset.ymin,dataset.ymax),axis=0)
                    modelo_test = np.append(modelo_test,ds.denorm(outputs,dataset.ymin,dataset.ymax),axis=0)
                
                if epoch == max_epochs-1:
                    if batch_counter == 0:
                        input_test = ds.denorm(inputs,dataset.xmin,dataset.xmax)
                    else:
                        input_test = np.append(input_test, ds.denorm(inputs,dataset.xmin,dataset.xmax), axis = 0)
            batch_counter += 1
            
        if phase == 'train':
            scheduler.step()

        #Calculo de la loss de la epoca
        if phase == 'train':
            loss_train_epoch = running_loss/batch_counter
            loss_train.append(loss_train_epoch)
            print('Loss: %f' %(loss_train_epoch))
        if phase == 'valid':
            loss_val_epoch = running_loss/batch_counter
            loss_val.append(loss_val_epoch)
            print('Loss: %f' %(loss_val_epoch))
        if phase == 'test':
            loss_test_epoch = running_loss/batch_counter
            loss_test.append(loss_test_epoch)
            print('Loss: %f' %(loss_test_epoch))
            
###################################
    #Calculo de metricas RMSE, BIAS, Correlacion de Pearson y Spearman
    metricas = [ver.rmse(modelo_test,target_test),
                ver.bias(modelo_test,target_test),
                ver.corr_P(modelo_test,target_test),
                ver.corr_S(modelo_test,target_test)]

    #Guardo la loss para cada Fold y Epoca        
    RMSE.append(metricas[0]) ; BIAS.append(metricas[1]), Corr_P.append(metricas[2]), Corr_S.append(metricas[3])


### Ploteamos y evaluamos el conjunto de Testing

In [None]:
Muestras = random.sample(range(len(test_ids)),10)
plots.plotting(Directorio_out, input_test, target_test, modelo_test,
                loss_train, loss_val, loss_test, 
                RMSE,BIAS,Corr_P, Corr_S,
                Experimento, Input_name, Target_name,
                max_epochs, Muestras, nx ,ny)

### Guardando el modelo, y los datos de Testing 

In [None]:
if True:
    model.load_state_dict(torch.load(Directorio_out+"Modelo_exp_"+str(Numero_exp)+".pth"))


if True: #Guardar los datos de test
    np.savez(Directorio_out+"Datos_test_"+Input_name+"_vs_"+Target_name+"_"+str(Numero_exp)+".npz",
         Input=input_test.reshape(input_test.shape[0],nx,ny),
         Target=target_test.reshape(target_test.shape[0],nx,ny),
         Modelo=modelo_test.reshape(modelo_test.shape[0],nx,ny),
         loss_train = loss_train, loss_val = loss_val, loss_test = loss_test,
         RMSE = RMSE, BIAS = BIAS, Corr_P = Corr_P, Corr_S = Corr_S,
         Experimento = Experimento, Input_name = Input_name, Target_name = Target_name,
         max_epochs = max_epochs, nx = nx, ny = ny)