# WIKI

A continuación, se va a explicar cada sección del proyecto, en el que se va a entrar en detalle en cada una de las secciones principales, 
explicando que hace cada script y la funcionalidad que tiene cada uno de ellos.

Este apartado se divide en las siguientes secciones:

1. Carga_datos

2. Estandarización_datos
3. Models 
4. Train
5. Predict

## <u>Carga_datos</u>

En esta seccion, se va a hablar de como los datos se llevan al repositorio de origen al repositorio de donde se cogeran los datos para comenzar a tratarlos.

### cp_imgs.py

In [None]:
def copy_imgs(src_dir, dest_dir, extensions=("*.jpg", "*.jpeg", "*.png")):
    """
    Esta función lleva a cabo el proceso de carga de todos los datos requeridos por el proyecto esquema_train

    Parameters
    ----------
        - src_dir : (string). Ruta de donde vienen las imágenes.
        - dest_dir : (string). Ruta donde se copiarán las imágenes.
        - extensions : (tuple). Tipos de imagenes que se quieren recoger. 

    Returns
    -------
        - Las imagenes copiadas en el directorio que se queria.
    """
    

    try:
        lg.debug(cpimg,'Iniciando el proceso de carga_datos...')
        
        if not os.path.exists(src_dir):
            print(f"Source directory {src_dir} does not exist.")
            return
        
        if not os.path.exists(dest_dir):
            os.makedirs(dest_dir)

        for ext in extensions:
            for filename in glob.glob(os.path.join(src_dir, ext)):
                shutil.copy(filename, dest_dir)
        
        lg.debug(cpimg,'Finalizado el proceso copy_imgs sin errores...')
        
    except Exception as e: 
        lg.error(cpimg,f'Error en la función copy_imgs .... Error: {e}')
        sys.exit(1) #cerrando el proceso..

La función ***"copy_imgs"*** tiene como objetivo copiar la imagenes desde un directorio "fuente" y copiarlas a un directorio de destino.

Esta función dispone de 2 argumentos obligatorios y 1 opcional:

1. **src_dir**: Este argumento de tipo <u>String</u> es la ruta del directorio "fuente".

2. **dest_dir**: Este argumento de tipo <u>String</u> es la ruta del directorio donde se quieren que se copien las imágenes.

3. **extensions**: Este argumento de tipo <u>Tuple</u> son los tipos de imágenes que se quieren que se tengan en cuenta a la hora de copiar las imágenes. Por defecto, las imágenes en formato
".jpg", ".jpeg" y ".png" serán las que se escojan.

En primer lugar, la función comprueba si el directorio de origen existe. En caso de que este no exista, se printeará por pantalla y se saldrá de la función.

En segundo lugar, la función comprueba si el directorio de destino existe. En caso que no exista, se creará y seguirá.

Por último, tendremos 2 bucles:

1. Para las extensiones que se van a tener en cuenta

2. Para los nombres que coinciden dentro del directorio de origen.

Finalmente, dentro de los bucles, se copian las imágenes al directorio de destino.

### main_carga_datos.py

In [None]:
def carga_datos():
    """
    Se busca copiar las imagenes a un directorio alternativo a uno estandarizado dentro de la empresa 
    y facilitar el uso de los datos para producción.
    """
    
    try:
        lg.debug(crd,'Iniciando el proceso de carga_datos...')
                
        #Copia de imagenes de una ruta externa
        copy_imgs(src_dir=os.environ['SRC_PATH'], dest_dir=os.environ['DEST_PATH'])
        
        lg.debug(crd,'Finalizado el proceso carga_datos sin errores...')
        
    except Exception as e: 
        lg.error(crd,f'Error en la función carga_datos .... Error: {e}')
        sys.exit(1) #cerrando el proceso...

La función ***"carga_datos"*** se encarga de llamar al resto de funciones para realizar la carga de los datos. En este caso, solamente se llama a la función "copy_imgs" del script "cp_imgs.py".

## <u>Estandarizacion_datos</u>

### img_a_rgb.py

In [None]:
def img_rgb(img_name,full_img_name ,saving_folder): 
    """
    Esta función se utiliza para convertir imágenes normales en tipo RGB.
    
    Parameters
    ----------
        - img_name : (string) Nombre de la imagen.
        - full_img_name : (string) Nombre de la imagen, pero incluye toda la ruta.
        - saving_folder : (string) Ruta de la carpeta donde se almacenarán las imágenes modificadas.

    Returns
    -------
        - img_rgb : (tensor) Imagen convertida al nuevo espacio de color.

    """
    lg.debug(iar,'Cambiando el espacio de color de la imagen') 
    try:
        img_in = cv2.imread(full_img_name)
        img_rgb = cv2.cvtColor(img_in, cv2.COLOR_BGR2HSV_FULL)
        plt.imsave('{}/rgb_{}'.format(saving_folder, img_name),img_rgb)

    except Exception as e: 
        lg.error(iar,f'No se ha podido cambiar el espacio de color con la función "img_rgb". Error: {e}')

La función ***"img_rgb"*** tiene como objetivo cambiar el espacio de color de las imágenes a utilizar en el análisis.

3 argumentos obligatorios son los que requieren esta función:

1. ***img_name***: Este argumento es solamente el nombre de la imagen, sin la ruta donde se encuentra, en formato **"String"**.

2. ***full_img_name***: Este argumento es el nombre de la imagen con la ruta donde se encuentra la imagen en formato **"String"**.

3. ***saving_folder***: La ruta de la carpeta donde se van a guardar las fotos con el espacio de color cambiado.

La función comienza leyendo la imagen y lo convierte en un tensor, guardándose en la variable "img_in". Tras ello, se cambia el espacio de color de la imagen y se guarda en la variable "img_rgb". Posteriormente, se guarda la imagen en la ruta guardada en la variable "saving_folder" y el nombre de la imagen será "rgb_" + el nombre original de la imagen.

### main_estandarizacion_datos.py

In [None]:
def estandarizacion_datos(input_folder, output_folder):
    """
    Esta función llama a los subprocesos necesarios para llevar a cabo el 
    proceso de estandarización de datos

    Parameters
    ----------
        - input_folder : (string). La ruta de la carpeta donde se encuentran las imágenes que se van a utilizar para el análisis.
        - output_folder : (string). Ruta donde se guardarán las imágenes tratadas tras el proceso.

    Returns
    -------
        - Las fotos tratadas ya guardadas en la ruta que se ha indicado en la variable "output_folder".

    """
    
    lg.debug(med,'Iniciando el proceso de estandarización de datos...')
    try:    
        for img_in in os.listdir(input_folder):
            img_in1 = os.path.join(input_folder,img_in)
            if 'rgb' not in img_in.split("_")[0]:
                img_rgb(img_in,img_in1,output_folder)

        lg.debug(med,'Finalizada la ejecucion de la funcion estandarizacion_datos...')

    except Exception as e: 
        lg.error(med,f'Error en la función estandarizacion_datos .... Error: {e}')
        sys.exit(1) #cerrando el proceso...
    
    print("Estandarización de datos completada")

La función ***estandarizacion_datos*** se dedica a llamar a todas las funciones que estan dedicadas a la preparación de las imágenes para su posterior tratamiento.

Esta función requiere de 2 argumentos obligatorios:

1. ***input_folder***: Directorio, en formato *String*, donde se encuentran las imágenes originales.

2. ***output_folder***: Directorio, en formato *String*, donde se almacenarán las imágenes ya modificadas.

Hay 1 bucle con las lista de imágenes que hay dentro del directorio donde se encuentran las imágenes originales, donde, en cada iteración, la imagen se guarda en la variable "img_in".
"img_in1" se guarda el directorio completo de la imagen original, que se hace mediante la union de "input_folder" y "img_in".

Tras lo mencionado, se aplica la condicion de que si el 'rgb' no se encuentra dentro de la lista que se crea tras la división del nombre por el caracter "_", se realizará el cambio del espacio de color, metiendo como argumentos img_in, img_in1 y output_folder respectivamente.

En caso de que este proceso falle, se cerrara el proceso.

## <u>Models</u>

### load_model.py

In [None]:
def load_model(folder_path): 
    """
    Esta funcion predice con un diccionario de modelos los datos de entrada. (Ejemplo no funcional)
    
    Parameters
    ----------
        - cnn : (class) Clase donde están almacenados parámetros y funciones del modelo que se van a utilizar.
        - name_model : (string) Nombre que tiene el archivo que guarda el modelo.
        - folder_path : (string) Ruta donde se encontraría el modelo.

    Returns
    -------
        - Modelo guardado en la carpeta actual o la designada en formato ".h5"
        - Un fichero json que contiene el nombre del modelo base que se utilizó para entrenar este modelo

    """
    
    lg.debug(ldmdl,'Cargando el modelo mencionado...')
    try:
        cnn = CNN()

        print("Cargando el modelo...")
        modelo = os.path.join(folder_path,os.environ['NAME_MODEL'])
        cnn.load(modelo)
        
    except Exception as e:
        lg.error(ldmdl,f'Error en la funcion load_model. Error: {e}')

    
    lg.debug(ldmdl,'Modelo Cargado')
    
    return cnn

La función ***load_model*** tiene como objetivo cargar un modelo ya entrenado, el cual se requiera únicamente para realizar directamente la predicción de fotos que el modelo no ha visto previamente.

Se necesita 1 solo argumento para hacer funcionar esta función:

- ***folder_path***: Este argumento es el directorio donde se encuentra almacenado el modelo que se quiere utilizar.

En primer lugar, se inicializa la clase ***CNN*** y se va a almacenar en la variable "cnn". Tras esto, se va a crear una variable llamada "modelo", que contendrá la ruta completa del modelo, que viene de la unión de la variable "folder_path" y la variable de entorno "NAME_MODEL" .

Por último, se va a llamar a la función "load", que se encuentra dentro de "cnn", a la cual se le tiene que añadir como argumento la ruta del modelo que se quiere cargar y la variable "modelo" será la que se encargue de ello.

Tras realizar toda la función, la clase "cnn" con el modelo cargado dentro.



### predictions.py

In [None]:
def predictions(folder_path,partition_name, cnn, save_results, save_results_path): 
    """
    Esta funcion predice con un diccionario de modelos los datos de entrada. (Ejemplo no funcional)
    
    Parameters
    ----------
        - folder_path : (string) Ruta donde se situán los datos de los que se quiere realizar la predicción.
        - partition_name : (string) Nombre de la partición de la que se va a realizar la predicción. (Test, principalmente)
        - cnn : (class) Clase donde están almacenados parámetros y funciones del modelo que se van a utilizar.
        - save_results : (boolean) Para saber si se quieren guardar los resultados de las predicciones.
        - save_results_path : (String) Ruta donde se guardarán los resultados.
        
    Returns
    -------
        - Predicción de los datos y su respectiva tabla de confusión.

    """
    lg.debug(predic,'Realizando predicciones...')
    try:
        cnn.predict(test_dir=folder_path,dataset_name=partition_name, save=save_results, results_folder=save_results_path)
        
    except Exception as e: 
        lg.error(predic,f'Error en la funcion predictions. Error: {e}')
    
    
    lg.debug(predic,'Predicciones realizadas')

La función ***predictions*** tiene como objetivo realizar las predicciones de nuevas fotos que el modelo no ha visto previamente.

La cantidad de argumentos que hay que insertar en esta función son los siguientes:

1. ***folder_path***: Este argumento, que debe ser en formato *String*, es la ruta donde se encuentran las imágnes de las que se va a realizar la predicción.

2. ***partition_name***: Argumento en formato *string* que indica el nombre de la partición que se ha utilizado en esta función. Generalemente, en esta función, se va a utilizar la partición de "test".

3. ***cnn***: Argumento en formato *clase* que contiene el modelo entrenado o cargado previamente.

4. ***save_results***: Este argumento, que se encuentra en formato *Boolean*, determina si los resultados que han producido se van a guardar o no.

5. ***save_results_path***: Este argumento es el que determina donde se van a guardar los resultados, que es una ruta a una carpeta- en formato *string*.

La función se encarga de llamar a la función predict que se encuentra dentro de la variable "cnn". El resto de argumentos que se han incluido en la función se incluyen dentro de la función.

### save_model.py

In [None]:
def save_model(cnn,folder_path,name_model): 
    """
    Esta funcion predice con un diccionario de modelos los datos de entrada. (Ejemplo no funcional)
    
    Parameters
    ----------
        - cnn : (class) Clase donde están almacenados parámetros y funciones del modelo que se van a utilizar.
        - name_model : (string) Nombre del modelo base utilizado que se usará como parte del nombre del modelo a guardar.
        - folder_path : (string) Ruta donde se guardaría el modelo.

    Returns
    -------
        - Modelo guardado en la carpeta actual o la designada

    """
    lg.debug(svmd,'Guardando el modelo entrenado...')
    try:        
        

    
        saving_name = folder_path+name_model+str(datetime.now().today().date()).replace("-","_")+"_"+datetime.now().time().strftime("%H%M")
        # saving_name = nombre del modelo + fecha de hoy (formato: year_month_day) + hora (formato: horaminutos. *Nota: Todo junto, no esta buggeado.)
        cnn.save(saving_name)
        
    except Exception as e: 
        lg.error(svmd,f'Error en la funcion save_model. Error: {e}')
    
    lg.debug(svmd,'Modelo Guardado')

La función ***save_model*** tiene como objetivo guardar el modelo que se ha entrenado.

3 son los argumentos necesarios para usar esta función:

1. ***cnn***: Este argumento es que almacena el modelo que se quiere guardar, que se encuentra en formato *class*.

2. ***folder_path***: Este argumento, que debe ser en formato *String*, es la ruta donde se va a guardar el modelo.

3. ***name_model***: Este argumento es el nombre del modelo, que debe encontrarse en formato *String*.

La función comienza creando el nombre que se le quiere otorgar al modelo, en este caso, el nombre estará compuesto por el nombre del modelo base que ha utilizado, que se encuentra en la variable "name_model", más la fecha del día en el que se entrena, en la que se reemplazará el caracter "-" por "_" y, por último, se le añadirá la hora y el minuto.

Tras ello, se utilizará la función "save", que se encuentra dentro de la clase "cnn", guardando el modelo en un archivo ".h5" y el nombre del modelo base utilizado en un archivo ".json".

### training_results.py

In [None]:
def train_val_results(training_folder_path, validation_folder_path, cnn, sv_rslt_train, sv_rslt_val, saving_path): 
    """
    Esta funcion predice con un diccionario de modelos los datos de entrada. (Ejemplo no funcional)
    
    Parameters
    ----------
        - training_folder_path : (string) Ruta donde se encuentra la partición de entrenamiento.
        - validation_folder_path : (string) Ruta donde se encuentra la partición de validación.
        - cnn : (class) Objeto que contiene el modelo y funciones para ejecutar sobre este.
        - sv_rslt_train : (Boolean) Variable que determina si se van a guardar o no los resultados de entrenamiento.
        - sv_rslt_val : (Boolean) Variable que determina si se van a guardar o no los resultados de validación.
        - saving_path : (String) Ruta donde se van a guardar los resultados obtenidos.
    Returns
    -------
        - Predicción de los datos y su respectiva tabla de confusión.

    """
    lg.debug(tr_rslt,'Representando los resultados de la fase de entrenamiento...')
    try:
        cnn.predict(results_folder=saving_path,test_dir=training_folder_path,dataset_name="Training",save=sv_rslt_train)
        cnn.predict(results_folder=saving_path,test_dir=validation_folder_path, dataset_name="Validation", save=sv_rslt_val)
        
    except Exception as e: 
        lg.error(tr_rslt,f'Error en la funcion train_results. Error: {e}')
    
    
    lg.debug(tr_rslt,'Resultado del entrenamiento')

La función ***train_val_results*** tiene como objetivo mostrar los resultados obtenidos durante la fase de entrenamiento y de validación.

La cantidad de argumentos que hay que insertar en esta función son los siguientes:

1. ***training_folder_path***: Este argumento, que debe ser en formato *String*, es la ruta donde se encuentran las imágenes con las que se ha realizado la fase de entrenamiento.

2. ***validation_folder_path***: Este argumento, que debe ser en formato *String*, es la ruta donde se encuentran las imágenes con las que se ha realizado la fase de validación.

3. ***cnn***: Argumento en formato *clase* que contiene el modelo entrenado o cargado previamente.

4. ***sv_rslt_train***: Este argumento, que se encuentra en formato *Boolean*, determina si los resultados de la fase entrenamiento que han producido se van a guardar o no.

5. ***sv_rslt_val***: Este argumento, que se encuentra en formato *Boolean*, determina si los resultados de la fase de validación que se han producido se van a guardar o no.

6. ***saving_path***: Este argumento es el que determina donde se van a guardar los resultados, que es una ruta a una carpeta en formato *string*.

La función se encarga de llamar a la función predict que se encuentra dentro de la variable "cnn". En esta ocasión, se van a llamar 2 veces. La primera es para los resultados de la fase de entrenamiento, en la que se utilizarán las variables "training_folder_path", "saving_path", "cnn", "sv_rslt_train" y "saving_path" 

### training.py

In [None]:
def training(cnn,training_dir: str, validation_dir: str, base_model: str, epochs: int = 1,
              unfreezed_convolutional_layers: int = 0, training_batch_size: int = 32, validation_batch_size: int = 32,
              learning_rate: float = 1e-4, beta_1: float = 0.7, beta_2: float = 0.99, epsilon: float = 0.1):
    """
    Esta función permite entrenar el modelo.
    
    Parameters
    ----------
        - cnn : (class) Variable que almacena todas las funciones y parámetros del modelo.
        - training_dir : (String) Directorio donde se encuentra la partición de entrenamiento.
        - validation_dir : (String) Directorio donde se encuentra la partición de validación.
        - base_model : (String) Modelo preentrenado que se va a utilizar como modelo base de esta red.
        - epochs : (Int) Default = 1. Número de veces que el modelo va a recorrer el dataset durante el entrenamiento.
        - unfreezed_convolutional_layers: (Int) Default = 0. Empezando desde el final, número de capas convolucionales que se entrenarán.
        - training_batch_size: (Int) Default = 32. Número de ejemplos usados del conjunto de entrenamiento.
        - validation_batch_size: (Int) Default = 32. Número de ejemplos usados del conjunto de validación.
        - learning_rate: (float) Default = 1e-4. Hiperparámetro learning rate. Determina como de rapido aprenderá el algoritmo cada vez que se entrena.
        - beta_1: (float) Default = 0.7. Hiperparámetro que indica el factor de decrecimiento exponencial para la estimación de la media de los gradientes.
        - beta_2: (float) Default = 0.99. Hiperparámetro que indica el factor de decrecimiento exponencial para la estimación de la varianza de los gradientes.
        - epsilon: (float) Default = 0.1. Hiperparámetro que sirve para "suavizar", evitando problemas numéricos.

    Returns
    -------
        - cnn : (class) clase con el modelo entrenado.

    """

    

    try:
        if not cnn:   
            cnn = CNN()
        
        cnn.train(training_dir=training_dir, 
                  validation_dir=validation_dir, 
                  base_model=base_model, 
                  epochs=epochs, 
                  learning_rate=learning_rate, 
                  training_batch_size=training_batch_size, 
                  validation_batch_size=validation_batch_size, 
                  beta_1=beta_1, beta_2=beta_2, epsilon=epsilon, 
                  unfreezed_convolutional_layers=unfreezed_convolutional_layers)

         
    except Exception as e: 
        lg.error(train,f'Error en la función training .... Error: {e}')

    return cnn

La función ***training*** tiene como objetivo mostrar los resultados obtenidos durante la fase de entrenamiento y de validación.

La cantidad de argumentos que hay que insertar en esta función son los siguientes:

1. ***cnn***: Argumento en formato *clase* que contiene unicamente la clase inicializada.

2. ***training_dir***: Este argumento, que debe ser en formato *String*, es la ruta donde se encuentran las imágenes con las que se ha realizado la fase de entrenamiento.

3. ***validation_dir***: Este argumento, que debe ser en formato *String*, es la ruta donde se encuentran las imágenes con las que se ha realizado la fase de validación.

4. ***base_model***: Nombre, en formato *String*, del modelo preentrenado que se usará como parte del modelo final. 

5. ***epochs***: Este argumento, que se encuentra en formato *Boolean*, determina si los resultados de la fase de validación que se han producido se van a guardar o no. Por defecto, este valor será 1.

6. ***learning_rate***: Este argumento es el que determina donde se van a guardar los resultados, que es una ruta a una carpeta en formato *string*.

7. ***training_batch_size***: Número de imágenes que se usarán en cada época como conjunto de entrenamiento.

8. ***validation_batch_size***: Número de imágenes que se usarán en cada época como conjunto de validación.

9. ***beta_1***:  Hiperparámetro que indica el factor de decrecimiento exponencial para la estimación de la media de los gradientes. Por defecto, este valor será 0,7.

10. ***beta_2***: Hiperparámetro que indica el factor de decrecimiento exponencial para la estimación de la varianza de los gradientes. Por defecto, este valor será 0,99.

11. ***epsilon***: Hiperparámetro que sirve para "suavizar", evitando problemas numéricos. Por defecto, este valor será 0,1.

12. ***unfreezed_convolutional_layers***: Empezando desde el final, número de capas convolucionales que se entrenarán. Por defecto este valor será 0.

La función comienza comprobando si "cnn" esta inicializada, en caso contrario, "cnn" será inicializada. Tras esto, se procede a utilizar la función que dispone esta clase llamada "train", que se encarga de realizar el enetrenamiento de un nuevo algoritmo. Esta función necesita de todos los argumentos mencionados para funcionar, excepto de aquellos de los que ya dispone un valor por defecto, pero es recomendable modificarlo.

Una vez se ha entrenado el nuevo modelo, la función principal devuelve "cnn" con el nuevo modelo ya entrenado.

## <u>Train</u>

### main_train.py

In [None]:
def train(save_mdl):
    """
    Esta función llama a los subprocesos necesarios para llevar a cabo el 
    proceso de predicción de datos.

    Parameters
    ----------
        - cnn : (class) Clase donde están alamcenados muchos parámetros y funciones que son aplicables al modelo.
        - modelo : (string) El nombre del archivo que contiene el modelo/ruta + archivo con el modelo. Solo utilizar en caso que se quiera cargar un modelo.
        - load : (Boolean) Valor que determina si queremos guardar 
        - train : (Boolean)

    Returns
    -------
        - dict_predictions : (dict) description.

    """
    
    lg.debug(mtrn,'Iniciando el proceso de predicción...')
    
    cnn = CNN()
    save_mdl = save_mdl.lower() == "true"
    try:
        cnn = training(cnn, training_dir=os.environ['TRAIN_DIR'], 
                       validation_dir=os.environ['VALID_DIR'], 
                       base_model=os.environ['BASE_MODEL'], 
                       epochs=int(os.environ['EPOCHS']), 
                       learning_rate=float(os.environ['LEARNING_RATE']),
                       training_batch_size=int(os.environ['TRAIN_BATCH']),
                       validation_batch_size=int(os.environ['VALID_BATCH']), 
                       beta_1=float(os.environ['BETA_1']),
                       beta_2=float(os.environ['BETA_2']),
                       epsilon=float(os.environ['EPSILON']))
        if save_mdl:
            save_model(cnn=cnn, folder_path=os.environ['SAVING_FOLDER'],name_model=os.environ['BASE_MODEL'])
        
        save_rslt_train = os.environ['SAVE_RESULTS_TRAINING'].lower() == "true"
        save_rslt_val = os.environ['SAVE_RESULTS_VALIDATION'].lower() == "true"
        train_val_results(os.environ['TRAIN_DIR'], os.environ['VALID_DIR'],
                          cnn, sv_rslt_train=save_rslt_train, 
                          sv_rslt_val=save_rslt_val, saving_path=os.environ['SAVE_RESULTS_FOLDER'])

        lg.debug(mtrn,'Finalizado el proceso de entrenamiento...')
        
    except Exception as e: 
        lg.error(mtrn,f'Error en la función train .... Error: {e}')
        sys.exit(1)
    
    return cnn

La función "train" es una función que su función principal es inicializar las funciones necesarias que hay en la carpetas "Models" que tienen como función principal llegar a poder entrenar un modelo.
Si se carga un modelo ya entrenado, esta fase se saltará.

Esta función solamente tiene un argumento:

- ***save_mdl***: Este argumento, en formato *boolean*, determina si se quiere guardar o no el modelo recien entrenado.

En primer lugar, se inicializará la clase CNN, guardándose en la variable "cnn". Tras esto, se mirará si se quiere guardar el modelo que se quiere entrenar posteriormente y se guardará en la variable "save_mdl".
Tras esto, se utilizará la función training, previamente explicada, cuyos argumentos están guardados todos en el archivo ".env", y los resultados se guardarán la variable "cnn", sobreescribiendo la anterior creada.
En caso de que "save_mdl" sea True, se utilizará la función "save_model" para guardar el modelo, tal y como se ha explicando anteriormente.

Tras esto, se mirarán si los resultados obtenidos, tanto en la fase de entrenamiento como en la fase de validación, se quieren guardar con las variables "save_rslt_train" para el train y "save_rslt_val" para la validación.
Posteriormente, se usará la función "train_val_results".

Una vez terminado este proceso, se devolverá la variable "cnn" con el modelo entrenado.

## <u>Predict</u>

### main_predict.py

In [None]:
def predict(cnn = False):
    '''
    Esta función llama a los subprocesos necesarios para llevar a cabo el 
    proceso de predicción de datos.

    Parameters
    ----------
        - cnn : (class) Clase donde están alamcenados muchos parámetros y funciones que son aplicables al modelo.
        - modelo : (string) El nombre del archivo que contiene el modelo/ruta + archivo con el modelo. Solo utilizar en caso que se quiera cargar un modelo.
        - load : (Boolean) Valor que determina si queremos guardar 
        - train : (Boolean)

    Returns
    -------
        - dict_predictions : (dict) description.

    '''
    
    lg.debug(mpdt,'Iniciando el proceso de predicción...')
    
    
    
    try:
        load = os.environ['LOAD'].lower() == 'true'

        if load:
            cnn = load_model(os.environ['LOADING_MODEL'])
        
        save_results_test = os.environ['SAVE_RESULTS_TEST'].lower() == 'true'
        print(os.environ['TEST_DIR'])
        predictions(folder_path=os.environ['TEST_DIR'], partition_name='Test', cnn=cnn, save_results=save_results_test, save_results_path=os.environ['SAVE_RESULTS_FOLDER'])

        lg.debug(mpdt,'Finalizado el proceso de predicción...')
        
    except Exception as e: 
        lg.error(mpdt,f'Error en la función predict .... Error: {e}')
        #sys.exit(1)
    
    return cnn

La función "predict" tiene como objetivo llamar a todas las funciones de la carpeta "Models" que se utilicen para realizar la predicción de nuevos datos.

Esta función tiene 1 argumento:

- ***cnn***: Este argumento es la clase "cnn" creada en el script "main_train.py". Su valor por defecto es "False", ya que si se quiere cargar directamente el modelo, no es necesario que introduzcamos nada.

En primer lugar, se comprueba si se quiere cargar un modelo de los que ya se dispone y se guarda en la variable "load". En caso que se quiere cargar un modelo, se utilizará la función "load_model" y se guardará el modelo cargado en la variable "cnn".
A continuación, se mirará si se quieren guardar los resultados de la predicción y se guardará en la variable "save_results_test". Posteriormente, se usará la función "predictions" para realizar las predicciones de estos nuevos datos.

FInalmente, la función principal devuelve "cnn".

## <u>Otros Scripts</u>

### .env

Este archivo guarda todas las variables que se quieren modificar cada vez que se realizar este proceso, como puede ser la ruta del directorio de imágenes de entrenamiento o la de validación.

### cnn.py

Este archivo contiene la clase CNN y todas sus funciones.

### main.py

In [None]:
def main(): 
    """
    Se trata del main de esquema_inferir. Aquí se llama a los procesos que se han de
    ejecutarse.

    
    """
    lg.info(log_name_main,'Iniciando ejecución esquema train...')

    
    
    """
    Carga de Datos
    """
    carga_datos()
    
    """
    Estandarización de datos
    """
    estandarizacion_datos(input_folder=os.environ['INPUT_FOLDER_IMAGENES'],output_folder=os.environ['OUTPUT_FOLDER_IMAGENES'])

    """
    Entrenamiento
    """
    training = os.environ['TRAIN'].lower() == "true"
    if training:
        cnn = train(save_mdl=os.environ['SAVE_MDL'])
    
    """
    Predict
    """
    prediction_val = os.environ['PREDICTION'].lower() == "true"
    if prediction_val:
        if training:
            predict(cnn)
        else:
            predict()

    
    """
    Delivery
    """    
    #delivery(dict_predictions, dict_inputs, dict_audit_inputs, conn)
    
    
    lg.info(log_name_main,'Finalizando ejecución esquema train...')

    
main()

La función "main" se dedica a juntar todas las funciones principales que se encuentran en los archivos "main.py" y hacer que se realice todo el proceso.

No dispone de argumentos. 

En primer lugar, se realizará la carga de los datos mediante la función "carga_datos", para luego utilizar la función "estandarizacion_datos" para realizar los cambios que se buscan antes de realizar el análisis de las imágenes.
Tras esto, se mirará si se busca si se quiere realizar un entrenamiento de un nuevo modelo y se guardará en la variable "training". En caso de que sea "True", se entrenará un nuevo modelo con la función "train" y se guardará en la variable "cnn".
Posteriormente, se mirará si se quieren realizar predicciones de nuevos datos. En caso de que este valor sea "True", se mirará si se ha realizado un entrenamiento previo, ya que si se ha hecho, hay que introducir "cnn" en la función "predict", en caso contrario,
no se introducirá ningún argumento a la función.

### requirements.txt

Este archivo contiene las librerías y la versión utilizada para hacer este proyecto con el objetivo de poder replicarlo sin que haya fallos por el versionado de las librerías.

### results.py

Es un script que se utiliza dentro del script "cnn.py" cuya función principal es representar, si se pide dentro de "cnn.py" los resultados que se han obtenido.