# 0.0. Instalar e importar bibliotecas y librerías necesarias

In [1]:
import torch  # Librería para operaciones de aprendizaje profundo
import torch.nn as nn  # Módulo para construcción de redes neuronales
import numpy as np  # Librería para operaciones numéricas eficientes
import pandas as pd  # Librería para manipulación y análisis de datos
import requests  # Librería para realizar solicitudes HTTP
import matplotlib.pyplot as plt


from PIL import Image, ImageFile  # Módulo para manipulación de imágenes

from datasets import Dataset
from datasets import ClassLabel as dsLabel
from datasets import Image as dsImage
from evaluate import load as load_metric  # Función para cargar métricas de evaluación
import torchvision.transforms as transforms  # Transformaciones de imágenes
from pathlib import Path  # Manejo de rutas de archivos y directorios

from transformers import AutoFeatureExtractor, SwinForImageClassification  # Modelos de transformadores
from transformers import AutoModelForImageClassification, TrainingArguments, Trainer  # Entrenamiento de modelos de imágenes
ImageFile.LOAD_TRUNCATED_IMAGES = True  # Cargar imágenes ligeramente corruptas

import cv2 #modificar imágenes a escala de gris y redimensionar

# 1.0. Preprocesamiento de los datos

## 1.1. Cargar datos

**Descripción del conjunto de datos (dataset):**

**Nombre del dataset:** NN_INPUT.feather

**Estructura:**

(4) columnas: 
* Path: nombre de la ruta de la imagen
* FUM (marca 0.0 si no es, 1.0 sí es fumalora)
* EXP (marca 0.0 si no es, 1.0 sí es explosión)
* INAC (marca 0.0 si no es, 1.0 sí es inactivo)

(21,931) filas:
* Cada fila es el nombre de la ruta de una imagen que se encuentra almacenanda en el sistema de archivos con el mismo nombre

In [2]:
# Definidiendo mi dataset (almacenando el archivo NN_INPUT.feather en data)
data = pd.read_feather("NN_INPUT.feather");
data

Unnamed: 0,Path,FUM,EXP,INAC
0,2000/abr/p0423001.jpg,0.0,0.0,1.0
1,2000/abr/p0423002.jpg,1.0,0.0,0.0
2,2000/abr/p0423003.jpg,1.0,0.0,0.0
3,2000/abr/p0424001.jpg,1.0,0.0,0.0
4,2000/abr/p0424002.jpg,1.0,0.0,0.0
...,...,...,...,...
21926,2023/mar/p0316234.jpeg,1.0,0.0,0.0
21927,2023/mar/p0317231.jpeg,1.0,1.0,0.0
21928,2023/mar/p0317232.jpeg,1.0,1.0,0.0
21929,2023/mar/p0317233.jpeg,1.0,1.0,0.0


## 1.2. Limpiar datos

* Revisar el tamaño del dataset
* Revisar si hay valores NAN, null
* Desechar filas inexistentes -> Hay filas que no tienen un Path que no hace match con las imágenes guardadas.

In [3]:
# Revisar la cantidad de imágenes
#data.shape

In [4]:
# Revisar si hay valores NAN, null
#data.isnull().values.any()

In [5]:
#data

In [6]:
import os

# Obtén el directorio actual
current_directory = os.getcwd()
images_folder = 'images'

# Imprime información sobre las rutas y su existencia
for i, r in data.iterrows():
    full_path = os.path.join(current_directory, images_folder, r["Path"])
    #print(f"Index: {i}, Path: {full_path}, Exists: {Path(full_path).exists()}")

In [7]:
# directorio actual
current_directory = os.getcwd()
print(f"Directorio actual: {current_directory}")

Directorio actual: C:\Users\alexi\OneDrive\ENES\MiriTesis


In [8]:
#full_path = os.path.join(current_directory, r["Path"])
full_path

'C:\\Users\\alexi\\OneDrive\\ENES\\MiriTesis\\images\\2023/mar/p0317234.jpeg'

In [9]:
# Desechar las filas inexistentes
drop = []
for i, r in data.iterrows():
    full_path = os.path.join(current_directory, images_folder, r["Path"])
    if not Path(full_path).exists():
        drop.append(i)
    #print(i,r,full_path,Path(full_path).exists())
    
data.drop(drop, inplace=True)

In [10]:
data

Unnamed: 0,Path,FUM,EXP,INAC
0,2000/abr/p0423001.jpg,0.0,0.0,1.0
1,2000/abr/p0423002.jpg,1.0,0.0,0.0
2,2000/abr/p0423003.jpg,1.0,0.0,0.0
3,2000/abr/p0424001.jpg,1.0,0.0,0.0
4,2000/abr/p0424002.jpg,1.0,0.0,0.0
...,...,...,...,...
21926,2023/mar/p0316234.jpeg,1.0,0.0,0.0
21927,2023/mar/p0317231.jpeg,1.0,1.0,0.0
21928,2023/mar/p0317232.jpeg,1.0,1.0,0.0
21929,2023/mar/p0317233.jpeg,1.0,1.0,0.0


In [11]:
# Revisar cuántas filas (nombres de ruta) inexistentes se eliminaron
print(f"Se eliminaron {len(drop)} filas inexistentes.")

# ¿QUÉEEEE?

Se eliminaron 0 filas inexistentes.


In [12]:
pwd

'C:\\Users\\alexi\\OneDrive\\ENES\\MiriTesis'

## 1.3. Modificación de imágenes con OpenCV

In [23]:
def procesar_imagen(ruta):
    # Carga la imagen a color
    full_path = os.path.join(current_directory, images_folder, ruta)
    if not os.path.exists(full_path):
        print(f"{ruta} no existe!")
        return None
        
    imagen_gris = cv2.imread(full_path, cv2.IMREAD_GRAYSCALE)

    # Verifica si la imagen se cargó correctamente
    if imagen_gris is None:
        print(f"Error al cargar la imagen en la ruta: {ruta}")
        return None

    # Convierte la imagen a escala de grises
    #imagen_gris = cv2.cvtColor(imagen_color, cv2.COLOR_BGR2GRAY)

    # Cambia el tamaño de la imagen
    nuevo_tamano = (340, 240)  # factor de escala .5 de las imágenes originales
    imagen_redimensionada = cv2.resize(imagen_gris, nuevo_tamano)

    return np.asarray(imagen_redimensionada)


In [24]:
# Aplica la función procesar_imagen a la columna 'Path' del DataFrame
data['imagen_procesada'] = data['Path'].apply(procesar_imagen)

Error al cargar la imagen en la ruta: 2000/dic/p1201001.gif
Error al cargar la imagen en la ruta: 2000/dic/p1203001.gif
Error al cargar la imagen en la ruta: 2000/dic/p1215003.jpg
Error al cargar la imagen en la ruta: 2000/dic/p1219008.jpg
Error al cargar la imagen en la ruta: 2000/dic/p1224001.gif
Error al cargar la imagen en la ruta: 2001/jul/p0703012.jpg
Error al cargar la imagen en la ruta: 2002/ene/p0123024.jpg
Error al cargar la imagen en la ruta: 2002/ene/p0123025.jpg
Error al cargar la imagen en la ruta: 2013/may/p0512131.jpg
Error al cargar la imagen en la ruta: 2014/oct/p1015146.gif
Error al cargar la imagen en la ruta: 2014/nov/p1105147.gif
Error al cargar la imagen en la ruta: 2014/nov/p1105147.gif
Error al cargar la imagen en la ruta: 2015/feb/p0212153.gif
Error al cargar la imagen en la ruta: 2015/feb/p0220152.gif
Error al cargar la imagen en la ruta: 2015/feb/p0220155.gif
Error al cargar la imagen en la ruta: 2015/feb/p0220155.gif
Error al cargar la imagen en la ruta: 20

In [25]:
data.head(1)

Unnamed: 0,Path,FUM,EXP,INAC,imagen_procesada
0,2000/abr/p0423001.jpg,0.0,0.0,1.0,"[[119, 141, 138, 135, 138, 138, 137, 136, 135,..."


## 1.4. Transformación de datos
* Compatibilidad con la API datasets
* ```from_generator()``` te permite convertir los datos generados por un generador en un objeto de conjunto de datos que es compatible con todas las funcionalidades y utilidades de ```datasets.```

In [38]:
def GEN():
    for idx,row in data.iterrows():
        Image,FUM,EXP,INA,Proc = row
        if(Proc is None):
            continue
        Proc=np.asarray(Proc)
        Label="UNK"
        if FUM>0:
            if EXP>0:
                Label="EXP+FUM"
            else:
                Label="FUM"
        elif EXP>0:
            Label="EXP"
        elif INA>0:
            Label="INA"
        yield {
            "image":dsImage(Proc),
            "label":Label
        }

In [40]:
# Crear y darle formato a un conjunto de datos a partir de la función generadora GEN()
# Importante porque queremos trababajar con 'datasets' de HuggingFace después.

Data=Dataset.from_generator(GEN, cache_dir=None)#.cast_column("image",dsImage())#.cast_column("label",dsLabel(names=["UNK","EXP","FUM","EXP+FUM","INA"]))
Data

Generating train split: 0 examples [00:00, ? examples/s]

PermissionError: [WinError 32] The process cannot access the file because it is being used by another process: 'C:/Users/alexi/.cache/huggingface/datasets/generator/default-b1208a348c895e7e/0.0.0.incomplete\\generator-train-00000-00000-of-NNNNN.arrow'

In [37]:
type(Data[0]['image'])

list

# 2.0. Entrenamiento de los datos

## 2.1. Separar los datos en:
    - entranamiento (train) -> 95%
    - evaluación (test) -> 5%

In [None]:
Data=Data.train_test_split(.05)
Data

## 2.2. Preprocesamiento del dataset de entrenamiento
* Representación de las etiquetas
* Mapeo dibireccional entre etiquetas e identificadores numéricos

In [None]:
# Etiquetas del dataset de entrenamiento
labels = Data["train"].features["label"].names
labels

In [None]:
# Gracias a 'ClassLabel' se crea este mapeo para representar las etiquetas de manera numérica  
label2id

In [None]:
# Se puede hacer al inverso también
id2label

In [None]:
# Mapeo bidireccional entre nombres de etiquetas e identificadores numéricos

label2id, id2label = dict(), dict()
for i, label in enumerate(labels):
    label2id[label] = i
    id2label[i] = label
    
# Ejemplo: acceder al nombre de la etiqueta asociada con el identificador numérico 3 
id2label[3]

# Visualizando imágenes y su etiqueta

In [None]:
# Muestra la imagen en el índice 134 en el dataset de entrenamiento (train)
Data["train"][134]["image"]

In [None]:
# Muestra la etiqueta en el índice 134 en el dataset de entrenamiento (train)

print(Data["train"][134]["label"])

# Despliega las etiquetas y su identificador
print(id2label)

# ¡Es correcto, la imagen y la etiqueta hacen match! :D

# 3.0. Modelo

## 3.1. Elección de modelo
* Cargar modelo
* Cargar procesador de características para extraer y procesar las más revelantes utilizando la arq. del modelo 'swinv2'.

In [None]:
# Cargando el modelo
model_name="microsoft/swinv2-small-patch4-window16-256"

In [None]:
# Se crea un procesador de características de imágenes utilizando el modelo preentrenado especificado por 'model_name' 
image_processor = AutoFeatureExtractor.from_pretrained(model_name)

## 3.2. Preprocesamiento de las imágenes para ser usadas en el modelo

Mediante diferentes transformaciones se asegura que las imágenes de entrada estén en el formato y la escala adecuados antes de ser utilizadas para entrenar o evaluar el modelo.

In [None]:
# Importar transformaciones específicas de la biblioteca torchvision para el preprocesamiento de imágenes

from torchvision.transforms import (
    CenterCrop,
    Compose,
    Normalize,
    RandomHorizontalFlip,
    RandomResizedCrop,
    Resize,
    ToTensor,
)

# Crear una normalización para las imágenes utilizando las estadísticas de imagen del procesador de características
normalize = Normalize(mean=image_processor.image_mean, std=image_processor.image_std)


# Determinar el tamaño y tamaño de recorte de las imágenes según las especificaciones del procesador de imágenes
if "height" in image_processor.size:
    size = (image_processor.size["height"], image_processor.size["width"])
    crop_size = size
    max_size = None # No se establece un tamaño máximo
elif "shortest_edge" in image_processor.size:
    size = image_processor.size["shortest_edge"]
    crop_size = (size, size)
    max_size = image_processor.size.get("longest_edge")
    
else:
    # Establecer valores predeterminados o manejar el error
    size = (default_height, default_width)  # Valores predeterminados
    crop_size = size
    max_size = None

# Definir transformaciones de preprocesamiento para el dataset de entrenamiento
train_transforms = Compose(
        [
            RandomResizedCrop(crop_size),
            RandomHorizontalFlip(),
            ToTensor(),
            normalize,
        ]
    )

# Definir transformaciones de preprocesamiento para el dataset de validación
val_transforms = Compose(
        [
            Resize(size),
            CenterCrop(crop_size),
            ToTensor(),
            normalize,
        ]
    )

In [None]:
# Preprocesar un batch de ejemplos de entrenamiento
def preprocess_train(example_batch):

    # Se aplica 'train_transforms' a cada imagen en el batch y se asigna el resultado a "pixel_values"
    example_batch["pixel_values"] = [
        train_transforms(image.convert("RGB")) for image in example_batch["image"]
    ]
    return example_batch

In [None]:
# Preprocesar un batch de ejemplos de validación
def preprocess_val(example_batch):
    
    # Se aplica 'val_transforms' a cada imagen en el batch y se asigna el resultado a "pixel_values"
    example_batch["pixel_values"] = [val_transforms(image.convert("RGB")) for image in example_batch["image"]]
    return example_batch

In [None]:
# Se asigna el conjunto de datos de entrenamiento del objeto 'Data' a la variable 'train_ds'
train_ds = Data['train']

# Se asigna el conjunto de datos de prueba del objeto 'Data' a la variable 'val_ds'
val_ds = Data['test']

In [None]:
# Se configuran las transformaciones predefinidas 'preprocess_train' y 'preprocess_val' en los conjuntos de datos de entrenamiento y prueba

train_ds.set_transform(preprocess_train)
val_ds.set_transform(preprocess_val)

Aplicar las transformaciones predefinidas a los conjuntos de datos, asegura que las imágenes se procesen de manera consistente y adecuada antes de ser utilizadas en las etapas de entrenamiento y evaluación.

In [None]:
# Visualizando cómo luce el dataset de entrenamiento
train_ds

## 3.3. Creación del modelo

In [None]:
# Crear un modelo para la clasificación de imágenes utilizando el modelo preentrenado especificado
model = AutoModelForImageClassification.from_pretrained(
    model_name, 
    label2id=label2id,
    id2label=id2label,
    ignore_mismatched_sizes = True, # se proporciona esto en caso de que estés planeando hacer fine-tune a un checkpoint que ya está fine-tuned
)

In [None]:
# Cargar métrica de "accuracy"
metric = load_metric("accuracy")

# Cargar otras-diferentes métricas

precision_metric = load_metric("precision")
recall_metric = load_metric("recall")
f1_metric = load_metric("f1")

In [None]:
# Extraer el nombre del modelo a partir de la ruta y crear argumentos de entrenamiento
model_name_b = model_name.split("/")[-1]  # Extraer el nombre del modelo de la ruta

# Configurar los argumentos de entrenamiento
args = TrainingArguments(
    f"{model_name_b}-finetuned-popocatepetl",  # Nombre del directorio para el modelo fine-tuned
    remove_unused_columns=False,
    evaluation_strategy="epoch",  # Evaluar después de cada época
    save_strategy="epoch",  # Guardar después de cada época
    learning_rate=5e-5,
    fp16=True,  # Utilizar precisión de 16 bits
    per_device_train_batch_size=32,
    per_device_eval_batch_size=32,
    num_train_epochs=10,  # Número de épocas de entrenamiento
    warmup_ratio=0.1,  # Proporción de pasos de calentamiento
    logging_steps=10,  # Intervalo para registrar información
    load_best_model_at_end=True,  # Cargar el mejor modelo al final del entrenamiento
    metric_for_best_model="accuracy",  # Utilizar la métrica de "accuracy" para el mejor modelo
    push_to_hub=False,  # No subir a Hugging Face Model Hub
    report_to=[],  # No informar a ningún servicio
)

In [None]:
def compute_metrics(eval_pred):
    """Calcula la precisión en un batch de predicciones"""
    
    # Calcula las predicciones utilizando el índice de la clase con mayor probabilidad
    predictions = np.argmax(eval_pred.predictions, axis=1)
    
    # Calcula la métrica (en este caso, la métrica definida previamente) utilizando las predicciones y las etiquetas reales
    return metric.compute(predictions=predictions, references=eval_pred.label_ids)


In [None]:
def collate_fn(examples):
    """Función de agrupación utilizada durante la creación de batch de ejemplos"""
    
    # Apila los valores de píxeles de todas las imágenes en el lote
    pixel_values = torch.stack([example["pixel_values"] for example in examples])
    
    # Crea un tensor con las etiquetas correspondientes a cada ejemplo en el lote
    labels = torch.tensor([example["label"] for example in examples])
    
    # Retorna un diccionario que contiene los valores de píxeles y las etiquetas agrupados
    return {"pixel_values": pixel_values, "labels": labels}

In [None]:
train_ds[0]

Primer ejemplo en el conjunto de datos train_ds. 

train_ds contiene ejemplos de imágenes y sus etiquetas correspondientes.

train_ds[0]: primer ejemplo en este conjunto de datos, que generalmente incluye la imagen y su etiqueta. 
Un diccionario con claves "image", "label", "pixel_values", que te proporcionan la imagen y la etiqueta y los pixeles de la imagen.

In [None]:
# Crear un objeto Trainer para la fase de entrenamiento y evaluación del modelo

trainer = Trainer(
    model,  # Modelo a entrenar y evaluar
    args,  # Argumentos de entrenamiento configurados previamente
    train_dataset=train_ds,  # Conjunto de datos de entrenamiento
    eval_dataset=val_ds,  # Conjunto de datos de validación/evaluación
    tokenizer=image_processor,  # Procesador de imágenes para tokenizar
    compute_metrics=compute_metrics,  # Función para calcular métricas de evaluación
    data_collator=collate_fn,  # Función para agrupar ejemplos en batches
)

In [None]:
# Iniciar el proceso de entrenamiento utilizando el objeto Trainer

train_results = trainer.train()

Se inicia el proceso de entrenamiento del modelo utilizando el objeto trainer que se creó previamente.
* ```train_results``` almacenará los resultados del proceso de entrenamiento (información sobre la pérdida, tiempo de entrenamiento, tasa de aprendizaje, etc)
*```train()``` del objeto ```trainer``` llevará a cabo el entrenamiento del modelo utilizando los datos del conjunto de entrenamiento ```(train_ds)``` según la configuración de los argumentos ```(args)```.  Durante el proceso, el modelo ajustará sus pesos y aprenderá a partir de los ejemplos de entrenamiento. Al final del entrenamiento, los resultados se almacenarán en la variable ```train_results```, y se podrá usar esta información para evaluar cómo el modelo ha mejorado a lo largo del proceso de entrenamiento.

In [None]:
# Guardar el modelo entrenado y registrar métricas y estado del entrenamiento

trainer.save_model()  # Guardar el modelo entrenado
trainer.log_metrics("train", train_results.metrics)  # Registrar métricas de entrenamiento
trainer.save_metrics("train", train_results.metrics)  # Guardar métricas de entrenamiento
trainer.save_state()  # Guardar el estado del entrenamiento

In [None]:
# Extraer el nombre base del modelo preentrenado
model_name_b = model_name.split("/")[-1]

# Cargar el modelo finetuned a partir del nombre base y configuraciones
model = AutoModelForImageClassification.from_pretrained(
    f"{model_name_b}-finetuned-popocatepetl",  # Cargar el modelo finetuned
    label2id=label2id,  # Configuración de mapeo de etiquetas a IDs
    id2label=id2label,  # Configuración de mapeo de IDs a etiquetas
    ignore_mismatched_sizes=True,  # Ignorar tamaños incompatibles (si es necesario)
).to("cuda")  # Mover el modelo a la GPU (si está disponible)

In [None]:
# Suprimir la notación científica -> imprimir números en coma flotante
np.set_printoptions(suppress=True)

In [None]:
# Seleccionar un índice aleatorio del conjunto de prueba
idx = np.random.choice(len(Data["test"]))

# Obtener la fila correspondiente al índice seleccionado
row = Data["test"][idx]

# Procesar la imagen de entrada y obtener las predicciones del modelo
inputs = image_processor(images=row["image"], return_tensors="pt")["pixel_values"].to("cuda")
outputs = model(pixel_values=inputs)
logits = outputs.logits

# Imprimir las logits y las probabilidades
print("LOGITS:", logits)

# Calcular las probabilidades ~suavizadas~
probabilities = nn.functional.softmax(logits, dim=-1)
probabilities = probabilities.detach().cpu().numpy().flatten()
print("LOGITS CON SUAVITEL:", probabilities)
print("LA SUMA", probabilities.sum())

# Imprimir el mapeo de etiquetas a IDs
print(model.config.label2id)

# Obtener el índice de la clase predicha
predicted_class_idx = logits.argmax(-1).item()

# Imprimir la clase predicha y la clase real
print("Predicted class:", model.config.id2label[predicted_class_idx])
print("Real class:", model.config.id2label[row["label"]])

# Imprimir las probabilidades en porcentaje
print(probabilities * 100)

# Devolver la imagen original
row["image"]

In [None]:
# Establecer un estilo para la gráfica
plt.style.use('seaborn')

# Crear una figura para el gráfico de barras
fig = plt.figure(figsize=(10, 6))

# Etiquetas en el eje x
display_labels = ["INA", "FUM", "EXP", "EXP+FUM", "UNK"]

# Crear el gráfico de barras
bars = plt.bar(display_labels, [probabilities[model.config.label2id[x]] * 100 for x in display_labels], color='dodgerblue', edgecolor='black', linewidth=1.5, alpha=0.8)

# Agregar etiquetas con las probabilidades en las barras
for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 2, round(yval, 2), ha='center', va='bottom', fontsize=10, color='black')

# Etiquetas para los ejes y título del gráfico
plt.xlabel("Etiqueta", fontsize=12)
plt.ylabel("Probabilidad (%)", fontsize=12)
plt.title("Probabilidades de etiqueta", fontsize=14)

# Ajustar los márgenes y mostrar el gráfico
plt.tight_layout()
plt.show()