# Aumento de datos


@Tesis: Modelo de segmentación semántica de columnas de humo derivadas de incendios forestales en México

@Autor: Colvert Gomez Rubio

In [1]:
import warnings
warnings.filterwarnings('ignore')

### Librerías

In [2]:
from PIL import Image
import numpy as np
import os
from tqdm import tqdm

### Función de aumento de datos

In [3]:
def data_augmentation(image_path, mask_path, output_dir, num_images, name):
    """
    Aplica aumento de datos a una imagen y su máscara correspondiente y guarda las imágenes resultantes.

    Args:
        image_path (str): Ruta de la imagen original.
        mask_path (str): Ruta de la máscara original.
        output_dir (str): Directorio de salida para las imágenes aumentadas.
        num_images (int): Número de imágenes aumentadas a generar.
        name (str): Nombre base para las imágenes aumentadas.
    """
    # abrir imagen y máscara
    image = Image.open(image_path)
    mask = Image.open(mask_path)

    for i in range(num_images):
        # rotar imagen y máscara
        angle = np.random.randint(-15, 15)
        rotated_image = image.rotate(angle, resample=Image.BILINEAR)
        rotated_mask = mask.rotate(angle, resample=Image.NEAREST)

        # aplicar volteo horizontal y vertical
        if np.random.rand() < 0.5:
            rotated_image = rotated_image.transpose(Image.FLIP_LEFT_RIGHT)
            rotated_mask = rotated_mask.transpose(Image.FLIP_LEFT_RIGHT)
        if np.random.rand() < 0.5:
            rotated_image = rotated_image.transpose(Image.FLIP_TOP_BOTTOM)
            rotated_mask = rotated_mask.transpose(Image.FLIP_TOP_BOTTOM)

        # ajustar brillo de la imagen rotada
        brightness_factor = np.random.uniform(0.7, 1.3)
        adjusted_image = Image.fromarray((np.array(rotated_image) * brightness_factor).astype(np.uint8))

        # guardar imágenes resultantes en el directorio de salida
    
        output_image_path = os.path.join(output_dir, name + f"_{i}.png")
        output_mask_path = os.path.join(output_dir, name + f"_mask_{i}.gif")
        adjusted_image.save(output_image_path)
        rotated_mask.save(output_mask_path)

### Directorios

In [None]:
image_folder = 'C:/Users/colve/OneDrive/Documentos/MEGA/Centro Geo/Tesis/WILDFIRES-SMOKE-PLUMES-SEGMENTATION/wildfires-smoke-plumes-segmentation-dataset/train/'
mask_folder = 'C:/Users/colve/OneDrive/Documentos/MEGA/Centro Geo/Tesis/WILDFIRES-SMOKE-PLUMES-SEGMENTATION/wildfires-smoke-plumes-segmentation-dataset/train_masks/'
output_folder = 'C:/Users/colve/OneDrive/Documentos/MEGA/Centro Geo/Tesis/WILDFIRES-SMOKE-PLUMES-SEGMENTATION/wildfires-smoke-plumes-segmentation-dataset/augmented_data/'

### Ejecución

In [4]:
num_images = 2 # Número de trasnformaciones por imágen

# Obtén la lista de archivos de imagen en la carpeta de entrada
image_files = os.listdir(image_folder)

# Realiza el aumento de datos para cada imagen y máscara
for image_file in tqdm(image_files, desc="Processing images", unit="image"):
    # Obtén las rutas de la imagen y la máscara correspondiente
    image_path = os.path.join(image_folder, image_file)
    mask_file = image_file.replace(".png", "_mask.gif")
    mask_path = os.path.join(mask_folder, mask_file)

    name = image_file[:-4]

    # Aplica el aumento de datos
    data_augmentation(image_path, mask_path, output_folder, num_images, name)

Processing images:   0%|          | 0/731 [00:00<?, ?image/s]

Processing images: 100%|██████████| 731/731 [00:06<00:00, 113.42image/s]
