In [1]:
import os
import numpy as np
from tensorflow.keras.preprocessing.image import ImageDataGenerator, img_to_array, load_img
from tensorflow.keras.utils import save_img

In [11]:
import os
import shutil
import numpy as np
from tensorflow.keras.preprocessing.image import ImageDataGenerator, img_to_array, load_img
from tensorflow.keras.utils import save_img

def augment_images(source_dir, target_dir, augmentation_factor=5):
    # Define los rangos de cada clase
    class_ranges = [(0, 236), (237, 437), (438, 710)]  # Los índices de inicio y fin para cada clase

    # Crea un generador de datos con técnicas de data augmentation
    datagen = ImageDataGenerator(
        rotation_range=40,
        width_shift_range=0.2,
        height_shift_range=0.2,
        shear_range=0.2,
        zoom_range=0.2,
        horizontal_flip=True,
        fill_mode='nearest'
    )
    
    # Asegurarse de que el directorio de destino existe
    os.makedirs(target_dir, exist_ok=True)

    # Inicializar contador general de imágenes
    img_index = 0

    # Procesar cada rango de clases
    for idx, (start_idx, end_idx) in enumerate(class_ranges):
        # Copiar y renombrar imágenes originales al directorio de destino
        for i in range(start_idx, end_idx):
            src_img_path = os.path.join(source_dir, f'{i}.jpg')
            if os.path.exists(src_img_path):
                dest_img_path = os.path.join(target_dir, f'{img_index}.jpg')
                shutil.copy(src_img_path, dest_img_path)
                img_index += 1

        # Aplicar data augmentation y guardar nuevas imágenes
        for i in range(start_idx, end_idx):
            img_path = os.path.join(source_dir, f'{i}.jpg')
            if os.path.exists(img_path):
                img = load_img(img_path)
                x = img_to_array(img)
                x = x.reshape((1,) + x.shape)

                # Generar imágenes aumentadas
                for _ in range(augmentation_factor):
                    img_array = next(datagen.flow(x, batch_size=1))
                    save_img(os.path.join(target_dir, f'{img_index}.jpg'), img_array[0])
                    img_index += 1

# Ejemplo de cómo llamar a la función
augment_images('image_dir', 'augmented_images', augmentation_factor=5)




If you augment an image, it may look very similar to the original image. For example, by only slightly adjusting the brightness or flipping the image. 

So, after many augmentations, you can have many copies of similar images in you dataset. If you train on some of these images, it is likely that the model will be able to predict the others correctly. So, if you include some augmented images, from the same image, in both the training and test set then you can over exaggerate your models accuracy. 

Alternatively, you could split the images into the training\test set and then augment them. This way you will not have similar images in the two sets. It is still best practise to also get the accuracy on the test set that is not augmented. 

I hope that makes se

Does this apply for generative models? I do not think sonse :)

Preservación de Contenido: Las transformaciones geométricas modifican la posición y orientación de los objetos en las imágenes, pero no alteran la esencia o el contenido principal. Esto es especialmente importante para los GANs, que necesitan aprender la distribución de datos real y generar nuevos ejemplos que sean visualmente similares a los datos de entrenamiento. Cambios geométricos permiten al modelo aprender a reconocer y generar objetos bajo diversas perspectivas y posiciones sin distorsionar las características fundamentales de los objetos.



0-1415 Adidas
1416-3067 Converse
3068-4247 Nike

In [13]:
def create_image_label_file(output_path):
    with open(output_path, 'w') as file:
        # Escribe las asignaciones para la clase 0
        for i in range(1416):
            file.write(f"{i}.jpg 0\n")
        
        # Escribe las asignaciones para la clase 1
        for i in range(1416, 3068):
            file.write(f"{i}.jpg 1\n")
        
        # Escribe las asignaciones para la clase 2
        for i in range(3068, 4248):
            file.write(f"{i}.jpg 2\n")

# Especifica la ruta y el nombre del archivo de salida
output_file_path = 'image_labels.txt'
create_image_label_file(output_file_path)
