In [2]:
import random
from scipy import ndarray
import skimage as sk
from skimage import transform
from skimage import util, io
from skimage import img_as_ubyte
import os

# On veut réaliser de la data augmentation sur le jeu de données d'entrainement 
# On défini donc des fonction permettant les transformations des images. 


# La fonction de random_rotation() prend en entrée l'image vectorisée et appliquera la rotation aléatoirement
def random_rotation(image_array: ndarray): 
    # Choisis aléatoirement entre une rotation de 25% vers la droite ou 25% vers la gauche 
    random_degree = random.uniform(-25, 25)
    return sk.transform.rotate(image_array, random_degree)


# La fonction random_noise() prend en entrée l'image vectorisée et appliquera un bruit à l'image 
def random_noise(image_array: ndarray): 
    return sk.util.random_noise(image_array)


# La fonction horizontal_flip() prend en entrée l'image vectorisée et appliquera un flip horizontal à l'image 
def horizontal_flip(image_array: ndarray): 
    return image_array[:, ::-1]

# Dictionnaire des transformations définis précédemment 
available_transfo = {
    'rotate': random_rotation, 
    'noise': random_noise, 
    'horizontal_flip': horizontal_flip
}

# On doit lister toutes les images présente dans le dossier d'entrainement 

folder_path_cat = 'clean_dataset/train/cat'

# Nombre d'image à générer : on souhaite que chaque image du jeu d'entrainement ait subit une transformation. 
# Cela va donc doubler le nombre d'image dans le jeu d'entrainement. 
cat_list = os.listdir('clean_dataset/train/cat')


num_files_desired_cat = len(cat_list)


num_generated_cat = 0 

while num_generated_cat <= num_files_desired_cat:  
    # Lis l'image comme un vecteur de pixels à deux dimensions 
    for cat_img_path in cat_list: 
        cat_img_to_transform = sk.io.imread(f'{folder_path_cat}/{cat_img_path}')
        
        # On pourra appliquer de 1 à 3 transformations sur une seule image
        # On choisit aléatoirement le nombre de transformations à appliquer
        num_transfo_to_apply = random.randint(1, len(available_transfo))
        
        
        num_transfo = 0 
        transformed_image_cat = 0 
        
        while num_transfo <= num_transfo_to_apply: 
            key = random.choice(list(available_transfo))
            transformed_image_cat = available_transfo[key](cat_img_to_transform)
            num_transfo += 1
            
            augmented_folder = 'clean_dataset/augmented_train/cat'

            # définit un nom pour la nouvelle image 
            new_file_path = '%s/cat.augmented_image_%s.jpg' % (augmented_folder, cat_img_path.split(".")[1])

            # écrit l'image sur le disque 
            sk.io.imsave(new_file_path, img_as_ubyte(transformed_image_cat))
        
        num_generated_cat+=1

In [3]:
# On applique la même procédure pour les images de chien 

# On doit lister toutes les images présente dans le dossier d'entrainement 

folder_path_dog = 'clean_dataset/train/dog'

# Nombre d'image à générer : on souhaite que chaque image du jeu d'entrainement ait subit une transformation. 
# Cela va donc doubler le nombre d'image dans le jeu d'entrainement. 
dog_list = os.listdir('clean_dataset/train/dog')


num_files_desired_dog = len(dog_list)


num_generated_dog = 0 

while num_generated_dog <= num_files_desired_dog:  
    # Lis l'image comme un vecteur de pixels à deux dimensions 
    for dog_img_path in dog_list: 
        dog_img_to_transform = sk.io.imread(f'{folder_path_dog}/{dog_img_path}')
        
        # On pourra appliquer de 1 à 3 transformations sur une seule image
        # On choisit aléatoirement le nombre de transformations à appliquer
        num_transfo_to_apply = random.randint(1, len(available_transfo))
        
        
        num_transfo = 0 
        transformed_image_dog = 0 
        
        while num_transfo <= num_transfo_to_apply: 
            key = random.choice(list(available_transfo))
            transformed_image_dog = available_transfo[key](dog_img_to_transform)
            num_transfo += 1
            
            augmented_folder = 'clean_dataset/augmented_train/dog'

            # définit un nom pour la nouvelle image 
            new_file_path = '%s/dog.augmented_image_%s.jpg' % (augmented_folder, dog_img_path.split(".")[1])

            # écrit l'image sur le disque 
            sk.io.imsave(new_file_path, img_as_ubyte(transformed_image_dog))
        
        num_generated_dog+=1