# Cleaning des données

In [None]:
import os
import shutil
import traceback

## Telechargement des données

In [None]:
!wget 
!wget

In [None]:
IMAGE_PATH = "/content/drive/MyDrive/Openclassrooms/p8/P8_Cityscapes_leftImg8bit_trainvaltest.zip"
LABEL_PATH = (
    "/content/drive/MyDrive/Openclassrooms/p8/P8_Cityscapes_gtFine_trainvaltest.zip"
)

## Unzip des données

In [None]:
#!unzip -q {IMAGE_PATH} -d /content/drive/MyDrive/Openclassrooms/p8
#!unzip -q {LABEL_PATH} -d /content/drive/MyDrive/Openclassrooms/p8

In [None]:
input_dir = "/content/drive/MyDrive/Openclassrooms/p8/leftImg8bit"
target_dir = "/content/drive/MyDrive/Openclassrooms/p8/gtFine"
parents_dir = ["val", "test", "train"]
tag = "gtFine_color"

## Deplacer les images dans les repertoires parents (train, test, val)

In [None]:
def images_in_one_folder(base_dir, directories):
    for dir in directories:
        print(f"Directory: {dir}")
        folder_path = os.path.join(base_dir, dir)

        try:
            # Vérifier si le chemin existe
            if not os.path.exists(folder_path):
                print(f"Le chemin {folder_path} n'existe pas.")
                continue

            # Parcourir chaque sous-dossier dans le dossier courant (val, test, train)
            for folder in os.listdir(folder_path):
                folder_full_path = os.path.join(folder_path, folder)

                try:
                    # Vérifier si c'est un dossier
                    if os.path.isdir(folder_full_path):
                        # Parcourir chaque fichier dans le sous-dossier
                        for file in os.listdir(folder_full_path):
                            file_full_path = os.path.join(folder_full_path, file)

                            try:
                                # Déplacer le fichier dans le dossier parent
                                shutil.move(file_full_path, folder_path)
                                print(
                                    f"Fichier déplacé: {file_full_path} vers {folder_path}"
                                )
                            except Exception as e:
                                print(
                                    f"Erreur lors du déplacement du fichier {file_full_path}: {e}"
                                )
                                traceback.print_exc()

                        try:
                            # Supprimer le sous-dossier vide
                            os.rmdir(folder_full_path)
                            print(f"Dossier supprimé: {folder_full_path}")
                        except Exception as e:
                            print(
                                f"Erreur lors de la suppression du dossier {folder_full_path}: {e}"
                            )
                            traceback.print_exc()
                except Exception as e:
                    print(
                        f"Erreur lors du traitement du dossier {folder_full_path}: {e}"
                    )
                    traceback.print_exc()
        except Exception as e:
            print(f"Erreur lors du traitement du répertoire {dir}: {e}")
            traceback.print_exc()

    print("Tous les fichiers ont été déplacés.\n")


In [None]:
# Appel de la fonction pour les deux répertoires
images_in_one_folder(input_dir, parents_dir)
images_in_one_folder(target_dir, parents_dir)

## Garder uniquements le type de target dont ont a besoin

In [None]:
def clean_directories(base_dir, directories, tag):
    """
    Parcourt les dossiers spécifiés et supprime les fichiers qui ne contiennent pas le tag donné.

    :param base_dir: Le répertoire de base contenant les sous-dossiers à nettoyer.
    :param directories: Une liste des sous-dossiers à parcourir (par exemple, ['train', 'test', 'val']).
    :param tag: Le tag que les fichiers doivent contenir pour ne pas être supprimés.
    """
    for dir in directories:
        print(f"Directory: {dir}")
        folder_path = os.path.join(base_dir, dir)

        try:
            # Vérifier si le chemin existe
            if not os.path.exists(folder_path):
                print(f"Le chemin {folder_path} n'existe pas.")
                continue

            # Parcourir chaque fichier dans le dossier courant
            for file in os.listdir(folder_path):
                file_full_path = os.path.join(folder_path, file)

                try:
                    # Vérifier si c'est un fichier et s'il ne contient pas le tag
                    if os.path.isfile(file_full_path) and tag not in file:
                        # Supprimer le fichier
                        os.remove(file_full_path)
                        print(f"Fichier supprimé: {file_full_path}")
                except Exception as e:
                    print(f"Erreur lors du traitement du fichier {file_full_path}: {e}")
                    traceback.print_exc()

        except Exception as e:
            print(f"Erreur lors du traitement du répertoire {dir}: {e}")
            traceback.print_exc()

    print("Nettoyage terminé.\n")


In [None]:
#  nettoyer les répertoires
clean_directories(target_dir, parents_dir, tag)