In [None]:
def copy_and_rename_files(source_image_dir, source_label_dir, destination_image_dir, destination_label_dir):
    image_files = os.listdir(source_image_dir)
    label_files = os.listdir(source_label_dir)

    for image_file in image_files:
        image_source_path = os.path.join(source_image_dir, image_file)
        label_file = f"{os.path.splitext(image_file)[0]}.txt"
        label_source_path = os.path.join(source_label_dir, label_file)

        if os.path.exists(label_source_path):
            image_dest_path = os.path.join(destination_image_dir, f"new_{image_file}")
            label_dest_path = os.path.join(destination_label_dir, f"new_{label_file}")

            shutil.copy2(image_source_path, image_dest_path)
            shutil.copy2(label_source_path, label_dest_path)

# Chemin vers le dossier principal de destination
dossier_destination_principal = "/content/drive/MyDrive/data/DATA"

# Parcourir les 10 dossiers sources
for i in range(1, 11):
    # Chemin vers le dossier courant de la source
    dossier_source_courant = os.path.join("/content/drive/MyDrive/data", f"dossier{i}")

    # Parcourir les sous-dossiers "test", "train" et "valid"
    sous_dossiers = ["test", "train", "valid"]
    for sous_dossier in sous_dossiers:
        # Chemin vers le dossier "images" de la source
        dossier_images_source = os.path.join(dossier_source_courant, sous_dossier, "images")

        # Chemin vers le dossier "labels" de la source
        dossier_labels_source = os.path.join(dossier_source_courant, sous_dossier, "labels")

        # Chemin vers le dossier "images" de la destination
        dossier_images_destination = os.path.join(dossier_destination_principal, sous_dossier, "images")

        # Chemin vers le dossier "labels" de la destination
        dossier_labels_destination = os.path.join(dossier_destination_principal, sous_dossier, "labels")

        # Crée le dossier "images" de la destination s'il n'existe pas
        os.makedirs(dossier_images_destination, exist_ok=True)

        # Crée le dossier "labels" de la destination s'il n'existe pas
        os.makedirs(dossier_labels_destination, exist_ok=True)

        # Copie les fichiers d'images et d'annotations en les renommant de manière compréhensible
        copy_and_rename_files(dossier_images_source, dossier_labels_source, dossier_images_destination, dossier_labels_destination)


In [None]:
def check_data_preparation(image_dir, label_dir):
    image_files = set([os.path.splitext(file)[0] for file in os.listdir(image_dir)])
    label_files = set([os.path.splitext(file)[0] for file in os.listdir(label_dir)])

    missing_labels = image_files - label_files
    missing_images = label_files - image_files

    if len(missing_labels) == 0 and len(missing_images) == 0:
        print("La préparation des données est correcte. Tous les fichiers d'images ont leurs annotations correspondantes.")
    else:
        if len(missing_labels) > 0:
            print("Attention : Certains fichiers d'images n'ont pas d'annotations correspondantes :")
            print("\n".join(missing_labels))

        if len(missing_images) > 0:
            print("Attention : Certains fichiers d'annotations n'ont pas d'images correspondantes :")
            print("\n".join(missing_images))

# Chemin vers le dossier principal de destination
dossier_destination_principal = "/content/drive/MyDrive/data/DATA"

sous_dossiers = ["test", "train", "valid"]
for sous_dossier in sous_dossiers:
    # Chemin vers le dossier "images" de la source
    image_directory = os.path.join(dossier_source_courant, sous_dossier, "images")

    # Chemin vers le dossier "labels" de la source
    label_directory = os.path.join(dossier_source_courant, sous_dossier, "labels")

    check_data_preparation(image_directory, label_directory)


In [None]:
# Chemin vers le dossier principal contenant les 10 dossiers
dossier_courant = "/content/drive/MyDrive/data/DATA"

# Parcourir les sous-dossiers "test", "train" et "valid"
sous_dossiers = ["test", "train", "valid"]
for sous_dossier in sous_dossiers:
    # Chemin vers le dossier "labels"
    dossier_labels = os.path.join(dossier_courant, sous_dossier, "labels")

    # Parcourir les fichiers texte dans le dossier "labels"
    fichiers_txt = [f for f in os.listdir(dossier_labels) if f.endswith(".txt")]
    for fichier_txt in fichiers_txt:
        # Chemin vers le fichier texte
        chemin_fichier_txt = os.path.join(dossier_labels, fichier_txt)

        # Lire le contenu du fichier
        with open(chemin_fichier_txt, "r") as f:
            lignes = f.readlines()

        # Modifier la première valeur de chaque ligne par 0
        lignes_modifiees = ["0 " + ligne.split(" ", 1)[1] for ligne in lignes]

        # Écrire les lignes modifiées dans le fichier
        with open(chemin_fichier_txt, "w") as f:
            f.writelines(lignes_modifiees)

In [None]:
def check_first_value_zero(directory_path):
    all_first_values_zero = True

    for root, dirs, files in os.walk(directory_path):
        for file in files:
            if file.endswith(".txt"):
                file_path = os.path.join(root, file)

                with open(file_path, "r") as f:
                    lines = f.readlines()

                for line in lines:
                    first_value = line.split()[0]
                    if first_value != "0":
                        all_first_values_zero = False
                        break

                if not all_first_values_zero:
                    break

        if not all_first_values_zero:
            break

    return all_first_values_zero

# Chemin vers le dossier principal contenant les 10 dossiers
dossier_courant = "/content/drive/MyDrive/data/DATA"


# Parcourir les sous-dossiers "test", "train" et "valid"
sous_dossiers = ["test", "train", "valid"]
for sous_dossier in sous_dossiers:
    # Chemin vers le dossier "labels"
    dossier_labels = os.path.join(dossier_courant, sous_dossier, "labels")

    if check_first_value_zero(dossier_labels):
        print(f"Toutes les premières valeurs de chaque ligne des fichiers dans {dossier_labels} sont '0'.")
    else:
        print(f"Attention : Certaines premières valeurs de lignes des fichiers dans {dossier_labels} ne sont pas '0'.")


In [None]:
def check_duplicate_filenames_in_directories(directories):
    all_files = set()
    duplicate_file_names = set()

    for directory in directories:
        for root, _, files in os.walk(directory):
            for file in files:
                file_path = os.path.join(root, file)
                if file in all_files:
                    duplicate_file_names.add(file)
                else:
                    all_files.add(file)

    return duplicate_file_names

# List of directories to check for duplicate filenames
directories_to_check = [
    "/content/drive/MyDrive/data/DATA/train/labels",
    "/content/drive/MyDrive/data/DATA/train/images",
    "/content/drive/MyDrive/data/DATA/test/labels",
    "/content/drive/MyDrive/data/DATA/test/images",
    "/content/drive/MyDrive/data/DATA/valid/labels",
    "/content/drive/MyDrive/data/DATA/valid/images"
]

duplicate_filenames = check_duplicate_filenames_in_directories(directories_to_check)

if duplicate_filenames:
    print("Duplicate filenames found:")
    for filename in duplicate_filenames:
        print(f"  - {filename}")
else:
    print("No duplicate filenames found.")