### Find non-common

In [4]:
import os

def obtener_nombres_archivos(carpetas):
    nombres = set()
    for carpeta in carpetas:
        for archivo in os.listdir(carpeta):
            nombre_archivo, _ = os.path.splitext(archivo)
            nombres.add(nombre_archivo)
    return nombres

def encontrar_archivos_no_comunes(carpeta1, carpeta2):
    nombres_carpeta1 = obtener_nombres_archivos([carpeta1])
    nombres_carpeta2 = obtener_nombres_archivos([carpeta2])
    
    archivos_no_comunes = nombres_carpeta1.symmetric_difference(nombres_carpeta2)
    return archivos_no_comunes

carpeta_txt = 'YOLO-seg/Train/datasets/val/labels'
carpeta_jpg = 'YOLO-seg/Train/datasets/val/images'

archivos_no_comunes = encontrar_archivos_no_comunes(carpeta_txt, carpeta_jpg)

print("Archivos no comunes encontrados:")
for archivo in archivos_no_comunes:
    print(archivo)

Archivos no comunes encontrados:


### Create .txt files from mismatched files
This script generates .txt files for images that don't have their associated file. This needs to be done when annotations are generated only for images with annotations and not for the entire set of images.

In [45]:
import os

def obtener_nombres_archivos(carpetas):
    nombres = set()
    for carpeta in carpetas:
        for archivo in os.listdir(carpeta):
            nombre_archivo, _ = os.path.splitext(archivo)
            nombres.add(nombre_archivo)
    return nombres

def encontrar_archivos_no_comunes(carpeta1, carpeta2):
    nombres_carpeta1 = obtener_nombres_archivos([carpeta1])
    nombres_carpeta2 = obtener_nombres_archivos([carpeta2])
    
    archivos_no_comunes = nombres_carpeta1.symmetric_difference(nombres_carpeta2)
    return archivos_no_comunes

def generar_archivo_txt(nombre_archivo, carpeta):
    with open(os.path.join(carpeta, nombre_archivo + ".txt"), "w") as file:
        pass
        
carpeta_txt = 'Campañas/Transectos/IC222_TF05_auto_annotate_labels'
carpeta_jpg = 'Campañas/Transectos/IC222_TF05 (copy)'

archivos_no_comunes = encontrar_archivos_no_comunes(carpeta_txt, carpeta_jpg)

print("Archivos no comunes encontrados:")
for archivo in archivos_no_comunes:
    print(archivo)
    generar_archivo_txt(archivo, carpeta_txt)

Archivos no comunes encontrados:
IC222_TF05_2373


### Delete mismatched files
It's most likely these are images, given that the auto-annotation process only generates a .txt annotation file when it finds an object in the image.

Explanation:

In the context of image annotation, this means:

Auto-annotation: A tool or process has automatically analyzed your images to identify and label objects within them.
Mismatched files: Some of your original image files don't have corresponding .txt annotation files. This is because the auto-annotation tool didn't detect any objects worth labeling in those images.
Deletion: The suggestion is to delete these mismatched image files, as they don't have any associated annotations and might not be useful for your project.

In [35]:
import os
import shutil

def obtener_nombres_base(carpeta):
    """Obtiene los nombres base (sin extensión) de todos los elementos dentro de una carpeta."""
    nombres_base = set()
    for elemento in os.listdir(carpeta):
        nombre_base, _ = os.path.splitext(elemento)
        nombres_base.add(nombre_base)
    return nombres_base

def encontrar_y_borrar_elementos_no_comunes(carpeta1, carpeta2):
    """Encuentra y borra elementos cuyos nombres base no coinciden entre dos carpetas."""
    nombres_base_carpeta1 = obtener_nombres_base(carpeta1)
    nombres_base_carpeta2 = obtener_nombres_base(carpeta2)

    nombres_base_no_comunes = nombres_base_carpeta1.symmetric_difference(nombres_base_carpeta2)

    for nombre_base in nombres_base_no_comunes:
        for carpeta in [carpeta1, carpeta2]:
            for elemento in os.listdir(carpeta):
                if elemento.startswith(nombre_base):  # Comprobar si el nombre base coincide
                    ruta_elemento = os.path.join(carpeta, elemento)
                    if os.path.exists(ruta_elemento):
                        print(f"Borrar elemento: {ruta_elemento} (s/n)?")
                        confirmacion = input().lower()
                        if confirmacion == 's':
                            try:
                                if os.path.isfile(ruta_elemento):
                                    os.remove(ruta_elemento)
                                else:
                                    shutil.rmtree(ruta_elemento)
                                print(f"Elemento borrado: {ruta_elemento}")
                            except Exception as e:
                                print(f"Error al borrar {ruta_elemento}: {e}")

# Carpetas a comparar (asegúrate de que las rutas sean correctas)
carpeta_txt = 'Campañas/Transectos/A0410_TF09_auto_annotate_labels'
carpeta_jpg = 'Campañas/Transectos/A0410_TF09 (copy)'

# Ejecutar la búsqueda y borrado
encontrar_y_borrar_elementos_no_comunes(carpeta_txt, carpeta_jpg)