In [4]:
import os
from PIL import Image
import hashlib


In [5]:
def hash_image(image_path):
    """Genera el hash MD5 de la imagen para comparar duplicados."""
    with Image.open(image_path) as img:
        return hashlib.md5(img.tobytes()).hexdigest()

def eliminar_imagenes_identicas_en_subcarpetas(base_folder):
    """Elimina imágenes idénticas en todas las subcarpetas de un directorio."""
    for folder_name in os.listdir(base_folder):
        folder_path = os.path.join(base_folder, folder_name)
        
        if os.path.isdir(folder_path):
            images_hash = {}
            removed_files = 0
            
            # Busca todas las imágenes dentro de la subcarpeta
            for root, dirs, files in os.walk(folder_path):
                for file in files:
                    if file.endswith(('png', 'jpg', 'jpeg')):
                        file_path = os.path.join(root, file)
                        img_hash = hash_image(file_path)

                        if img_hash in images_hash:
                            # Imagen duplicada encontrada, se elimina
                            os.remove(file_path)
                            removed_files += 1
                            print(f"Eliminado duplicado: {file_path}")
                        else:
                            # Almacena el hash de la imagen si no es duplicada
                            images_hash[img_hash] = file_path

            print(f"Proceso completado en {folder_name}. Total de archivos eliminados: {removed_files}")

In [6]:
# Ejemplo de uso
base_folder = r"D:\Python\TESIS\CLUSTERS_C4_CALC_K"  # Directorio raíz donde están todas las carpetas
eliminar_imagenes_identicas_en_subcarpetas(base_folder)


Proceso completado en ARMONICO. Total de archivos eliminados: 0
Proceso completado en ARMONICOS. Total de archivos eliminados: 0
Proceso completado en CADI_720-001. Total de archivos eliminados: 0
Proceso completado en CADI_720-111. Total de archivos eliminados: 0
Proceso completado en CADI_722-011. Total de archivos eliminados: 0
Proceso completado en CADI_722-100. Total de archivos eliminados: 0
Proceso completado en CADI_722-110. Total de archivos eliminados: 0
Proceso completado en CADI_722-111. Total de archivos eliminados: 0
Proceso completado en CADI_722-1U10. Total de archivos eliminados: 0
Proceso completado en PROB_PIM. Total de archivos eliminados: 0
