BCN20000 (TRAIN)

In [None]:
import os
import shutil
import pandas as pd
from tqdm import tqdm

# Función para formatear rutas correctamente
def format_path(path):
    return os.path.normpath(path)

# Configuración de rutas
csv_file = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\BCN20000\bcn_20k_train.csv")
input_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\BCN20000\train")
output_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\BCN20000\train")

# Crear carpetas de salida
malignant_dir = os.path.join(output_folder, "malignant")
benign_dir = os.path.join(output_folder, "benign")
unknown_dir = os.path.join(output_folder, "unknown")

os.makedirs(malignant_dir, exist_ok=True)
os.makedirs(benign_dir, exist_ok=True)
os.makedirs(unknown_dir, exist_ok=True)

# Cargar datos del archivo CSV
data = pd.read_csv(csv_file)

# Crear un diccionario para identificar las imágenes y sus diagnósticos
image_class_dict = dict(zip(data["bcn_filename"], data["diagnosis"]))

# Obtener lista de archivos en la carpeta de entrada
file_list = [f for f in os.listdir(input_folder) if f.endswith(('.jpg', '.jpeg', '.png'))]

# Clasificar las imágenes con indicador de progreso
for filename in tqdm(file_list, desc="Clasificando imágenes"):
    src_path = os.path.join(input_folder, filename)

    if filename in image_class_dict:
        # Clasificar como malignant o benign
        if image_class_dict[filename] in ["MEL", "SCC", "BCC"]:  # Lesiones malignas
            dst_path = os.path.join(malignant_dir, filename)
        elif image_class_dict[filename] in ["NV"]:  # Lesiones benignas
            dst_path = os.path.join(benign_dir, filename)
        else:
            # Clasificar como unknown si el diagnóstico no es reconocido
            dst_path = os.path.join(unknown_dir, filename)
    else:
        # Clasificar como unknown si no está en el CSV
        dst_path = os.path.join(unknown_dir, filename)

    # Copiar archivo a la carpeta correspondiente
    shutil.copy(src_path, dst_path)

# Finalización
print("\nClasificación completada. Las imágenes se han copiado en las carpetas:")
print(f"- Malignant: {malignant_dir}")
print(f"- Benign: {benign_dir}")
print(f"- Unknown: {unknown_dir}")


HAM10000 (TEST)

In [None]:
import os
import shutil
import pandas as pd
from tqdm import tqdm

# Función para formatear rutas correctamente
def format_path(path):
    return os.path.normpath(path)

# Configuración de rutas
csv_file = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\HAM10000\dataverse_files\ISIC2018_Task3_Test_GroundTruth.csv")
input_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\HAM10000\dataverse_files\resized_images\test")
output_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\HAM10000\dataverse_files\resized_images\test")

# Crear carpetas de salida
malignant_dir = os.path.join(output_folder, "malignant")
benign_dir = os.path.join(output_folder, "benign")
unknown_dir = os.path.join(output_folder, "unknown")

os.makedirs(malignant_dir, exist_ok=True)
os.makedirs(benign_dir, exist_ok=True)
os.makedirs(unknown_dir, exist_ok=True)

# Cargar datos del archivo CSV
data = pd.read_csv(csv_file)

# Crear un diccionario para identificar las imágenes y sus diagnósticos
image_class_dict = dict(zip(data["image_id"], data["dx"]))

# Obtener lista de archivos en la carpeta de entrada
file_list = [f for f in os.listdir(input_folder) if f.endswith(('.jpg', '.jpeg', '.png'))]

# Clasificar las imágenes con indicador de progreso
for filename in tqdm(file_list, desc="Clasificando imágenes"):
    image_id = os.path.splitext(filename)[0]  # Eliminar extensión
    src_path = os.path.join(input_folder, filename)

    if image_id in image_class_dict:
        # Clasificar como malignant o benign
        if image_class_dict[image_id] == "mel":  # Melanoma
            dst_path = os.path.join(malignant_dir, filename)
        else:  # Benigno
            dst_path = os.path.join(benign_dir, filename)
    else:
        # Clasificar como unknown si no está en el CSV
        dst_path = os.path.join(unknown_dir, filename)

    # Copiar archivo a la carpeta correspondiente
    shutil.copy(src_path, dst_path)

# Finalización
print("\nClasificación completada. Las imágenes se han copiado en las carpetas:")
print(f"- Malignant: {malignant_dir}")
print(f"- Benign: {benign_dir}")
print(f"- Unknown: {unknown_dir}")


HAM10000 (TRAIN)

In [None]:
import os
import shutil
import pandas as pd
from tqdm import tqdm

# Función para formatear rutas correctamente
def format_path(path):
    return os.path.normpath(path)

# Configuración de rutas
csv_file = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\HAM10000\dataverse_files\HAM10000_metadata")
input_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\HAM10000\dataverse_files\resized_images\train")
output_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\HAM10000\dataverse_files\resized_images\train")

# Crear carpetas de salida
malignant_dir = os.path.join(output_folder, "malignant")
benign_dir = os.path.join(output_folder, "benign")
unknown_dir = os.path.join(output_folder, "unknown")

os.makedirs(malignant_dir, exist_ok=True)
os.makedirs(benign_dir, exist_ok=True)
os.makedirs(unknown_dir, exist_ok=True)

# Cargar datos del archivo CSV
data = pd.read_csv(csv_file)

# Crear un diccionario para identificar las imágenes y sus diagnósticos
image_class_dict = dict(zip(data["image_id"], data["dx"]))

# Obtener lista de archivos en la carpeta de entrada
file_list = [f for f in os.listdir(input_folder) if f.endswith(('.jpg', '.jpeg', '.png'))]

# Clasificar las imágenes con indicador de progreso
for filename in tqdm(file_list, desc="Clasificando imágenes"):
    image_id = os.path.splitext(filename)[0]  # Eliminar extensión
    src_path = os.path.join(input_folder, filename)

    if image_id in image_class_dict:
        # Clasificar como malignant o benign
        if image_class_dict[image_id] == "mel":  # Melanoma
            dst_path = os.path.join(malignant_dir, filename)
        elif image_class_dict[image_id] in ["nv", "bkl"]:  # Benigno
            dst_path = os.path.join(benign_dir, filename)
        else:
            # Clasificar como unknown si el diagnóstico no es reconocido
            dst_path = os.path.join(unknown_dir, filename)
    else:
        # Clasificar como unknown si no está en el CSV
        dst_path = os.path.join(unknown_dir, filename)

    # Copiar archivo a la carpeta correspondiente
    shutil.copy(src_path, dst_path)

# Finalización
print("\nClasificación completada. Las imágenes se han copiado en las carpetas:")
print(f"- Malignant: {malignant_dir}")
print(f"- Benign: {benign_dir}")
print(f"- Unknown: {unknown_dir}")


ISIC (TEST) - No hay diagnostico disponible

ISIC (TRAIN)

In [None]:
import os
import shutil
import pandas as pd
from tqdm import tqdm

# Función para formatear rutas correctamente
def format_path(path):
    return os.path.normpath(path)

# Configuración de rutas
csv_file = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\ISIC\train.csv")
input_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\ISIC\resized_images\train")
output_folder = format_path(r"C:\Users\Marc\Desktop\UNI\TFG\DATABASE_build\Sources\ISIC\resized_images\train")

# Crear carpetas de salida
malignant_dir = os.path.join(output_folder, "malignant")
benign_dir = os.path.join(output_folder, "benign")
unknown_dir = os.path.join(output_folder, "unknown")

os.makedirs(malignant_dir, exist_ok=True)
os.makedirs(benign_dir, exist_ok=True)
os.makedirs(unknown_dir, exist_ok=True)

# Cargar datos del archivo CSV
data = pd.read_csv(csv_file)

# Crear un diccionario para identificar las imágenes y su clasificación
image_class_dict = dict(zip(data["image_name"], data["benign_malignant"]))

# Obtener lista de archivos en la carpeta de entrada
file_list = [f for f in os.listdir(input_folder) if f.endswith(('.jpg', '.jpeg', '.png'))]

# Clasificar las imágenes con indicador de progreso
for filename in tqdm(file_list, desc="Clasificando imágenes"):
    image_id = os.path.splitext(filename)[0]  # Eliminar extensión
    src_path = os.path.join(input_folder, filename)

    if image_id in image_class_dict:
        # Clasificar como malignant o benign
        if image_class_dict[image_id] == "malignant":  # Maligno
            dst_path = os.path.join(malignant_dir, filename)
        elif image_class_dict[image_id] == "benign":  # Benigno
            dst_path = os.path.join(benign_dir, filename)
        else:
            # Clasificar como unknown si la clasificación no es reconocida
            dst_path = os.path.join(unknown_dir, filename)
    else:
        # Clasificar como unknown si no está en el CSV
        dst_path = os.path.join(unknown_dir, filename)

    # Copiar archivo a la carpeta correspondiente
    shutil.copy(src_path, dst_path)

# Finalización
print("\nClasificación completada. Las imágenes se han copiado en las carpetas:")
print(f"- Malignant: {malignant_dir}")
print(f"- Benign: {benign_dir}")
print(f"- Unknown: {unknown_dir}")
