In [3]:
import os
import random
import shutil
import tensorflow as tf
import numpy as np
import math


# Ruta de la carpeta principal que contiene los datos
folder_path = "../Data/PetroImages_Augmentedx3"
# Ruta base para las 5 carpetas
output_base_path = "../Data/PetroImages_KFold"

In [4]:
# Proporción de datos para cada carpeta (porcentaje)
split_percentage = 20
random.seed(123)

# Lista de carpetas por clase
class_folders = os.listdir(folder_path)

# Itera a través de cada carpeta por clase
for class_folder in class_folders:
    class_path = os.path.join(folder_path, class_folder)

    # Lista de archivos en la carpeta actual
    files = os.listdir(class_path)
    # Baraja (shuffle) los archivos para dividir aleatoriamente
    random.shuffle(files)

    # Calcula la cantidad de datos para cada carpeta
    num_files = len(files)
    
    num_files_per_split = math.ceil(num_files * split_percentage / 100)
    
    # Crea las rutas para las 5 carpetas
    output_folders = [os.path.join(output_base_path, f"K_{i}", class_folder) for i in range(5)]

    # Crea las carpetas si no existen
    for folder in output_folders:
        os.makedirs(folder, exist_ok=True)

    # Mueve los archivos a las carpetas correspondientes
    for i in range(5):
        split_files = files[i * num_files_per_split: (i + 1) * num_files_per_split]
        output_folder = output_folders[i]

        for file in split_files:
            src = os.path.join(class_path, file)
            dst = os.path.join(output_folder, file)
            shutil.copy(src, dst)


In [6]:
def unir_carpetas(carpetas_origen, carpeta_destino):
    # Crear la carpeta de destino si no existe
    if not os.path.exists(carpeta_destino):
        os.makedirs(carpeta_destino)

    # Iterar sobre las carpetas de origen
    for carpeta in carpetas_origen:
        # Iterar sobre las subcarpetas dentro de cada carpeta de origen
        for subcarpeta in os.listdir(carpeta):
            subcarpeta_ruta = os.path.join(carpeta, subcarpeta)

            # Ignorar archivos no directorios
            if not os.path.isdir(subcarpeta_ruta):
                continue

            # Crear la subcarpeta en la carpeta de destino si no existe
            subcarpeta_destino = os.path.join(carpeta_destino, subcarpeta)
            if not os.path.exists(subcarpeta_destino):
                os.makedirs(subcarpeta_destino)

            # Copiar o mover las imágenes de la subcarpeta de origen a la subcarpeta de destino
            for archivo in os.listdir(subcarpeta_ruta):
                origen = os.path.join(subcarpeta_ruta, archivo)
                destino = os.path.join(subcarpeta_destino, archivo)

                # Puedes elegir entre copiar (shutil.copy) o mover (shutil.move) según tus necesidades
                shutil.copy(origen, destino)



In [7]:
# Especifica las carpetas de origen y destino
carpetas_origen = ["../Data/PetroImages_KFold/K_0", "../Data/PetroImages_KFold/K_1", "../Data/PetroImages_KFold/K_2", "../Data/PetroImages_KFold/K_3"]
Kfold0123 = "../Data/PetroImages_KFold/Kfold0123"

# Llama a la función para unir las carpetas
unir_carpetas(carpetas_origen, Kfold0123)
k_4 = "../Data/PetroImages_KFold/K_4"

# Especifica las carpetas de origen y destino
carpetas_origen = ["../Data/PetroImages_KFold/K_0", "../Data/PetroImages_KFold/K_1", "../Data/PetroImages_KFold/K_2", "../Data/PetroImages_KFold/K_4"]
Kfold0124 = "../Data/PetroImages_KFold/Kfold0124"

# Llama a la función para unir las carpetas
unir_carpetas(carpetas_origen, Kfold0124)
k_3 = "../Data/PetroImages_KFold/K_3"

# Especifica las carpetas de origen y destino
carpetas_origen = ["../Data/PetroImages_KFold/K_0", "../Data/PetroImages_KFold/K_1", "../Data/PetroImages_KFold/K_3", "../Data/PetroImages_KFold/K_4"]
Kfold0134 = "../Data/PetroImages_KFold/Kfold0134"

# Llama a la función para unir las carpetas
unir_carpetas(carpetas_origen, Kfold0134)
k_2 = "../Data/PetroImages_KFold/K_2"

# Especifica las carpetas de origen y destino
carpetas_origen = ["../Data/PetroImages_KFold/K_0", "../Data/PetroImages_KFold/K_2", "../Data/PetroImages_KFold/K_3", "../Data/PetroImages_KFold/K_4"]
Kfold0234 = "../Data/PetroImages_KFold/Kfold0234"

# Llama a la función para unir las carpetas
unir_carpetas(carpetas_origen, Kfold0234)
k_2 = "../Data/PetroImages_KFold/K_1"

# Especifica las carpetas de origen y destino
carpetas_origen = ["../Data/PetroImages_KFold/K_1", "../Data/PetroImages_KFold/K_2", "../Data/PetroImages_KFold/K_3", "../Data/PetroImages_KFold/K_4"]
Kfold1234 = "../Data/PetroImages_KFold/Kfold1234"

# Llama a la función para unir las carpetas
unir_carpetas(carpetas_origen, Kfold1234)
k_2 = "../Data/PetroImages_KFold/K_0"

In [83]:
#Cargar dataset
#Dividir dataset para entrenamiento y validación  
BATCH_SIZE = 64
IMG_SIZE = (224, 224)

# Crea el conjunto de datos de TensorFlow desde los directorios
k_ds = tf.keras.utils.image_dataset_from_directory(carpeta_destino,
                                                            shuffle=True,
                                                            seed = 123,
                                                            batch_size=BATCH_SIZE,
                                                            image_size=IMG_SIZE)

Found 19204 files belonging to 106 classes.


In [50]:
#Cargar dataset
#Dividir dataset para entrenamiento y validación  
BATCH_SIZE = 64
IMG_SIZE = (224, 224)

# Crea el conjunto de datos de TensorFlow desde los directorios
k0_ds = tf.keras.utils.image_dataset_from_directory(k_0,
                                                            shuffle=True,
                                                            seed = 123,
                                                            batch_size=BATCH_SIZE,
                                                            image_size=IMG_SIZE)
# Crea el conjunto de datos de TensorFlow desde los directorios
k1_ds = tf.keras.utils.image_dataset_from_directory(k_1,
                                                            shuffle=True,
                                                            seed = 123,
                                                            batch_size=BATCH_SIZE,
                                                            image_size=IMG_SIZE)
# Crea el conjunto de datos de TensorFlow desde los directorios
k2_ds = tf.keras.utils.image_dataset_from_directory(k_2,
                                                            shuffle=True,
                                                            seed = 123,
                                                            batch_size=BATCH_SIZE,
                                                            image_size=IMG_SIZE)
# Crea el conjunto de datos de TensorFlow desde los directorios
k3_ds = tf.keras.utils.image_dataset_from_directory(k_3,
                                                            shuffle=True,
                                                            seed = 123,
                                                            batch_size=BATCH_SIZE,
                                                            image_size=IMG_SIZE)
# Crea el conjunto de datos de TensorFlow desde los directorios
k4_ds = tf.keras.utils.image_dataset_from_directory(k_4,
                                                            shuffle=True,
                                                            seed = 123,
                                                            batch_size=BATCH_SIZE,
                                                            image_size=IMG_SIZE)


Found 4801 files belonging to 106 classes.
Found 4801 files belonging to 106 classes.
Found 4801 files belonging to 106 classes.
Found 4801 files belonging to 106 classes.
Found 4690 files belonging to 106 classes.
