## __CNN Resnet para la clasificación de cultivos de palma de aceite en Colombia__

El presente notebook realiza la redimensión de las imágenes satelitales extraidas para que queden con un tamaño de 256x256 px.

In [7]:
import os
from PIL import Image

# Define el directorio de origen y destino
#src_dir = "C:\\PalmOilDataSet\\Images\\Test\\PalmOil"
#dst_dir = "C:\\PalmOilDataSet\\Images256\\Test\\PalmOil"

src_dir = "C:\PalmOilDataSet\ExternalValidation"
dst_dir = "C:\PalmOilDataSet\ExternalValidation256"

# Define el nuevo tamaño de imagen
new_size = (256, 256)

# Itera a través de cada imagen en el directorio de origen
for filename in os.listdir(src_dir):
    # Abre la imagen y redimensiona a un nuevo tamaño
    img = Image.open(os.path.join(src_dir, filename))
    img = img.resize(new_size, resample=Image.BILINEAR)

    # Guarda la imagen redimensionada en el directorio de destino
    img.save(os.path.join(dst_dir, filename))

En el siguiente codigo se realiza una clasificación con una función randos, de tal forma que nos quede del total de la información : Data para entrenamiento train, data para la validación en el momento de entrenamiento de la red neuronal validation, y data para Test cuando la CNN ya ha sido entrenada. 

In [4]:
import os
import random
import shutil
from sklearn.model_selection import train_test_split

# Ruta de la carpeta original
carpeta_original = 'C:/PalmOilDataSet/NOTPalmOil'

# Ruta de las carpetas de salida
carpeta_train = 'C:/PalmOilDataSet/final/train/NOTPalmOil'
carpeta_validation = 'C:/PalmOilDataSet/final/validation/NOTPalmOil'
carpeta_test = 'C:/PalmOilDataSet/final/test/NOTPalmOil'

# Porcentaje para cada conjunto (train, validation, test)
porcentaje_train = 0.7
porcentaje_validation = 0.2
porcentaje_test = 0.1

# Obtener la lista de imágenes en la carpeta original
imagenes = os.listdir(carpeta_original)

# Dividir las imágenes en conjuntos de entrenamiento y prueba
imagenes_train, imagenes_test = train_test_split(imagenes, test_size=porcentaje_test, random_state=42)

# Dividir las imágenes de entrenamiento en conjuntos de entrenamiento y validación
imagenes_train, imagenes_validation = train_test_split(imagenes_train, test_size=porcentaje_validation/(porcentaje_train+porcentaje_validation), random_state=42)

# Crear las carpetas de salida si no existen
os.makedirs(carpeta_train, exist_ok=True)
os.makedirs(carpeta_validation, exist_ok=True)
os.makedirs(carpeta_test, exist_ok=True)

# Mover las imágenes a las carpetas correspondientes
for imagen in imagenes_train:
    shutil.copy(os.path.join(carpeta_original, imagen), carpeta_train)

for imagen in imagenes_validation:
    shutil.copy(os.path.join(carpeta_original, imagen), carpeta_validation)

for imagen in imagenes_test:
    shutil.copy(os.path.join(carpeta_original, imagen), carpeta_test)

In [None]:
import os
import shutil
import random


def delete_files_in_directory(directory):
    for file in os.listdir(directory):
        file_path = os.path.join(directory, file)
        if os.path.isfile(file_path):
            os.unlink(file_path)

def split_images_into_train_test(source, test_path, train_path, test_count):
    # List all files in the specified folder
    images = os.listdir(source)

    # Select random images for the test set
    test_images = random.sample(images, test_count)

    # Copy the selected images to the test set
    for image in test_images:
        shutil.copy(os.path.join(source, image), os.path.join(test_path, image))

    # Copy the remaining images to the train set
    for image in images:
        if image not in test_images:
            shutil.copy(os.path.join(source, image), os.path.join(train_path, image))
