In [3]:
import os
import pandas as pd
from sklearn.model_selection import train_test_split
from PIL import Image

In [1]:
def create_csv_and_split(dogs_folder, cats_folder):
    # Adquirir todos os caminhos dos arquivos
    dogs_files = [dogs_folder + '/' + f for f in os.listdir(dogs_folder) if os.path.isfile(os.path.join(dogs_folder, f))]
    cats_files = [cats_folder + '/' + f for f in os.listdir(cats_folder) if os.path.isfile(os.path.join(cats_folder, f))]

    # Criar dataframes para cada animal
    df_dogs = pd.DataFrame({'path': dogs_files, 'label': [1]*len(dogs_files)}) # 1 para cachorro
    df_cats = pd.DataFrame({'path': cats_files, 'label': [0]*len(cats_files)}) # 0 para gato

    # Unir os dataframes
    df = pd.concat([df_dogs, df_cats])

    # Reordenar e resetar o index
    df = df.sample(frac=1).reset_index(drop=True)

    # Dividir no conjunto de treino (80%) e um conjunto temporário (20%)
    train, tmp = train_test_split(df, test_size=0.2, random_state=42, stratify=df['label'])

    # Dividir o conjunto temporário igualmente entre teste e validação (cada um com 10% do total)
    valid, test = train_test_split(tmp, test_size=0.5, random_state=42, stratify=tmp['label'])

    # Salvar como CSVs
    train.to_csv('train.csv')
    valid.to_csv('valid.csv')
    test.to_csv('test.csv')

In [4]:
def redimensionar_imagens(caminho_diretorio, largura=256, altura=256):
    """
    Esta função redimensiona todas as imagens em um diretório específico para um tamanho dado.
    
    Parâmetros:
    caminho_diretorio (str): O caminho do diretório contendo as imagens.
    largura (int): A largura desejada das imagens.
    altura (int): A altura desejada das imagens.
    """
    def redimensionar_imagem(caminho_imagem):
        img = Image.open(caminho_imagem)
        img = img.resize((largura, altura))
        img.save(caminho_imagem)

    for nome_arquivo in os.listdir(caminho_diretorio):
        if nome_arquivo.endswith(".jpg") or nome_arquivo.endswith(".png"):
            redimensionar_imagem(os.path.join(caminho_diretorio, nome_arquivo))

In [5]:
redimensionar_imagens("data/cats")
redimensionar_imagens("data/dogs")

In [None]:
create_csv_and_split("data/dogs", "data/cats")
