Olá, nesse notebook a idéia é, utilizando o PyTorch, resolver um problema de classificação de imagens de tomates e maçãs. 
O dataset utilizado é o Apples or Tomatoes obtido no Kaggle.

Para começar, vamos importar as bibliotecas necessárias e carregar o dataset.
Certifique-se de já ter rodado o pip install requirements.txt do dir root desse projeto.

In [7]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import DataLoader
from torchvision.datasets import ImageFolder
import matplotlib.pyplot as plt
import numpy as np

No PyTorch se utiliza **Transforms** para pré-processar imagens. 

O transforms no PyTorch faz parte do *torchvision.transforms*, que é um módulo responsável por pré-processar imagens antes de passá-las para um modelo de deep learning. Ele é essencial para normalização, redimensionamento e aumento de dados (data augmentation).

**Os modelos de deep learning convergem mais rápido se os valores dos pixels forem normalizados.**

In [8]:
# Definição das transformações para normalizar e aumentar os dados
transform = transforms.Compose([
    transforms.Resize((150, 150)),  # Redimensionar para tamanho fixo
    transforms.RandomHorizontalFlip(),
    transforms.RandomRotation(20),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.5, 0.5, 0.5], std=[0.5, 0.5, 0.5])
])

Agora vamos definir o caminho de diretório das imagens, e em seguida, vincular eles com o transform.

Após feita a vinculação vamos verificar as classes que foram criadas a partir dos arquivos, 




In [20]:
# Diretórios das imagens - Caminho Absoluto
train_dir = "C:\\Users\\Matheus\\Documents\\Github Projects\\research_MLs\\projects\\LMs\\dataset\\tomatoes_vs_apples\\train"
test_dir = "C:\\Users\\Matheus\\Documents\\Github Projects\\research_MLs\\projects\\LMs\\dataset\\tomatoes_vs_apples\\test"

# Carregamento dos datasets
train_dataset = ImageFolder(root=train_dir, transform=transform)
test_dataset = ImageFolder(root=test_dir, transform=transform)

# Verificando classes
print("Classes de Treino: ",train_dataset.class_to_idx)
print("Classes de Teste: ",test_dataset.class_to_idx)





Após isso vamos criar os **DataLoaders** para carregar os dados e separar em lotes.

O DataLoader é uma classe em PyTorch que cuida de carregar os dados e fornecer lotes de amostras durante o treinamento de um modelo. Ele divide os dados em batches (lotes) e permite que o treinamento seja feito em pedaços menores, em vez de carregar toda a base de dados de uma vez.

- *batch_size*: Define o número de amostras processadas em cada passo de treinamento. Exemplo: 32 imagens por vez.

- *shuffle*: Se for True, embaralha os dados a cada época de treinamento para garantir que o modelo não aprenda padrões artificiais pela ordem dos dados.


In [None]:
# Criar DataLoaders para treinar em batches
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)