## Importando variáveis de ambiente
Esse notebook prevê a existência de 2 variáveis de ambiente no arquivo .env desse projeto:
- DATA_FOLDER
- TRAINED_MODELS_FOLDER

In [None]:
from dotenv import load_dotenv
import os

load_dotenv(dotenv_path=".env")

DATA_FOLDER = os.getenv("DATA_FOLDER")
TRAINED_MODELS_FOLDER = os.getenv("TRAINED_MODELS_FOLDER")

## Bibliotecas

In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import models, transforms, datasets
from tqdm import tqdm

## Transforms (data augmentation online para o treino)

In [2]:
IMG_SIZE = 224 # trabalha com imagens 224x224 com 3 canais RGB, as transforms colocarão as imagens nesse padrão

train_transform = transforms.Compose([
    transforms.Resize((IMG_SIZE, IMG_SIZE)),
    transforms.RandomHorizontalFlip(),
    transforms.RandomRotation(10),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                         std=[0.229, 0.224, 0.225]),
])

val_transform = transforms.Compose([
    transforms.Resize((IMG_SIZE, IMG_SIZE)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], #normaliza os canais R, G e B da imagem para a ResNet50 ImageNet
                         std=[0.229, 0.224, 0.225]),
])

## Datasets e DataLoaders

In [3]:
from PIL import Image, UnidentifiedImageError

def safe_loader(path):
    try:
        return Image.open(path).convert("RGB")
    except UnidentifiedImageError:
        print(f"[ERRO] Imagem corrompida ignorada: {path}")
        # retorna uma imagem branca 224x224 (não quebra o DataLoader)
        return Image.new("RGB", (224, 224), (255, 255, 255))

In [None]:
data_dir = os.path.join(DATA_FOLDER, 'splits')

train_ds = datasets.ImageFolder(os.path.join(data_dir, "train"), transform=train_transform, loader=safe_loader) # shuffle evita aprender ordem
val_ds   = datasets.ImageFolder(os.path.join(data_dir, "val"),   transform=val_transform,   loader=safe_loader)
test_ds  = datasets.ImageFolder(os.path.join(data_dir, "test"),  transform=val_transform,  loader=safe_loader)

train_loader = DataLoader(train_ds, batch_size=32, shuffle=True, num_workers=4)
val_loader   = DataLoader(val_ds, batch_size=32, shuffle=False, num_workers=4)
test_loader  = DataLoader(test_ds, batch_size=32, shuffle=False, num_workers=4)

num_classes = len(train_ds.classes)
print("Total de classes:", num_classes)

Total de classes: 30


## Carregar a ResNet50 pré-treinada

In [5]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

# Carrega modelo ResNet50 já treinado com ImageNet (já sabefeatures gerais de imagens como bordas, textura, etc.)
model = models.resnet50(weights=models.ResNet50_Weights.IMAGENET1K_V2)

# Treina todas as camadas sem congelamento
for param in model.parameters():
    param.requires_grad = True 

# Substituir a última camada de 1000 classes (ImageNet) para 30 do nosso problema (fine tunning)
model.fc = nn.Linear(model.fc.in_features, num_classes)

model = model.to(device)

## Otimizador, Loss e Scheduler

In [6]:
criterion = nn.CrossEntropyLoss() # Função de Perda (Loss)

optimizer = optim.Adam(model.parameters(), lr=1e-4) # Otimizador baseado em gradiente

scheduler = optim.lr_scheduler.ReduceLROnPlateau( # ajusta a taxa de aprendizado se o progresso travar
    optimizer, factor=0.5, patience=3
)

## Funções de treino e validação

In [7]:
def train_one_epoch(model, loader, optimizer, criterion):
    model.train()
    total, correct, total_loss = 0, 0, 0

    # itera sob s batches (conjunto de imagens)
    for imgs, labels in tqdm(loader, desc="Treinando"):
        imgs, labels = imgs.to(device), labels.to(device) #carrega na cpu/gpu

        optimizer.zero_grad() # reseta o gradiente
        outputs = model(imgs) # obtém as classificações
        loss = criterion(outputs, labels) # obtém as predições comparando com os labels e calcula o loss
        
        loss.backward() # calcula o gradiente da loss em relação aos pesos 
        optimizer.step() # atualiza os pesos com base no gradiente

        # Métricas
        total_loss += loss.item() * imgs.size(0)
        _, preds = torch.max(outputs, 1)
        correct += (preds == labels).sum().item()
        total += imgs.size(0)

    return total_loss / total, correct / total


def validate(model, loader, criterion):
    model.eval()
    total, correct, total_loss = 0, 0, 0

    with torch.no_grad():
        for imgs, labels in tqdm(loader, desc="Validando"):
            imgs, labels = imgs.to(device), labels.to(device) # carrega
            outputs = model(imgs) # avalia
            loss = criterion(outputs, labels) # calcula a loss

            # Métricas
            total_loss += loss.item() * imgs.size(0)
            _, preds = torch.max(outputs, 1)
            correct += (preds == labels).sum().item()
            total += imgs.size(0)

    return total_loss / total, correct / total

## Loop de treinamento com Early Stopping

In [8]:
print(torch.cuda.is_available())
print(torch.cuda.device_count())
print(torch.cuda.get_device_name(0))

True
1
NVIDIA GeForce GTX 1650


In [None]:
EPOCHS = 1
best_val_acc = 0
patience = 6
wait = 0

for epoch in range(EPOCHS):
    print(f"\n===== Época {epoch+1}/{EPOCHS} =====")

    train_loss, train_acc = train_one_epoch(model, train_loader, optimizer, criterion)
    val_loss, val_acc = validate(model, val_loader, criterion)

    print(f"Treino  Loss: {train_loss:.4f}  Acc: {train_acc:.4f}")
    print(f"Validação Loss: {val_loss:.4f}  Acc: {val_acc:.4f}")

    scheduler.step(val_loss)

    # Early stopping
    if val_acc > best_val_acc:
        best_val_acc = val_acc
        wait = 0
        torch.save(model.state_dict(), os.path.join(TRAINED_MODELS_FOLDER,"best_resnet50.pth"))
        print("Modelo salvo (melhor até agora)")
    else:
        wait += 1
        print(f"Early stopping counter: {wait}/{patience}")

    if wait >= patience:
        print("Early stopping ativado")
        break


===== Época 1/100 =====


Treinando: 100%|██████████| 654/654 [05:53<00:00,  1.85it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.00it/s]


Treino  Loss: 1.1256  Acc: 0.6722
Validação Loss: 0.4350  Acc: 0.8689
Modelo salvo (melhor até agora)

===== Época 2/100 =====


Treinando: 100%|██████████| 654/654 [05:55<00:00,  1.84it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  5.97it/s]


Treino  Loss: 0.3224  Acc: 0.8979
Validação Loss: 0.4071  Acc: 0.8816
Modelo salvo (melhor até agora)

===== Época 3/100 =====


Treinando: 100%|██████████| 654/654 [05:55<00:00,  1.84it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  5.96it/s]


Treino  Loss: 0.1687  Acc: 0.9466
Validação Loss: 0.4371  Acc: 0.8861
Modelo salvo (melhor até agora)

===== Época 4/100 =====


Treinando: 100%|██████████| 654/654 [05:47<00:00,  1.88it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.16it/s]


Treino  Loss: 0.1068  Acc: 0.9678
Validação Loss: 0.4700  Acc: 0.8816
Early stopping counter: 1/6

===== Época 5/100 =====


Treinando: 100%|██████████| 654/654 [05:47<00:00,  1.88it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.13it/s]


Treino  Loss: 0.0826  Acc: 0.9741
Validação Loss: 0.4837  Acc: 0.8861
Early stopping counter: 2/6

===== Época 6/100 =====


Treinando: 100%|██████████| 654/654 [05:45<00:00,  1.89it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.35it/s]


Treino  Loss: 0.0675  Acc: 0.9796
Validação Loss: 0.4633  Acc: 0.8915
Modelo salvo (melhor até agora)

===== Época 7/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.91it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.34it/s]


Treino  Loss: 0.0264  Acc: 0.9926
Validação Loss: 0.4729  Acc: 0.9014
Modelo salvo (melhor até agora)

===== Época 8/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.91it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.35it/s]


Treino  Loss: 0.0144  Acc: 0.9958
Validação Loss: 0.5387  Acc: 0.8978
Early stopping counter: 1/6

===== Época 9/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.91it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.33it/s]


Treino  Loss: 0.0139  Acc: 0.9962
Validação Loss: 0.5230  Acc: 0.9014
Early stopping counter: 2/6

===== Época 10/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.38it/s]


Treino  Loss: 0.0160  Acc: 0.9955
Validação Loss: 0.5504  Acc: 0.8852
Early stopping counter: 3/6

===== Época 11/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.36it/s]


Treino  Loss: 0.0085  Acc: 0.9977
Validação Loss: 0.5233  Acc: 0.9087
Modelo salvo (melhor até agora)

===== Época 12/100 =====


Treinando: 100%|██████████| 654/654 [05:40<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.35it/s]


Treino  Loss: 0.0064  Acc: 0.9982
Validação Loss: 0.5442  Acc: 0.9078
Early stopping counter: 1/6

===== Época 13/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.36it/s]


Treino  Loss: 0.0060  Acc: 0.9985
Validação Loss: 0.5458  Acc: 0.9014
Early stopping counter: 2/6

===== Época 14/100 =====


Treinando: 100%|██████████| 654/654 [05:41<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.33it/s]


Treino  Loss: 0.0057  Acc: 0.9985
Validação Loss: 0.5517  Acc: 0.9014
Early stopping counter: 3/6

===== Época 15/100 =====


Treinando: 100%|██████████| 654/654 [05:40<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.35it/s]


Treino  Loss: 0.0037  Acc: 0.9991
Validação Loss: 0.5395  Acc: 0.9033
Early stopping counter: 4/6

===== Época 16/100 =====


Treinando: 100%|██████████| 654/654 [05:40<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.36it/s]


Treino  Loss: 0.0026  Acc: 0.9995
Validação Loss: 0.5379  Acc: 0.9051
Early stopping counter: 5/6

===== Época 17/100 =====


Treinando: 100%|██████████| 654/654 [05:40<00:00,  1.92it/s]
Validando: 100%|██████████| 35/35 [00:05<00:00,  6.38it/s]

Treino  Loss: 0.0024  Acc: 0.9995
Validação Loss: 0.5318  Acc: 0.9060
Early stopping counter: 6/6
Early stopping ativado





## Avaliar no conjunto de teste

In [10]:
model.load_state_dict(torch.load("best_resnet50.pth"))
test_loss, test_acc = validate(model, test_loader, criterion)
print("\nRESULTADO FINAL NO TESTE:")
print(f"Acurácia: {test_acc:.4f}")

Validando: 100%|██████████| 36/36 [00:05<00:00,  6.29it/s]


RESULTADO FINAL NO TESTE:
Acurácia: 0.9027





## Avaliar um classe específica do conjunto de testes

In [11]:
from torch.utils.data import Subset


classe_escolhida = "Gobio gobio"

# pega o índice da classe
idx_classe = test_ds.class_to_idx[classe_escolhida]
print("[INFO] Classe:", classe_escolhida, "-> índice:", idx_classe)

# filtra apenas imagens dessa classe
indices = [i for i, (_, lab) in enumerate(test_ds.samples) if lab == idx_classe]

# cria um subset
subset_classe = Subset(test_ds, indices)

# loader só dessa classe
test_loader_classe = torch.utils.data.DataLoader(
    subset_classe, batch_size=32, shuffle=False, num_workers=4
)

# avaliação
model.load_state_dict(torch.load("best_resnet50.pth"))
loss, acc = validate(model, test_loader_classe, criterion)

print(f"\n=== RESULTADOS PARA A CLASSE '{classe_escolhida}' ===")
print(f"Acurácia: {acc:.4f}")


[INFO] Classe: Gobio gobio -> índice: 12


Validando: 100%|██████████| 2/2 [00:00<00:00,  6.25it/s]


=== RESULTADOS PARA A CLASSE 'Gobio gobio' ===
Acurácia: 0.9143



