# 05 — Hipótese 1: DenseNet121
## Arquitetura Mais Profunda | Augmentation Leve | Sem Class Weight



Diretório raiz esperado:

C:/projects/xray-project/

Objetivo deste experimento:

Testar a hipótese de que arquiteturas mais profundas
(DenseNet121) conseguem capturar padrões mais complexos
em imagens de raio-X quando comparadas à ResNet18.

Configuração:

- Modelo: DenseNet121
- Augmentation: leve
- Class Weight: não utilizado
- Métrica principal: ROC-AUC

Arquivos utilizados:
- data/metadata/train_split.csv
- data/metadata/val_split.csv

Arquivos gerados:
- models/densenet121_light_noCW.pt
- outputs/metrics/densenet121_light_noCW.pkl

Este experimento será comparado diretamente com o baseline.


In [2]:
import os

NOTEBOOK_DIR = os.getcwd()
PROJECT_ROOT = os.path.abspath(os.path.join(NOTEBOOK_DIR, ".."))

print("Project root:", PROJECT_ROOT)


Project root: c:\projects\xray-project


In [3]:
import sys
import torch
import torch.nn as nn
import pandas as pd
import numpy as np

SRC_PATH = os.path.join(PROJECT_ROOT, "src")

if SRC_PATH not in sys.path:
    sys.path.append(SRC_PATH)

from dataset import XRayDataset
from transforms import get_transforms
from model import get_model
from train_utils import train_model
from utils import set_seed, create_directories, save_metrics
from torch.utils.data import DataLoader


## Reprodutibilidade

Mantemos a mesma seed utilizada no baseline
para garantir comparação justa.


In [4]:
set_seed(42)


## Preparação de Diretórios

Garantimos a existência das pastas:

- models/
- outputs/metrics/
v

In [5]:
models_dir, metrics_dir, _ = create_directories(PROJECT_ROOT)


## Carregamento dos Splits

Utilizamos os mesmos splits congelados
para manter o controle experimental.


In [14]:
metadata_dir = os.path.join(PROJECT_ROOT, "data", "metadata")

train_df = pd.read_csv(os.path.join(metadata_dir, "train_split.csv"))
val_df = pd.read_csv(os.path.join(metadata_dir, "val_split.csv"))

print("Treino:", len(train_df))
print("Validação:", len(val_df))


Treino: 4093
Validação: 1139


## Configuração da Hipótese 1

Alteração em relação ao baseline:

Modelo: DenseNet121

Mantemos:
- Augmentation leve
- Sem class weight
- Mesmos hiperparâmetros


In [15]:
model_name = "densenet121"
augmentation = "light"
use_class_weight = False

batch_size = 16
epochs = 10
learning_rate = 1e-4

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Dispositivo:", device)


Dispositivo: cpu


## Datasets e DataLoaders

As transformações permanecem iguais ao baseline.


In [17]:
train_transform, val_transform = get_transforms(
    img_size=224,
    augmentation=augmentation
)

train_dataset = XRayDataset(train_df, transform=train_transform)
val_dataset = XRayDataset(val_df, transform=val_transform)

train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=batch_size, shuffle=False)


## Instanciação do DenseNet121

Modelo definido em src/model.py


In [18]:
model, target_layer = get_model(model_name=model_name)
model = model.to(device)




## Função de Perda e Otimizador

Sem utilização de class weight nesta etapa.


In [19]:
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)


## Padrão de Nomeação

Formato:
modelo_augmentation_classweight


In [20]:
model_filename = f"{model_name}_{augmentation}_{'CW' if use_class_weight else 'noCW'}.pt"
metrics_filename = f"{model_name}_{augmentation}_{'CW' if use_class_weight else 'noCW'}.pkl"

model_save_path = os.path.join(models_dir, model_filename)
metrics_save_path = os.path.join(metrics_dir, metrics_filename)


## Treinamento

O loop de treino está implementado em src/train_utils.py.

Durante o treinamento:
- Barra de progresso por batch
- ROC-AUC calculada por época
- Melhor modelo salvo automaticamente


In [21]:
history, best_auc = train_model(
    model,
    train_loader,
    val_loader,
    criterion,
    optimizer,
    device,
    epochs,
    model_save_path
)


                                                                                     


Epoch 1/10
Train Loss: 0.1481
Val Loss:   0.0556
Val AUC:    0.9980
Val F1:     0.9891
Val Recall: 0.9908
Val Prec.:  0.9874
→ Novo melhor modelo salvo.


                                                                                      


Epoch 2/10
Train Loss: 0.0748
Val Loss:   0.0541
Val AUC:    0.9986
Val F1:     0.9867
Val Recall: 0.9782
Val Prec.:  0.9953
→ Novo melhor modelo salvo.


                                                                                      


Epoch 3/10
Train Loss: 0.0573
Val Loss:   0.0463
Val AUC:    0.9982
Val F1:     0.9880
Val Recall: 0.9943
Val Prec.:  0.9819


                                                                                      


Epoch 4/10
Train Loss: 0.0474
Val Loss:   0.0597
Val AUC:    0.9972
Val F1:     0.9873
Val Recall: 0.9805
Val Prec.:  0.9942


                                                                                      


Epoch 5/10
Train Loss: 0.0417
Val Loss:   0.0588
Val AUC:    0.9965
Val F1:     0.9868
Val Recall: 0.9851
Val Prec.:  0.9885


                                                                                      


Epoch 6/10
Train Loss: 0.0264
Val Loss:   0.0443
Val AUC:    0.9987
Val F1:     0.9879
Val Recall: 0.9817
Val Prec.:  0.9942
→ Novo melhor modelo salvo.


                                                                                      


Epoch 7/10
Train Loss: 0.0348
Val Loss:   0.0554
Val AUC:    0.9967
Val F1:     0.9902
Val Recall: 0.9874
Val Prec.:  0.9931


                                                                                      


Epoch 8/10
Train Loss: 0.0289
Val Loss:   0.0451
Val AUC:    0.9980
Val F1:     0.9880
Val Recall: 0.9885
Val Prec.:  0.9874


                                                                                      


Epoch 9/10
Train Loss: 0.0207
Val Loss:   0.0548
Val AUC:    0.9978
Val F1:     0.9879
Val Recall: 0.9839
Val Prec.:  0.9919


                                                                                       


Epoch 10/10
Train Loss: 0.0177
Val Loss:   0.0564
Val AUC:    0.9989
Val F1:     0.9873
Val Recall: 0.9782
Val Prec.:  0.9965
→ Novo melhor modelo salvo.

Melhor AUC obtida: 0.9989391128062399


## Salvamento das Métricas

As métricas serão comparadas com o baseline
no notebook final de análise.


In [22]:
metrics_dict = {
    "model_name": model_name,
    "augmentation": augmentation,
    "class_weight": use_class_weight,
    "epochs": epochs,
    "history": history,
    "best_auc": best_auc
}

save_metrics(metrics_dict, metrics_save_path)

print("Modelo salvo em:", model_save_path)
print("Métricas salvas em:", metrics_save_path)
print("Melhor AUC:", best_auc)

Modelo salvo em: c:\projects\xray-project\models\densenet121_light_noCW.pt
Métricas salvas em: c:\projects\xray-project\outputs\metrics\densenet121_light_noCW.pkl
Melhor AUC: 0.9989391128062399
