# üß† MedPrintAI ‚Äî Treinamento nnU-Net

**Pr√©-requisitos:**
1. Runtime ‚Üí Alterar tipo de runtime ‚Üí **T4 GPU**
2. Ter o dataset convertido (`Dataset001_BoneLesions/`) no Google Drive

**Estrutura esperada no Drive:**
```
MedPrintAI/
‚îî‚îÄ‚îÄ Dataset001_BoneLesions/
    ‚îú‚îÄ‚îÄ dataset.json
    ‚îú‚îÄ‚îÄ imagesTr/
    ‚îú‚îÄ‚îÄ labelsTr/
    ‚îî‚îÄ‚îÄ imagesTs/
```

## 1. Verificar GPU

In [None]:
import torch
print(f'GPU dispon√≠vel: {torch.cuda.is_available()}')
if torch.cuda.is_available():
    print(f'GPU: {torch.cuda.get_device_name(0)}')
else:
    print('‚ö†Ô∏è  Sem GPU! V√° em Runtime ‚Üí Alterar tipo de runtime ‚Üí T4 GPU')

## 2. Instalar nnU-Net

In [None]:
%%capture
!pip install nnunetv2

## 3. Montar Google Drive

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# Ajuste este caminho se necess√°rio
DRIVE_DATASET = '/content/drive/MyDrive/MedPrintAI/Dataset001_BoneLesions'

import os
assert os.path.exists(DRIVE_DATASET), f'Dataset n√£o encontrado em {DRIVE_DATASET}'
print(f'‚úÖ Dataset encontrado: {DRIVE_DATASET}')

## 4. Configurar vari√°veis de ambiente do nnU-Net

In [None]:
import os

# Pasta raiz onde ficam os datasets raw (deve conter Dataset001_BoneLesions/)
NNUNET_RAW          = '/content/nnunet_raw'
NNUNET_PREPROCESSED = '/content/nnunet_preprocessed'
NNUNET_RESULTS      = '/content/nnunet_results'

os.makedirs(NNUNET_RAW, exist_ok=True)
os.makedirs(NNUNET_PREPROCESSED, exist_ok=True)
os.makedirs(NNUNET_RESULTS, exist_ok=True)

# Cria symlink do Drive ‚Üí pasta local
dst = os.path.join(NNUNET_RAW, 'Dataset001_BoneLesions')
if not os.path.exists(dst):
    os.symlink(DRIVE_DATASET, dst)

os.environ['nnUNet_raw']          = NNUNET_RAW
os.environ['nnUNet_preprocessed'] = NNUNET_PREPROCESSED
os.environ['nnUNet_results']      = NNUNET_RESULTS

print('‚úÖ Vari√°veis de ambiente configuradas')
print(f'  nnUNet_raw          = {NNUNET_RAW}')
print(f'  nnUNet_preprocessed = {NNUNET_PREPROCESSED}')
print(f'  nnUNet_results      = {NNUNET_RESULTS}')

## 5. Validar e pr√©-processar o dataset

Este passo analisa o dataset e configura automaticamente a arquitetura da rede (resolu√ß√£o, tamanho de batch, etc.).

In [None]:
!nnUNetv2_plan_and_preprocess -d 001 --verify_dataset_integrity -np 2

## 6. Treinar (5-fold cross-validation)

Cada fold leva ~30-60 minutos com T4. Para ter o modelo completo voc√™ precisa rodar os 5 folds.  
Se tiver pressa, rode s√≥ o fold 0 ‚Äî j√° d√° um modelo funcional.

In [None]:
# Treina fold 0 (rode mais vezes mudando o √∫ltimo argumento: 1, 2, 3, 4)
!nnUNetv2_train 001 3d_fullres 0 --npz

In [None]:
# Opcional: treinar todos os folds de uma vez (mais longo)
# for fold in range(5):
#     !nnUNetv2_train 001 3d_fullres {fold} --npz

## 7. Avalia√ß√£o (m√©tricas)

Ap√≥s treinar todos os folds, calcula o Dice Score m√©dio.

In [None]:
!nnUNetv2_find_best_configuration 001 -c 3d_fullres

## 8. Infer√™ncia de teste (opcional)

Roda o modelo nos CTs em `imagesTs/` (sem ground truth).

In [None]:
PRED_DIR = '/content/predicoes_teste'
os.makedirs(PRED_DIR, exist_ok=True)

!nnUNetv2_predict \
  -i {NNUNET_RAW}/Dataset001_BoneLesions/imagesTs \
  -o {PRED_DIR} \
  -d 001 \
  -c 3d_fullres \
  -f 0

## 9. Salvar modelo no Google Drive

Copia os resultados para o Drive para n√£o perder quando a sess√£o encerrar.

In [None]:
import shutil

DRIVE_RESULTADOS = '/content/drive/MyDrive/MedPrintAI/modelo_treinado'
os.makedirs(DRIVE_RESULTADOS, exist_ok=True)

shutil.copytree(NNUNET_RESULTS, DRIVE_RESULTADOS, dirs_exist_ok=True)
print(f'‚úÖ Modelo salvo em: {DRIVE_RESULTADOS}')
print()
print('Para usar localmente:')
print('  1. Baixe a pasta modelo_treinado/ do Drive')
print('  2. Coloque em: modelo_ia/modelo_treinado/')
print('  3. Rode: python treinamento/inferencia.py --input seu_ct.nii.gz')