# üß†ü§ñ Treinamento de Redes Convolucionais

- **Deadline**: 27/07/2025
- **Entrega**: O trabalho deve ser entregue via sistema Testr.
- **Pontua√ß√£o**: 5 pontos (+1 ponto extra).
- O trabalho deve ser realizado individualmente.



## Especifica√ß√£o


### Contexto

O trabalho consiste em realizar o treinamento de redes neurais convolucionais na base de dados [Chest X-ray Image (COVID19, PNEUMONIA, and NORMAL) dispon√≠vel no kaggle](https://www.kaggle.com/datasets/alsaniipe/chest-x-ray-image). Esta base de dados cont√©m exames de raio-x de pacientes saud√°veis, com pneumonia e com covid19. O objetivo do trabalho √© treinar uma rede neural capaz de identificar se o raio-x pertence a uma pessoa saud√°vel ou com uma das duas doen√ßas.




### Regras

- Devem ser treinadas 3 redes neurais, uma customizada (desenvolvida pelo aluno), uma pr√©-treinada com parte convolucional congelada e uma pr√©-treinada  treinada totalmente (*fine-tuning*).
- O dataset prov√™ conjuntos de treino e teste. O conjunto de treino deve ser dividido em
- O c√≥digo deve ser preparado para utilizar GPUs (no colab ou localmente).
- N√£o devem ser utilizados frameworks de alto n√≠vel como keras ou lightning. O c√≥digo deve utilizar apenas pytorch.
- Deve ser utilizado data augmentation (o aluno tem liberdade para escolher os m√©todos que fizerem sentido para a tarefa).
- Ao final, deve ser apresentados gr√°ficos comparando as acur√°cias de treino e valida√ß√£o ao longo das √©pocas e uma tabela apresentando as m√©tricas de performance revoca√ß√£o, f1-score e acur√°cia para o conjunto de teste em cada configura√ß√£o de rede neural. Al√©m disso, deve ser uma an√°lise qualitativa dos casos de falha.
- Por fim, deve ser escrito um texto curto descrevendo e discutindo os resultados. Deve ser explicado com as suas palavras o que as m√©tricas indicam (e.g., o que quer dizer um recall alto para pneumonia, se isto acontecer), se aconteceu overfitting ou se o modelo alcan√ßou uma boa generaliza√ß√£o, se os valores das m√©tricas foram satisfat√≥rios, prov√°veis causas para as falhas e sugest√µes de como melhorar a performance.



### Pontos Extras

- Receber√° um ponto extra, o aluno que utilizar um m√©todo explainability (e.g., [gradcam++](https://github.com/jacobgil/pytorch-grad-cam)) para mostrar as regi√µes que mais influenciaram a decis√£o da rede neural.


### Dicas de Implementa√ß√£o

- **Download dos dados**: use a biblioteca `kagglehub` para fazer o download do dataset no colab.

- **Cria√ß√£o do dataset**: o pytorch possui a fun√ß√£o [ImageFolder](https://debuggercafe.com/pytorch-imagefolder-for-training-cnn-models/) que torna mais simples a cria√ß√£o de datasets organizados no formato do dataset utilizado no trabalho.

- **Leitura e preprocessamento das Imagens**: As imagens do dataset possuem caracter√≠sticas bastante diversas, com algumas delas sendo armazenadas em tons de cinza e outras em RGB, algumas s√£o arquivos BITMAP armazenados em formato jpg, algumas usam 8 bits e outras 16 bits para representar pixels e as resolu√ß√µes das imagens s√£o altamente diferentes. Use a fun√ß√£o abaixo para ler as imagens e lembre-se de realizar *resize* para o tamanho esperado pela rede neural.

```python
from PIL import Image

def load_img(path):
  # Le a imagem em diversos formatos e garante que a imagem tenha 3 canais
  img = Image.open(path).convert('RGB')
  # converte para um tensor do pytorch
  img = v2.functional.to_image(img)
  # garante que seja uma imagem de 8 bits reescalando os valores adequadamente
  img = v2.functional.to_dtype(img, dtype=torch.uint8, scale=True)
  return img
```

- **Aumento de Dados**: Para visualizar a maioria das transforma√ß√µes dispon√≠veis, veja [este site](https://docs.pytorch.org/vision/main/auto_examples/transforms/plot_transforms_illustrations.html). Use a vers√£o `v2` do pacote `pytorch.transforms`. Veja [este link](https://docs.pytorch.org/vision/main/transforms.html#v2-api-reference-recommended) para uma explica√ß√£o do porqu√™ e instru√ß√µes de uso.
  - ‚ö†Ô∏è**IMPORTANTE**‚ö†Ô∏è: o aumento de dados deve ser aplicado apenas no conjunto de treinamento para aumentar a diversidade dos dados. Os dados de valida√ß√£o e teste devem ser **puros e n√£o modificados**, exceto por opera√ß√µes como resize ou normaliza√ß√£o.


- **Sele√ß√£o de um modelo pr√©-treinado**: √â uma boa id√©ia experimentar com diferentes modelos pr√©-treinados para avaliar qual vai levar a predi√ß√µes mais corretas e avaliar outros crit√©rios, por exemplo, tempo de forward por imagem. Uma heur√≠stica para escolher modelos √© buscar aqueles que possuem [melhor performance na base de dados ImageNet](https://docs.pytorch.org/vision/0.21/models.html#table-of-all-available-classification-weights:~:text=Table%20of%20all%20available%20classification%20weights).
  - As redes mobilenet-v2 e -v3 s√£o desenhadas para serem r√°pidas e rodarem em dispositivos de baixo poder computacional.
  - A rede densenet em geral entrega boa performance.
  - As Efficientnet-b5+ n√£o rodam no colab (at√© a √∫ltima vez que testei) por falta de mem√≥ria.
  - As redes ViT usam a arquitetura transformers e n√£o s√£o convolucionais. **Elas podem ser utilizadas para compara√ß√£o, mas pelo menos uma outra rede neural totalmente convolucional deve ser utilizada**.

- **Visualize sempre que poss√≠vel**: N√£o deixe de visualizar pelo menos uma vez os batches que est√£o sendo usados para treinar a rede. Alguma opera√ß√£o pode estar transformando as imagens de forma que a impedir que a rede neural seja capaz de aprender os padr√µes que ela deveria aprender.

- **Brinque com Hiperpar√¢metros**: Ajuste os hiperpar√¢metros para tentar chegar em modelos com o m√°ximo de performance de valida√ß√£o. N√£o √© obrigat√≥rio, mas √© legal brincar tamb√©m com t√©cnicas de regulariza√ß√£o, caso a rede esteja sofrendo de overfitting.

- **Desbalanceamento do Dataset**: O dataset possui algum n√≠vel de desbalanceamento, com mais imagens normais do que com covid ou pneumonia. N√£o √© obrigat√≥rio, mas quem quiser pode realizar superamostragem dos dados com covid ou pneumonia para mitigar o desbalanceamento. As opera√ß√µes de data augmentation v√£o garantir que os dados tenham diversidade.


- **Escrita de tabelas**: Tabelas podem ser escritas em notebooks usando latex, como indicado abaixo.

```latex
\begin{array}{ccc}
\hline
modelo & m√©trica1 & m√©trica2 \\ \hline
custom & 0.85 & 0.83 \\ \hline
frozen-conv & 0.91 & 0.92 \\ \hline
fine-tuning & 0.93 & 0.90 \\ \hline
\end{array}
```

O resultado seria:

\begin{array}{ccc}
\hline
modelo & m√©trica1 & m√©trica2 \\ \hline
custom & 0.85 & 0.83 \\ \hline
frozen-conv & 0.91 & 0.92 \\ \hline
fine-tuning & 0.93 & 0.90 \\ \hline
\end{array}

Elas tamb√©m pode ser escritas em markdown como indicado abaixo:

```markdown
| modelo | m√©trica1 | m√©trica2 |
|---|---|---|
| custom | 0.85 | 0.83 |
| frozen-conv | 0.91 | 0.92 |
| fine-tuning | 0.93 | 0.90 |
```

O resultado seria:

| modelo | m√©trica1 | m√©trica2 |
|---|---|---|
| custom | 0.85 | 0.83 |
| frozen-conv | 0.91 | 0.92 |
| fine-tuning | 0.93 | 0.90 |


### Roteiro de Implementa√ß√£o

Para realizar o trabalho, siga os seguintes passos:

1. Fa√ßa o download autom√°tico do dataset.
1. Compreenda a organiza√ß√£o do dataset e visualize alguns dados.
1. Crie os dataset de treino, valida√ß√£o e teste do pytorch. Visualize se os dados continuam com a mesma cara.
1. Crie as transforma√ß√µes de data augmentation e adicione ao dataset de treino.
1. Crie transforma√ß√µes para os datasets de valida√ß√£o e teste que coloquem os dados no mesmo formato usado no treino, por exemplo, resize e normaliza√ß√£o. Lembre-se de **N√ÉO** aplicar data augmentation nos conjuntos de valida√ß√£o e teste!
1. Crie dataloaders.
1. Construa uma CNN.
1. Escreva fun√ß√µes para treinamento e avalia√ß√£o. Retorne o valor da acur√°cia para os conjuntos de treino e valida√ß√£o nas √©pocas de treinamento.
1. Crie uma loss function e um otimizador.
1. Execute o treinamento e verifique se a curva de treinamento est√° se comportando como esperado.
  - A acur√°cia de treinamento est√° aumentando? Se n√£o, verifique se o dataset est√° certo e aumente a capacidade da rede.
  - A acur√°cia de treinamento se aproximando de 100%? Se n√£o, aumente a capacidade da rede e tente ajustar a learning rate.
  - A acur√°cia de valida√ß√£o est√° aumentando no in√≠cio do treinamento? Se n√£o, verifique se os dados de valida√ß√£o est√£o no mesmo formato dos dados de treinamento.
  - A acur√°cia de valida√ß√£o est√° diminuindo depois de um n√∫mero de √©pocas? Parece que est√° acontecendo overfitting. Tente usar algum m√©todo de regulariza√ß√£o.  
1. Brinque com os hiperpar√¢metros para tentar fazer a rede aprender mais r√°pido e com maior performance de valida√ß√£o.
1. Crie uma fun√ß√£o para calcular m√©tricas de avalia√ß√£o e visualize as m√©tricas para os conjuntos de treinamento e teste. Compare os dois e veja se aconteceu overiffitting.

Repita o processo usando as redes pr√©-treinadas.

