In [None]:
#%kaggle datasets download -d warcoder/gkn-blade-surface-defect-dataset

In [None]:
#import zipfile

# Substitua o nome do arquivo pelo nome correto
#with zipfile.ZipFile("gkn-blade-surface-defect-dataset.zip", 'r') as zip_ref:
#    zip_ref.extractall("dados_extraidos")  # Pasta onde os dados ser√£o extra√≠dos


# Classifica√ß√£o de imagens

In [None]:
#%ls

In [None]:
import torch
from torchvision import datasets, transforms
from torch.utils.data import DataLoader,random_split

# Transforma√ß√µes para pr√©-processamento

# Dividir em treino e teste

# Calcular m√©dia e desvio padr√£o apenas no treino

# Aplicar transforma√ß√µes finais com normaliza√ß√£o calculada


# Criar DataLoaders

# Criando um modelo do zero

Como voc√™ estamos aplicando `transforms.Resize((224, 224))`, √© necess√°rio verificar se o tamanho da entrada da camada totalmente conectada (`fc1`) est√° correto. Vamos calcular isso.

---

### üìå **Passo 1: Como as Camadas Convolucionais e Pooling Afetam o Tamanho?**
Cada convolu√ß√£o (`Conv2d`) com `padding=1` e `kernel_size=3` mant√©m as dimens√µes, enquanto cada camada de `MaxPool2d(2,2)` reduz pela metade.

#### **Transforma√ß√£o passo a passo para uma entrada de (224, 224):**
1. **Entrada inicial**:  $ 224 \times 224  $
2. **Ap√≥s `conv1` (Conv2d(3, 32, 3, padding=1))** ‚Üí Dimens√£o **continua** $$  224 \times 224  $$
3. **Ap√≥s `pool` (MaxPool2d(2,2))** ‚Üí $  224 / 2 = 112 \times 112  $ 
4. **Ap√≥s `conv2` (Conv2d(32, 64, 3, padding=1))** ‚Üí $  112 \times 112  $ *(n√£o muda devido ao padding)*
5. **Ap√≥s `pool` (MaxPool2d(2,2))** ‚Üí $  112 / 2 = 56 \times 56  $
6. **Ap√≥s `conv3` (Conv2d(64, 128, 3, padding=1))** ‚Üí $ 56 \times 56  $*(n√£o muda devido ao padding)*
7. **Ap√≥s `pool` (MaxPool2d(2,2))** ‚Üí $  56 / 2 = 28 \times 28  $

---

### üìå **Passo 2: Ajustando o `fc1`**
O n√∫mero de neur√¥nios que entram na camada `fc1` √©:


$ 128 \times 28 \times 28 $


Logo, **a linha correta do `fc1` deve ser**:
```python
self.fc1 = nn.Linear(128 * 28 * 28, 512)
```



# Criar o modelo

# Definir a Fun√ß√£o de Perda e o Otimizador

# Treinar o modelo

# Avaliar no conjunto de teste

# Outro caminho - Transfer√™ncia de aprendizagem

https://pytorch.org/vision/main/models.html

Esse c√≥digo est√° usando **Transfer Learning** com o modelo **ResNet-18** pr√©-treinado no ImageNet. Vamos entender linha por linha:

---

### üîπ **Linha 1: Defini√ß√£o do N√∫mero de Classes**
```python
num_classes = 3
```
Aqui, definimos que o dataset possui **3 classes** (exemplo: `['Good', 'Nick', 'Scratch']`). O modelo precisa ajustar a sa√≠da para esse n√∫mero.

---

### üîπ **Linha 2: Carregamento da ResNet-18 Pr√©-Treinada**
```python
model = models.resnet18(pretrained=True)
```
- Baixa a **ResNet-18** pr√©-treinada no **ImageNet** (que tem 1.000 classes).
- O modelo j√° aprendeu a detectar padr√µes b√°sicos como bordas, texturas e formas, o que pode ser reutilizado para novas tarefas.

---

### üîπ **Linha 3: Obtendo o N√∫mero de Entradas da √öltima Camada**
```python
num_ftrs = model.fc.in_features
```
- O modelo ResNet-18 tem uma **camada totalmente conectada (fc)** na sa√≠da.
- Essa camada original tem **1.000 neur√¥nios** (porque o ImageNet tem 1.000 classes).
- `model.fc.in_features` retorna **o n√∫mero de entradas dessa camada** (ou seja, quantos neur√¥nios da pen√∫ltima camada conectam na sa√≠da).
- Na ResNet-18, esse valor geralmente √© **512**.

---

### üîπ **Linha 4: Substituindo a √öltima Camada**
```python
model.fc = nn.Linear(num_ftrs, num_classes)
```
- Como nosso dataset tem apenas **3 classes**, trocamos a √∫ltima camada.
- A nova `fc` agora recebe **512 entradas** (da pen√∫ltima camada da ResNet) e **3 sa√≠das** (uma para cada classe).

---

### üîπ **Resumo**
1. **Baixamos a ResNet-18 pr√©-treinada** para reutilizar suas camadas convolucionais.
2. **Descobrimos quantas features s√£o passadas para a √∫ltima camada (`fc`)**.
3. **Trocamos a √∫ltima camada** para que a rede aprenda a classificar apenas 3 classes, ao inv√©s das 1.000 do ImageNet.

---

### üîπ **Fluxo do Modelo Antes e Depois**
**Antes (original da ResNet-18 no ImageNet):**
```
Camadas convolucionais ‚Üí Global Avg Pooling ‚Üí nn.Linear(512, 1000)
```
**Depois (ajustado para nosso problema):**
```
Camadas convolucionais ‚Üí Global Avg Pooling ‚Üí nn.Linear(512, 3)
```
Ou seja, **mantemos todo o aprendizado da ResNet-18**, mas adaptamos a sa√≠da para nosso pr√≥prio problema! üöÄüî•

# Treinar o modelo

# Avaliar no Conjunto de teste

# Salvar e carregar o modelo

# Fazer previs√µes em novas imagens