In [1]:
!kaggle datasets download -d warcoder/gkn-blade-surface-defect-dataset

Dataset URL: https://www.kaggle.com/datasets/warcoder/gkn-blade-surface-defect-dataset
License(s): Attribution 4.0 International (CC BY 4.0)
Downloading gkn-blade-surface-defect-dataset.zip to /content
100% 47.0M/47.0M [00:00<00:00, 83.2MB/s]
100% 47.0M/47.0M [00:00<00:00, 71.5MB/s]


In [2]:
import zipfile

# Substitua o nome do arquivo pelo nome correto
with zipfile.ZipFile("gkn-blade-surface-defect-dataset.zip", 'r') as zip_ref:
    zip_ref.extractall("dados_extraidos")  # Pasta onde os dados serÃ£o extraÃ­dos


# ClassificaÃ§Ã£o de imagens

In [3]:
!ls

dados_extraidos  gkn-blade-surface-defect-dataset.zip  sample_data


In [4]:
import torch
from torchvision import datasets, transforms
from torch.utils.data import DataLoader,random_split

# TransformaÃ§Ãµes para prÃ©-processamento

In [5]:
# TransformaÃ§Ã£o inicial sem normalizaÃ§Ã£o
base_transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor()
])

In [6]:
data_dir = '/content/dados_extraidos/GKN Blade Surface Defect Dataset/Data_GKN'

In [7]:
dataset = datasets.ImageFolder(root=data_dir, transform=base_transform)

# Dividir em treino e teste

In [8]:
# Dividir os dados em treino e teste antes de normalizar
train_size = int(0.8 * len(dataset))
test_size = len(dataset) - train_size
train_dataset, test_dataset = random_split(dataset, [train_size, test_size])

# Calcular mÃ©dia e desvio padrÃ£o apenas no treino

In [9]:
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
mean = torch.zeros(3)
std = torch.zeros(3)
for images, _ in train_loader:
    mean += images.mean(dim=[0, 2, 3])
    std += images.std(dim=[0, 2, 3])
mean /= len(train_loader)
std /= len(train_loader)

# Aplicar transformaÃ§Ãµes finais com normalizaÃ§Ã£o calculada


In [10]:
train_transforms = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.RandomHorizontalFlip(),
    transforms.ToTensor(),
    transforms.Normalize(mean.tolist(), std.tolist())
])

In [12]:
test_transforms = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize(mean.tolist(), std.tolist())
])

In [13]:
# Aplicar as transformaÃ§Ãµes finais
train_dataset.dataset.transform = train_transforms
test_dataset.dataset.transform = test_transforms

# Criar DataLoaders

In [14]:
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

# Criando um modelo do zero

In [15]:
import torch.nn as nn
import torch.nn.functional as F

In [None]:
class SimpleCNN(nn.Module):
    def __init__(self, num_classes):
        super(SimpleCNN, self).__init__()


    def forward(self, x):
        x = x.view(x.size(0), -1)  # Flatten

Como vocÃª estamos aplicando `transforms.Resize((224, 224))`, Ã© necessÃ¡rio verificar se o tamanho da entrada da camada totalmente conectada (`fc1`) estÃ¡ correto. Vamos calcular isso.

---

### ðŸ“Œ **Passo 1: Como as Camadas Convolucionais e Pooling Afetam o Tamanho?**
Cada convoluÃ§Ã£o (`Conv2d`) com `padding=1` e `kernel_size=3` mantÃ©m as dimensÃµes, enquanto cada camada de `MaxPool2d(2,2)` reduz pela metade.

#### **TransformaÃ§Ã£o passo a passo para uma entrada de (224, 224):**
1. **Entrada inicial**:  $ 224 \times 224  $
2. **ApÃ³s `conv1` (Conv2d(3, 32, 3, padding=1))** â†’ DimensÃ£o **continua** $$  224 \times 224  $$
3. **ApÃ³s `pool` (MaxPool2d(2,2))** â†’ $  224 / 2 = 112 \times 112  $
4. **ApÃ³s `conv2` (Conv2d(32, 64, 3, padding=1))** â†’ $  112 \times 112  $ *(nÃ£o muda devido ao padding)*
5. **ApÃ³s `pool` (MaxPool2d(2,2))** â†’ $  112 / 2 = 56 \times 56  $
6. **ApÃ³s `conv3` (Conv2d(64, 128, 3, padding=1))** â†’ $ 56 \times 56  $*(nÃ£o muda devido ao padding)*
7. **ApÃ³s `pool` (MaxPool2d(2,2))** â†’ $  56 / 2 = 28 \times 28  $

---

### ðŸ“Œ **Passo 2: Ajustando o `fc1`**
O nÃºmero de neurÃ´nios que entram na camada `fc1` Ã©:


$ 128 \times 28 \times 28 $


Logo, **a linha correta do `fc1` deve ser**:
```python
self.fc1 = nn.Linear(128 * 28 * 28, 512)
```



# Criar o modelo

# Definir a FunÃ§Ã£o de Perda e o Otimizador

# Treinar o modelo

# Avaliar no conjunto de teste

# Outro caminho - TransferÃªncia de aprendizagem

https://pytorch.org/vision/main/models.html

Esse cÃ³digo estÃ¡ usando **Transfer Learning** com o modelo **ResNet-18** prÃ©-treinado no ImageNet. Vamos entender linha por linha:

---

### ðŸ”¹ **Linha 1: DefiniÃ§Ã£o do NÃºmero de Classes**
```python
num_classes = 3
```
Aqui, definimos que o dataset possui **3 classes** (exemplo: `['Good', 'Nick', 'Scratch']`). O modelo precisa ajustar a saÃ­da para esse nÃºmero.

---

### ðŸ”¹ **Linha 2: Carregamento da ResNet-18 PrÃ©-Treinada**
```python
model = models.resnet18(pretrained=True)
```
- Baixa a **ResNet-18** prÃ©-treinada no **ImageNet** (que tem 1.000 classes).
- O modelo jÃ¡ aprendeu a detectar padrÃµes bÃ¡sicos como bordas, texturas e formas, o que pode ser reutilizado para novas tarefas.

---

### ðŸ”¹ **Linha 3: Obtendo o NÃºmero de Entradas da Ãšltima Camada**
```python
num_ftrs = model.fc.in_features
```
- O modelo ResNet-18 tem uma **camada totalmente conectada (fc)** na saÃ­da.
- Essa camada original tem **1.000 neurÃ´nios** (porque o ImageNet tem 1.000 classes).
- `model.fc.in_features` retorna **o nÃºmero de entradas dessa camada** (ou seja, quantos neurÃ´nios da penÃºltima camada conectam na saÃ­da).
- Na ResNet-18, esse valor geralmente Ã© **512**.

---

### ðŸ”¹ **Linha 4: Substituindo a Ãšltima Camada**
```python
model.fc = nn.Linear(num_ftrs, num_classes)
```
- Como nosso dataset tem apenas **3 classes**, trocamos a Ãºltima camada.
- A nova `fc` agora recebe **512 entradas** (da penÃºltima camada da ResNet) e **3 saÃ­das** (uma para cada classe).

---

### ðŸ”¹ **Resumo**
1. **Baixamos a ResNet-18 prÃ©-treinada** para reutilizar suas camadas convolucionais.
2. **Descobrimos quantas features sÃ£o passadas para a Ãºltima camada (`fc`)**.
3. **Trocamos a Ãºltima camada** para que a rede aprenda a classificar apenas 3 classes, ao invÃ©s das 1.000 do ImageNet.

---

### ðŸ”¹ **Fluxo do Modelo Antes e Depois**
**Antes (original da ResNet-18 no ImageNet):**
```
Camadas convolucionais â†’ Global Avg Pooling â†’ nn.Linear(512, 1000)
```
**Depois (ajustado para nosso problema):**
```
Camadas convolucionais â†’ Global Avg Pooling â†’ nn.Linear(512, 3)
```
Ou seja, **mantemos todo o aprendizado da ResNet-18**, mas adaptamos a saÃ­da para nosso prÃ³prio problema! ðŸš€ðŸ”¥

# Treinar o modelo

# Avaliar no Conjunto de teste

# Salvar e carregar o modelo

# Fazer previsÃµes em novas imagens