## 📅 Dia 5 – Convolutional Neural Networks (CNN)

### 🎯 Objetivo:
Entender e aplicar redes neurais convolucionais para imagens.

### 📚 Teoria:
- O que são convoluções?
- Filtros, stride, pooling
- Arquitetura básica de uma CNN

### 🛠 Prática:
- Dataset: CIFAR-10 ou MNIST
- Criar rede com:
    - ``Conv2D, MaxPooling2D, Flatten, Dense``
- Comparar com modelo anterior (fully connected)
- Ajustar hiperparâmetros e usar EarlyStopping



--- 



# **O que são Convoluções**
Multiplicações entre matrizes (Valores da imagem x Filtro ou kernel), feitas localmente em "blocos" ou "janelas" da imagem, seguidas de uma soma dos resultados.

**Exemplo:**

Imagem: 5x5

| 1 | 2 | 0 | 1 | 3 |
|---|---|---|---|---|
| 4 | 1 | 0 | 2 | 1 |
| 3 | 0 | 2 | 4 | 0 |
| 1 | 1 | 3 | 1 | 2 |
| 2 | 0 | 1 | 3 | 1 |

Filtro: 3x3 Sobel horizontal

|  1 |  0 | -1 |
|----|----|----|
|  1 |  0 | -1 |
|  1 |  0 | -1 |

Resultado da Convolução: 3x3

|  6 |  -4 |  -2 |
|----|----|-----|
|  3 |  -5 | 2 |
|  0 |  -7 | 3 |

### **Processo:**
Imagem:

| 1 | 2 | 0 | 1 | 3 |
|---|---|---|---|---|
| 4 | 1 | 0 | 2 | 1 |
| 3 | 0 | 2 | 4 | 0 |
| 1 | 1 | 3 | 1 | 2 |
| 2 | 0 | 1 | 3 | 1 |

Dividir em Blocos de 3x3 e multiplicar cada elementro do bloco da imagem pelo elemento na mesma posição no filtro e somar os resultados

- Bloco 1:

    ![image.png](attachment:image.png) x ![image-2.png](attachment:image-2.png)

    Primeiro bloco da imagem x filtro Sobel horizontal

    (1×1) + (2×0) + (0×-1) +
    (4×1) + (1×0) + (0×-1) +
    (3×1) + (0×0) + (2×-1) = 6

    Logo o primeiro resultado da matriz de resultado é 6

    ![image-12.png](attachment:image-12.png)

- Bloco 2

    ![image-4.png](attachment:image-4.png) x ![image-2.png](attachment:image-2.png)

    Segundo bloco da imagem x filtro Sobel horizontal

    (2×1) + (0×0) + (1×-1) +
    (1×1) + (0×0) + (2×-1) +
    (0×1) + (2×0) + (4×-1) = -4

- Bloco 3

    ![image-5.png](attachment:image-5.png) x ![image-2.png](attachment:image-2.png)

    Terceiro bloco da imagem x filtro Sobel horizontal
    
    (0×1) + (1×0) + (3×-1) +
    (0×1) + (2×0) + (1×-1) +
    (2×1) + (4×0) + (0×-1) = -2

- Bloco 4

    ![image-6.png](attachment:image-6.png) x ![image-2.png](attachment:image-2.png)

    Quarto bloco da imagem x filtro Sobel horizontal
    
    (4×1) + (1×0) + (0×-1) +
    (3×1) + (0×0) + (2×-1) +
    (1×1) + (1×0) + (3×-1) = 3

- Bloco 5

    ![image-7.png](attachment:image-7.png) x ![image-2.png](attachment:image-2.png)

    Quinto bloco da imagem x filtro Sobel horizontal
    
    (1×1) + (0×0) + (2×-1) +
    (0×1) + (2×0) + (4×-1) +
    (1×1) + (3×0) + (1×-1) = -5

- Bloco 6

    ![image-8.png](attachment:image-8.png) x ![image-2.png](attachment:image-2.png)

    Sexto bloco da imagem x filtro Sobel horizontal
    
    (0×1) + (2×0) + (1×-1) +
    (2×1) + (4×0) + (0×-1) +
    (3×1) + (1×0) + (2×-1) = 2

- Bloco 7

    ![image-9.png](attachment:image-9.png) x ![image-2.png](attachment:image-2.png)

    Sétimo bloco da imagem x filtro Sobel horizontal
    
    (3×1) + (0×0) + (2×-1) +
    (1×1) + (1×0) + (3×-1) +
    (2×1) + (0×0) + (1×-1) = 0

- Bloco 8

    ![image-10.png](attachment:image-10.png) x ![image-2.png](attachment:image-2.png)

    Oitavo bloco da imagem x filtro Sobel horizontal
    
    (0×1) + (2×0) + (4×-1) +
    (1×1) + (3×0) + (1×-1) +
    (0×1) + (1×0) + (3×-1) = -7

- Bloco 9

    ![image-11.png](attachment:image-11.png) x ![image-2.png](attachment:image-2.png)

    Nono bloco da imagem x filtro Sobel horizontal
    
    (2×1) + (4×0) + (0×-1) +
    (3×1) + (1×0) + (2×-1) +
    (1×1) + (3×0) + (1×-1) = 3

**Referência**
- https://medium.com/data-hackers/como-funcionam-as-redes-neurais-convolucionais-cnns-71978185c1
- https://www.youtube.com/watch?v=fYSUT009eyg&t=1s 

# Pooling
Usada após a convolução, ajudando a reduzir (deixando as característica mais importante) a entrada na rede, para torná-la mais eficiente além de ajudar a evitar overfitting. 

Tipos de Pooling
- Max Polling: pega o maior valor do bloco
- Average Pooling: calcula a média aritimética do bloco
- 

# Arquitetura CNN

Entrada (28x28x1)

Conv2D (filtros 32, kernel 3x3) + ReLU

MaxPooling2D (2x2)

Conv2D (filtros 64, kernel 3x3) + ReLU

MaxPooling2D (2x2)

Flatten

Dense (128) + ReLU

Dense (10) + Softmax (saída: 10 classes)