# 🧠 Convolutional Neural Networks (CNNs)

As **Redes Neurais Convolucionais (CNNs)** são uma arquitetura de rede neural projetada para processar dados com uma estrutura de grade, como imagens. Elas são amplamente utilizadas em **visão computacional**, **processamento de vídeo**, **reconhecimento de padrões** e até mesmo em **processamento de linguagem natural**.

---

## 📷 O que é uma CNN?

Uma **CNN** é composta por camadas especializadas que podem extrair **características espaciais** e **hierárquicas** dos dados de entrada. Ao contrário das redes totalmente conectadas (Fully Connected), elas utilizam operações matemáticas chamadas **convoluções** para capturar relações locais.

---

## 🛠 Estrutura de uma CNN

Uma CNN é composta principalmente por 3 tipos de camadas:

### 1️⃣ **Camada Convolucional**
- Aplica **filtros (kernels)** sobre a entrada para extrair **features** como bordas, texturas e padrões.
- Fórmula da operação de convolução:
  \[
  (I * K)(x, y) = \sum_{m}\sum_{n} I(m, n) \cdot K(x-m, y-n)
  \]
  Onde:
  - \(I\): imagem de entrada
  - \(K\): kernel/filtro
  - \(*\): operação de convolução

---

### 2️⃣ **Camada de Pooling**
- Reduz a **dimensionalidade** das features, mantendo as informações mais relevantes.
- Tipos comuns:
  - **Max Pooling**: seleciona o valor máximo em cada região.
  - **Average Pooling**: calcula a média dos valores em cada região.

---

### 3️⃣ **Camadas Completamente Conectadas (Fully Connected)**
- Conectam todos os neurônios para realizar a **classificação final**.

---

## 🎨 Fluxo de uma CNN

1. **Entrada**: imagem ou dado com estrutura de grade.
2. **Convoluções**: aplicação de filtros para extrair features.
3. **Pooling**: redução da dimensionalidade.
4. **Flattening**: transformação das features em vetor.
5. **Camadas Densas**: processam o vetor para gerar a saída.

---

## 📈 Aplicações de CNNs

✅ **Classificação de Imagens** (ex.: gatos vs. cachorros)  
✅ **Detecção de Objetos** (ex.: YOLO, SSD)  
✅ **Segmentação de Imagens** (ex.: U-Net)  
✅ **Reconhecimento Facial**  
✅ **Análise de Vídeo**  

---

## 🚀 Vantagens das CNNs

✔ Reduzem o número de parâmetros com compartilhamento de pesos.  
✔ Capturam **relações espaciais** entre pixels.  
✔ Escalam bem para dados de alta dimensão.  

---

## 📚 Exemplos Populares de Arquiteturas CNN

- **LeNet-5**: pioneira para reconhecimento de dígitos escritos à mão.  
- **AlexNet**: revolucionou o ImageNet em 2012.  
- **VGGNet**: usa filtros 3x3 para profundidade.  
- **ResNet**: introduziu conexões residuais (skip connections).

---

## 🔥 Fórmula da Convolução Visualizada


📥 **Imagem (Entrada)**  
➡ Aplicação de **filtros (kernels)**  
➡ 📤 **Mapa de características (Feature Map)**

---

> 📝 **Resumo**: CNNs são uma ferramenta poderosa para tarefas que exigem entender dados espaciais e visuais. Elas são a espinha dorsal de muitas aplicações modernas de inteligência artificial.



In [None]:
import tensorflow as tf
from keras.preprocessing.image import ImageDataGenerator

In [None]:
tf.__version__

In [None]:
train_datagen = ImageDataGenerator(rescale = 1./255,
                                   shear_range = 0.2,
                                   zoom_range = 0.2,
                                   horizontal_flip = True)
training_set = train_datagen.flow_from_directory('dataset/training_set',
                                                 target_size = (64, 64),
                                                 batch_size = 32,
                                                 class_mode = 'binary')

In [None]:
test_datagen = ImageDataGenerator(rescale = 1./255)
test_set = test_datagen.flow_from_directory('dataset/test_set',
                                            target_size = (64, 64),
                                            batch_size = 32,
                                            class_mode = 'binary')

In [None]:
cnn = tf.keras.models.Sequential()

In [None]:
cnn.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu', input_shape=[64, 64, 3]))

In [None]:
cnn.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2))

In [None]:
cnn.add(tf.keras.layers.Conv2D(filters=32, kernel_size=3, activation='relu'))
cnn.add(tf.keras.layers.MaxPool2D(pool_size=2, strides=2))

In [None]:
cnn.add(tf.keras.layers.Flatten())

In [None]:
cnn.add(tf.keras.layers.Dense(units=128, activation='relu'))

In [None]:
cnn.add(tf.keras.layers.Dense(units=1, activation='sigmoid'))

In [None]:
cnn.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

In [None]:
cnn.fit(x = training_set, validation_data = test_set, epochs = 25)

In [None]:
import numpy as np
from keras.preprocessing import image
test_image = image.load_img('dataset/single_prediction/cat_or_dog_1.jpg', target_size = (64, 64))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis = 0)
result = cnn.predict(test_image)
training_set.class_indices
if result[0][0] == 1:
  prediction = 'dog'
else:
  prediction = 'cat'

In [None]:
print(prediction)