# 🐱🐶 Classificação de Imagens: Cats vs Dogs (com TensorFlow Datasets)
Este notebook foi adaptado para rodar no **VS Code + Windows 11 + Python 3.13.17**.
Usaremos o **TensorFlow Datasets (TFDS)** para baixar automaticamente o dataset Cats vs Dogs.
Cada célula possui explicações didáticas em Markdown e comentários no código.

## 🔹 1. Preparação do Ambiente
Execute este comando no terminal Bash do VS Code para instalar as dependências:
```bash
pip install tensorflow tensorflow-datasets matplotlib numpy
```

## 🔹 2. Importação das Bibliotecas

In [3]:
import tensorflow as tf
import tensorflow_datasets as tfds
import matplotlib.pyplot as plt
import numpy as np

print("✅ Bibliotecas importadas com sucesso!")

✅ Bibliotecas importadas com sucesso!


## 🔹 3. Carregar Dataset (TFDS baixa automaticamente)
- O dataset Cats vs Dogs é baixado e armazenado localmente pelo TFDS.
- Usamos `as_supervised=True` para retornar tuplas (imagem, rótulo).

In [21]:
import os

data_dir = "data/raw"
os.makedirs(data_dir, exist_ok=True)

(ds_train, ds_test), ds_info = tfds.load(
    'cats_vs_dogs',
    split=['train[:80%]', 'train[80%:]'],
    as_supervised=True,
    with_info=True,
    try_gcs=True,
    data_dir=data_dir
)

print("✅ Dataset carregado com sucesso!")



[1mDownloading and preparing dataset Unknown size (download: Unknown size, generated: Unknown size, total: Unknown size) to data\raw\cats_vs_dogs\4.0.1...[0m


Dl Size...: 100%|██████████| 786/786 [00:41<00:00, 18.78 MiB/s]
Dl Completed...: 100%|██████████| 1/1 [00:41<00:00, 41.86s/ url]
                                                                

KeyError: "There is no item named 'PetImages\\\\Cat\\\\0.jpg' in the archive"

## 🔹 4. Pré-processamento das Imagens
- Redimensionar imagens para 128x128
- Normalizar pixels para valores entre 0 e 1
- Criar lotes (batchs) para treino

In [None]:
IMG_SIZE = (128, 128) # Redimensionamento das imagens
BATCH_SIZE = 32 # Tamanho do batch, ou seja, quantas imagens serão processadas juntas

def preprocess(image, label): # Função de pré-processamento
    image = tf.image.resize(image, IMG_SIZE)
    image = image / 255.0  # Normalização
    return image, label

ds_train = ds_train.map(preprocess).batch(BATCH_SIZE).shuffle(1000) # Embaralhando os dados de treino
ds_test = ds_test.map(preprocess).batch(BATCH_SIZE) # Dados de teste não precisam ser embaralhados

print("✅ Pré-processamento concluído!")

## 🔹 5. Visualizar Amostras do Dataset
Vamos exibir algumas imagens para verificar se o dataset foi carregado corretamente.

In [None]:
for images, labels in ds_train.take(1): # Pegando um batch de imagens
    plt.figure(figsize=(10,10))
    for i in range(9):
        plt.subplot(3,3,i+1)
        plt.imshow(images[i].numpy())
        plt.title("Cat" if labels[i].numpy()==0 else "Dog")
        plt.axis("off")
    plt.show()

## 🔹 6. Definição do Modelo CNN
A rede neural convolucional será composta por:
- Camadas Conv2D + MaxPooling para extrair características visuais
- Flatten para achatar a matriz em vetor
- Dense para classificação binária (gato ou cachorro)

In [None]:
model = tf.keras.Sequential([ 
    tf.keras.layers.Conv2D(32, (3,3), activation='relu', input_shape=(*IMG_SIZE, 3)),
    tf.keras.layers.MaxPooling2D(2,2),

    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),

    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(1, activation='sigmoid') # Binária: gato ou cachorro
])

model.summary()

## 🔹 7. Compilação e Treinamento do Modelo
- Otimizador: Adam (eficiente para CNNs)
- Função de perda: Binary Crossentropy (classificação binária)
- Métrica: Acurácia

In [None]:
model.compile( # Compilando o modelo
    optimizer='adam', # adam serve para otimização, ele ajuda a encontrar os melhores pesos para a rede, é um dos otimizadores mais usados.
    loss='binary_crossentropy', # binary_crossentropy é a função de perda usada para problemas de classificação binária.
    metrics=['accuracy'] # accuracy é a métrica que mede a proporção de previsões corretas (acertos) feitas pelo modelo.
)

history = model.fit( # Treinando o modelo
    ds_train,
    validation_data=ds_test,
    epochs=5
)

## 🔹 8. Avaliação do Modelo
Vamos analisar as curvas de acurácia e loss para entender o desempenho.

In [None]:
plt.figure(figsize=(12,5))

# Acurácia
plt.subplot(1,2,1)
plt.plot(history.history['accuracy'], label='Treino')
plt.plot(history.history['val_accuracy'], label='Validação')
plt.title('Acurácia')
plt.legend()

# Loss
plt.subplot(1,2,2)
plt.plot(history.history['loss'], label='Treino')
plt.plot(history.history['val_loss'], label='Validação')
plt.title('Loss')
plt.legend()

plt.show()

print("✅ Treinamento e avaliação concluídos!")