# üß† Prevenindo Overfitting: T√©cnicas de Regulariza√ß√£o

**Objetivo da Aula:** Entender o que √© Overfitting (superajuste) e aprender a aplicar t√©cnicas modernas de Deep Learning para combat√™-lo, garantindo que seu modelo **generalize** bem para dados que nunca viu antes.

### O que √© Overfitting?
Imagine um estudante que, ao estudar para uma prova, decora exatamente as respostas dos exerc√≠cios do livro, mas n√£o entende a l√≥gica por tr√°s.
* Se a prova tiver as mesmas quest√µes do livro, ele tira **10 (Acur√°cia de Treino Alta)**.
* Se a prova tiver quest√µes novas sobre o mesmo assunto, ele vai **mal (Acur√°cia de Teste Baixa)**.

Em Machine Learning, queremos que o modelo aprenda o **padr√£o**, n√£o que decore os exemplos.

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, regularizers
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# Configurando semente para reprodutibilidade - 1981 / 1895 - Ano do mundial do flamengo
tf.random.set_seed(1981)
np.random.seed(1981)


## 1. Prepara√ß√£o dos Dados (Dataset MNIST)

Vamos usar o dataset **MNIST** (d√≠gitos manuscritos).

‚ö†Ô∏è **Cen√°rio Did√°tico:** Para facilitar a visualiza√ß√£o do overfitting, vamos criar uma situa√ß√£o "dif√≠cil": treinaremos um modelo complexo com **poucos dados de treino** (apenas 1000 imagens).

In [None]:
# 1. Carregar o dataset


# 2. Normalizar os pixels (de 0-255 para 0-1)



# 3. Reduzir drasticamente o tamanho do treino para FOR√áAR o overfitting
# Vamos usar apenas 1000 imagens para treino (ao inv√©s de 60.000)



## 2. Fun√ß√£o Auxiliar de Visualiza√ß√£o

Vamos criar uma fun√ß√£o para plotar os gr√°ficos de **Perda (Loss)** e **Acur√°cia**. √â aqui que detectamos o overfitting visualmente: quando a linha de treino continua melhorando, mas a linha de valida√ß√£o (teste) come√ßa a piorar.

## 3. O Modelo "Superajustado" (Overfitted)

Vamos criar uma rede neural profunda e potente. Como temos poucos dados, ela vai "decorar" os exemplos rapidamente.

**Caracter√≠sticas:**
* Muitos neur√¥nios (512 por camada).
* Nenhuma t√©cnica de regulariza√ß√£o.

üëÄ **An√°lise Visual:**
Note que a linha azul (Treino) chega quase a 100% de acur√°cia. Por√©m, a linha laranja (Valida√ß√£o) estagna ou at√© piora (o erro sobe). Isso √© a defini√ß√£o cl√°ssica de **Overfitting**.

---

## 4. T√©cnicas de Combate ao Overfitting

### T√©cnica A: Simplifica√ß√£o do Modelo

"A Navalha de Ockham". Se o modelo for menor, ele √© obrigado a focar nos padr√µes principais e n√£o consegue decorar os detalhes irrelevantes.

### T√©cnica B: Early Stopping (Parada Antecipada)

E se pud√©ssemos parar o treinamento exatamente no momento em que o modelo come√ßa a "decorar"?
Usamos o **Callback** `EarlyStopping`.

### T√©cnica C: Regulariza√ß√£o L2 (Weight Decay)

A regulariza√ß√£o L2 adiciona uma "multa" (penalidade) baseada no tamanho dos pesos da rede. Isso for√ßa a rede a manter os pesos pequenos, evitando que um √∫nico neur√¥nio domine a decis√£o.

### T√©cnica D: Dropout

O **Dropout** desliga aleatoriamente alguns neur√¥nios durante o treino. √â como uma equipe onde os membros trocam de fun√ß√£o todo dia: isso for√ßa todos a aprenderem um pouco de tudo e evita depend√™ncias excessivas.

### T√©cnica E: Batch Normalization

O **Batch Normalization** normaliza os dados *entre* as camadas da rede. Al√©m de acelerar o treino, ele tem um leve efeito de regulariza√ß√£o.

## 5. O Modelo Robusto (Combina√ß√£o)

Combinando **Dropout**, **L2** e **Early Stopping** para obter o melhor resultado poss√≠vel.

## 6. Data Augmentation (Buscando mais dados)

## Conclus√£o

A arte do Deep Learning est√° em equilibrar a capacidade do modelo (tamanho) com a regulariza√ß√£o para atingir a melhor generaliza√ß√£o poss√≠vel.

1.  **Early Stopping:** Economiza tempo.
2.  **L2:** Penaliza pesos grandes.
3.  **Dropout:** For√ßa robustez desligando neur√¥nios.