<a href="https://colab.research.google.com/github/flavio-mota/si-rna-ag-2025/blob/main/MLP/Lista_Exercicios_MLP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# 🧩 Lista de Exercícios – MLP com TensorFlow

Nesta atividade prática, você irá experimentar diferentes **arquiteturas**, **funções de custo**, **otimizadores** e **hiperparâmetros** em um **MLP (Perceptron Multicamadas)**.

O objetivo é compreender **como as escolhas de configuração afetam o aprendizado** e o desempenho da rede.


## ⚙️ Preparação do ambiente

In [None]:

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models
import matplotlib.pyplot as plt
import numpy as np

# Carregando o dataset MNIST
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# Normalização
x_train = x_train / 255.0
x_test = x_test / 255.0

# Flatten (28x28 -> 784)
x_train = x_train.reshape(-1, 784)
x_test = x_test.reshape(-1, 784)



## 🧠 Função base para criação do modelo

A função abaixo cria um modelo MLP simples.  
Você poderá modificá-la nas atividades seguintes.


In [None]:

def criar_modelo(neuronios=[128, 64], ativacao='relu', otimizador='adam', loss='sparse_categorical_crossentropy', taxa_aprendizado=None):
    model = models.Sequential()
    model.add(layers.Input(shape=(784,)))

    for n in neuronios:
        model.add(layers.Dense(n, activation=ativacao))

    model.add(layers.Dense(10, activation='softmax'))

    if taxa_aprendizado:
        opt_class = getattr(keras.optimizers, otimizador)
        optimizer = opt_class(learning_rate=taxa_aprendizado)
    else:
        optimizer = otimizador

    model.compile(optimizer=optimizer, loss=loss, metrics=['accuracy'])
    return model



## 🧩 Atividade 1 – Variar a Arquitetura da Rede

Modifique o número e o tamanho das camadas ocultas.

**Exemplo:**
- Modelo A: `[128, 64]`
- Modelo B: `[256, 128, 64]`
- Modelo C: `[128]`

Após cada alteração, execute o treinamento e observe o desempenho.


In [None]:

arquiteturas = {
    "Modelo A": [128, 64],
    "Modelo B": [256, 128, 64],
    "Modelo C": [128]
}

resultados = {}

for nome, camadas in arquiteturas.items():
    print(f"\nTreinando {nome} com camadas: {camadas}")
    model = criar_modelo(neuronios=camadas)
    h = model.fit(x_train, y_train, epochs=5, validation_split=0.2, verbose=1)
    resultados[nome] = h.history['val_accuracy']

plt.figure(figsize=(7,4))
for nome, acc in resultados.items():
    plt.plot(acc, label=nome)
plt.title("Comparação entre arquiteturas")
plt.xlabel("Épocas")
plt.ylabel("Acurácia de Validação")
plt.legend()
plt.show()



## 🧮 Atividade 2 – Variar Hiperparâmetros

Altere a **taxa de aprendizado**, o **otimizador**, o **número de épocas** e a **função de custo**.  
Observe como essas mudanças afetam o aprendizado.


In [None]:
# Consulte os nomes dos otimizadores em https://keras.io/api/optimizers/
hiperparametros = [
    #{"otimizador": "Adam", "taxa_aprendizado": 0.001, "loss": "sparse_categorical_crossentropy", "epocas": 5},
    {"otimizador": "SGD", "taxa_aprendizado": 0.01, "loss": "sparse_categorical_crossentropy", "epocas": 10},
    {"otimizador": "RMSprop", "taxa_aprendizado": 0.0005, "loss": "sparse_categorical_crossentropy", "epocas": 5}
]

resultados_hp = {}

for i, cfg in enumerate(hiperparametros, 1):
    print(f"\nTreinando configuração {i}: {cfg}")
    model = criar_modelo(otimizador=cfg["otimizador"], loss=cfg["loss"], taxa_aprendizado=cfg["taxa_aprendizado"])
    h = model.fit(x_train, y_train, epochs=cfg["epocas"], validation_split=0.2, verbose=1)
    resultados_hp[f"Config {i}"] = h.history['val_accuracy']

plt.figure(figsize=(7,4))
for nome, acc in resultados_hp.items():
    plt.plot(acc, label=nome)
plt.title("Comparação entre Hiperparâmetros")
plt.xlabel("Épocas")
plt.ylabel("Acurácia de Validação")
plt.legend()
plt.show()



## 🔍 Atividade 3 – Comparar Resultados

Crie um resumo comparando as **melhores acurácias** de cada configuração testada.


In [None]:

print("Resumo das melhores acurácias (validação):")
for nome, acc in {**resultados, **resultados_hp}.items():
    print(f"{nome}: {max(acc):.4f}")



## 🧪 Atividade 4 – Escolha o Melhor Modelo

Escolha a combinação (arquitetura + hiperparâmetros) que apresentou o melhor resultado.  
Depois, **treine novamente por mais épocas (ex: 15)** e visualize a curva de aprendizado.


In [None]:

melhor_modelo = criar_modelo(neuronios=[256, 128, 64], otimizador='adam', taxa_aprendizado=0.001)
hist = melhor_modelo.fit(x_train, y_train, epochs=15, validation_split=0.2, verbose=1)

plt.plot(hist.history['accuracy'], label='Treino')
plt.plot(hist.history['val_accuracy'], label='Validação')
plt.title('Curva de aprendizado do melhor modelo')
plt.xlabel('Épocas')
plt.ylabel('Acurácia')
plt.legend()
plt.show()



## 🧠 Atividade 5 – Reflexão Final

Responda às perguntas a seguir (use células de texto no Colab):

1. Qual arquitetura apresentou o melhor desempenho?  
2. Como a taxa de aprendizado influenciou o comportamento do modelo?  
3. Qual otimizador trouxe o aprendizado mais rápido ou estável?  
4. Houve sinais de *overfitting* em algum caso?  
5. Se você fosse treinar esse modelo por mais tempo, que ajustes faria?

> 💡 O objetivo é entender o impacto das suas decisões de configuração no resultado final da rede neural.
