# Redes Neurais para Classifica√ß√£o de Objetos

Neste notebook, vamos aprender os fundamentos de **redes neurais artificiais** aplicadas √† classifica√ß√£o de objetos. 
Trabalharemos com o dataset **digits** do sklearn, que cont√©m imagens de d√≠gitos de 0 a 9. 

O objetivo √© introduzir os conceitos de **MLP (Multilayer Perceptron)**, **pr√©-processamento**, **treinamento**, e **avalia√ß√£o de modelos** antes de avan√ßarmos para redes convolucionais em aulas futuras.

## 1. Conceitos te√≥ricos

**Redes Neurais Artificiais (ANN)** s√£o modelos inspirados no funcionamento do c√©rebro humano. Elas s√£o formadas por **neur√¥nios artificiais** organizados em camadas:

- **Camada de entrada:** recebe os dados brutos (ex.: pixels de uma imagem).
- **Camadas escondidas:** processam os dados aplicando fun√ß√µes de ativa√ß√£o, detectando padr√µes complexos.
- **Camada de sa√≠da:** produz a previs√£o final, por exemplo, a classe de um d√≠gito.

### Funcionamento de uma camada:
Cada neur√¥nio realiza:
1. Uma **combina√ß√£o linear** dos inputs: ùëß = w1*x1 + w2*x2 + ... + b
2. Passa o resultado por uma **fun√ß√£o de ativa√ß√£o** (ex.: ReLU, sigmoid, softmax)

### Aprendizado:
- O modelo ajusta os **pesos (w)** e **bias (b)** para minimizar a diferen√ßa entre previs√£o e valor real.
- Usamos **backpropagation** + **otimizadores** (ex.: Adam) para atualizar os pesos.

### Por que MLP funciona para imagens pequenas
- Cada pixel da imagem √© tratado como uma caracter√≠stica independente.
- Para imagens pequenas (8x8), isso √© suficiente para classificar os d√≠gitos.
- Limita√ß√£o: n√£o preserva **informa√ß√£o espacial** (vizinha√ßa de pixels), mas introduziremos isso mais tarde em CNNs.

## 2. Importando bibliotecas

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.utils import to_categorical

## 3. Carregando e explorando os dados

In [None]:
digits = load_digits()
X = digits.images
y = digits.target

plt.figure(figsize=(8,4))
for i in range(10):
    plt.subplot(2,5,i+1)
    plt.imshow(X[i], cmap='gray')
    plt.title(y[i])
    plt.axis('off')
plt.show()

## 4. Pr√©-processamento dos dados

Passos necess√°rios antes de treinar a rede:
1. Achatar imagens 8x8 ‚Üí vetor de 64 elementos.
2. Normalizar valores dos pixels para melhorar aprendizado.
3. Transformar classes em **one-hot encoding** para usar softmax.

In [None]:
X_flat = X.reshape((X.shape[0], -1))
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X_flat)
y_cat = to_categorical(y, num_classes=10)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_cat, test_size=0.2, random_state=42)

## 5. Construindo a rede neural

Estrutura simples:
- Camada oculta: 32 neur√¥nios, ReLU
- Camada de sa√≠da: 10 neur√¥nios, softmax

**Fun√ß√µes de ativa√ß√£o:**
- ReLU: mant√©m valores positivos e zera negativos, ajuda aprendizado r√°pido
- Softmax: transforma sa√≠das em probabilidades somando 1

In [None]:
model = Sequential([
    Dense(32, activation='relu', input_shape=(64,)),
    Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
model.summary()

## 6. Treinando a rede

- Validamos o modelo durante o treinamento para monitorar overfitting.
- N√∫mero de √©pocas: 30
- Batch size: 32

In [None]:
history = model.fit(X_train, y_train, validation_split=0.2, epochs=30, batch_size=32)

## 7. Avaliando o modelo

Calculamos acur√°cia no conjunto de teste e visualizamos algumas previs√µes.

In [None]:
test_loss, test_acc = model.evaluate(X_test, y_test)
print(f'Acur√°cia no conjunto de teste: {test_acc:.2f}')

y_pred = model.predict(X_test)
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.argmax(y_test, axis=1)

plt.figure(figsize=(8,4))
for i in range(10):
    plt.subplot(2,5,i+1)
    plt.imshow(X_test[i].reshape(8,8), cmap='gray')
    plt.title(f'T:{y_true[i]} P:{y_pred_classes[i]}')
    plt.axis('off')
plt.show()

## 8. Conclus√£o

- Aprendemos a construir uma **rede MLP** para classifica√ß√£o de imagens.
- Revisamos conceitos de **neur√¥nios, camadas, fun√ß√µes de ativa√ß√£o e backpropagation**.
- Vimos a import√¢ncia do **pr√©-processamento**, normaliza√ß√£o e codifica√ß√£o one-hot.

Em aulas futuras, exploraremos **redes convolucionais (CNNs)**, que conseguem extrair padr√µes espaciais automaticamente e s√£o mais poderosas para imagens complexas.

# Problema de Classifica√ß√£o com MLP

**T√≠tulo:** Classifica√ß√£o de Esp√©cies de Animais

**Descri√ß√£o:**
Desenvolva um modelo de **Rede Neural Perceptron Multicamadas (MLP)** para classificar esp√©cies de animais a partir de suas caracter√≠sticas f√≠sicas, utilizando o **Zoo Dataset** (dispon√≠vel no Kaggle ou via `sklearn.datasets`). O modelo deve prever corretamente a classe do animal ‚Äî mam√≠fero, ave, r√©ptil, peixe, anf√≠bio, inseto ou molusco ‚Äî com alta acur√°cia.

**Sobre o Dataset:**

* **Conjunto:** 101 inst√¢ncias, 16 atributos (15 booleanos e 1 num√©rico ‚Äî n√∫mero de patas).
* **Classes:** 7 categorias de animais.
* **Acesso:** `sklearn.datasets.fetch_openml(name='zoo', version=1)` ou [Kaggle](https://www.kaggle.com/datasets/uciml/zoo-animal-classification).

**Tarefas:**

1. Carregar e dividir o dataset em **treino (80%)** e **teste (20%)**.
2. Implementar uma **MLP** com:

   * 1‚Äì2 camadas ocultas (10‚Äì50 neur√¥nios cada).
   * Ativa√ß√£o **ReLU** (ocultas) e **Softmax** (sa√≠da).
   * Fun√ß√£o de perda: **Entropia Cruzada Categ√≥rica**.
   * Otimizador: **Adam**.
3. Avaliar o desempenho com **acur√°cia, precis√£o, recall e F1-score**.
4. Ajustar **hiperpar√¢metros** (taxa de aprendizado, n√∫mero de √©pocas) e aplicar **regulariza√ß√£o** (ex.: dropout) para reduzir overfitting.
5. Gerar uma **matriz de confus√£o** para an√°lise detalhada das classes.

**Desafios Extras:**

* Tratar o **desbalanceamento de classes**.
* **Normalizar** o atributo num√©rico (n√∫mero de patas).
* Aplicar **valida√ß√£o cruzada** para garantir robustez.

**Resultado Esperado:**

* Modelo com **acur√°cia acima de 90%**.
* Relat√≥rio final com m√©tricas e matriz de confus√£o.