<a href="https://colab.research.google.com/github/evelynsoares/perceptron-mlp-pytorch/blob/main/Atividade_Perceptron_e_MLP_com_scripts_programados_com_PyTorch.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Atividade - Perceptron e MLP com scripts programados com PyTorch**

**Observação:** Os trabalhos serão avaliados apenas se implementados por PyTorch.

*   **Nome**:
*   **Matrícula**:

---

# **Diagnóstico de Diabetes com Redes Neurais**

Nesta atividade, vamos trabalhar com um problema aplicado de **classificação binária**: prever se uma pessoa possui ou não diabetes com base em um conjunto de variáveis clínicas.

[Pima Indians Diabetes Database](https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database)

---

## **Contexto**

- O dataset utilizado é o **Pima Indians Diabetes Dataset**, coletado originalmente pelo Instituto Nacional de Diabetes e Doenças Digestivas e Renais dos Estados Unidos.
- Ele contém registros de mulheres com pelo menos 21 anos de idade da população Pima, um grupo étnico nativo norte-americano com alta incidência de diabetes tipo 2.

## **Objetivo**

O objetivo é treinar uma MLP para prever a presença de diabetes a partir de atributos fisiológicos e laboratoriais.

## **Variáveis de entrada**

Cada observação contém os seguintes atributos:

1. **Pregnancies**, number of times pregnant: Variável discreta.
2. **Glucose**, plasma glucose concentration after 2 hours in an oral glucose tolerance test: Variável contínua.
3. **BloodPressure**, diastolic blood pressure, in mm Hg: Variável contínua.
4. **SkinThickness**, triceps skin fold thickness, in mm: Variável contínua.
5. **Insulin**, 2-hour serum insulin, in μU/mL: Variável contínua.
6. **BMI**, body mass index, weight in kg/(height in m)²: Variável contínua.
7. **DiabetesPedigreeFunction**, family history function: Variável contínua.
8. **Age**, in years: : Variável discreta.

## **Variáveis de saída (Target)**

- **Outcome = 1**: Diabetic
- **Outcome = 0**: Non-diabetic


# **Exercício 1 - Preparação dos dados**

1. Apresente um resumo estatístico básico e visualizações simples, como correlação entre variáveis e histogramas procurando inconsistências que podem afetar a construção do modelo.
2. Faça a divisão dos dados:
  - 70% para treino
  - 15% para validação
  - 15% para teste

Use como exemplo a aula colab do dia 21/05/2025.
```python
import pandas as pd

# URL do dataset
url = "https://raw.githubusercontent.com/pcbrom/perceptron-mlp-cnn/refs/heads/main/data/diabetes.csv"

# Carregar o dataset
df = pd.read_csv(url)
```



# **Exercício 2 - Construção MLP**

1. Proponha uma arquiterura de MLP, defina os hiperparâmetros, otimizador, função de perda.
2. Faça o treinamento da rede e apresente:
  - Acurácia no conjunto de teste.
  - Matriz de confusão.
  - Relatório de classificação.

Use como exemplo a aula colab do dia 21/05/2025.

```python
from sklearn.metrics import confusion_matrix, classification_report, accuracy_score
import seaborn as sns
# --- Acurácia
acc_test = accuracy_score(y_true_test, y_pred_test)
print(f"Acurácia no conjunto de teste: {acc_test:.4f}")

# --- Matriz de confusão
cm = confusion_matrix(y_true_test, y_pred_test)
plt.figure(figsize=(4, 4))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', cbar=False)
plt.title('Matriz de Confusão (Teste)')
plt.xlabel('Classe Predita')
plt.ylabel('Classe Real')
plt.tight_layout()
plt.show()

# --- Relatório de classificação
print("\nRelatório de Classificação:")
print(classification_report(y_true_test, y_pred_test, digits=4, zero_division=1))
```

# **Exercício 3 - Perguntas finais para discussão crítica**

1. Como a arquitetura do MLP influenciou os resultados obtidos?
2. A seleção de variáveis melhorou a generalização do modelo? Justifique com evidências.
3. Houve sinais de overfitting durante o treinamento? Quais ajustes foram feitos para lidar com isso?
4. Qual foi o impacto da escolha da função de ativação no desempenho final?
5. O número de neurônios por camada afetou a taxa de convergência ou o erro final?
6. A validação durante o treino ajudou a definir uma arquitetura mais estável? Explique.
7. Qual foi a principal limitação do seu modelo mais simples em comparação com os mais complexos?
8. Como os diferentes otimizadores utilizados impactaram a aprendizagem do MLP?
9. Houve inconsistência entre o desempenho no conjunto de validação e no teste? Como interpretá-la?

