# 📏 Avaliação do Modelo 1 - Métricas de Regressão

## 🎯 Objetivo
Avaliar o desempenho do Modelo 1 (todas as variáveis) usando métricas R² e MAE.

## 📦 Etapa 1: Importações

In [1]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score, mean_absolute_error

## 📂 Etapa 2: Preparação dos dados

In [2]:
df = pd.read_csv("exame_diabes.csv")
df = df.drop(columns=["id_paciente"])
df = pd.get_dummies(df, columns=["genero"], drop_first=True)
# Criar coluna IMC
df["altura_m"] = df["altura"] / 100
df["imc"] = df["peso"] / (df["altura_m"] ** 2)
df.drop(columns=["altura_m"], inplace=True)


## 📐 Etapa 3: Separar variáveis

In [3]:
X = df.drop(columns=["resultado"])
y = df["resultado"]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

## 🧠 Etapa 4: Treinar modelo

In [4]:
modelo1 = LinearRegression()
modelo1.fit(X_train, y_train)
y_pred = modelo1.predict(X_test)

## 📊 Etapa 5: Avaliação com métricas

In [5]:
r2 = r2_score(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
print("R²:", round(r2, 4))
print("MAE:", round(mae, 4))

R²: -0.1602
MAE: 10.6581


## ✅ Conclusão

In [None]:
- R² indica **quanto da variação dos dados** é explicada pelo modelo (ideal > 0.7)
- MAE mostra o **erro médio absoluto** das previsões (ideal o menor possível)
- Com base nesses valores, decidiremos se o modelo precisa de ajustes ou comparação com alternativas

In [None]:
> No próximo notebook: comparação com o modelo 2 (apenas IMC como variável explicativa)
