# 📘 Modelo Preditivo com Regressão Linear
Este notebook mostra como construir um modelo preditivo usando regressão linear com o conjunto de dados `insurance.csv`, além de avaliar seu desempenho com métricas estatísticas.

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.preprocessing import LabelEncoder

## 1. Carregando os dados

In [None]:
# Carrega o dataset
df = pd.read_csv("insurance.csv")
df.head()

## 2. Pré-processamento: codificação de variáveis categóricas

In [None]:
# Converte colunas categóricas para valores numéricos
le = LabelEncoder()
df['sex'] = le.fit_transform(df['sex'])
df['smoker'] = le.fit_transform(df['smoker'])
df['region'] = le.fit_transform(df['region'])

## 3. Separando variáveis independentes e dependente

In [None]:
# X são os atributos; y é a variável alvo
X = df.drop("charges", axis=1)
y = df["charges"]

## 4. Dividindo os dados em treino e teste

In [None]:
# Divide o conjunto em 80% treino e 20% teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## 5. Criando e treinando o modelo

In [None]:
# Cria e treina o modelo de Regressão Linear
modelo = LinearRegression()
modelo.fit(X_train, y_train)

## 6. Fazendo previsões

In [None]:
# Gera previsões com o modelo treinado
y_pred = modelo.predict(X_test)

## 7. Calculando métricas de avaliação

In [None]:
# Calcula as métricas estatísticas
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

## 8. Exibindo os resultados

In [None]:
# Exibe as métricas no console
print("📊 Métricas do modelo:")
print(f"➡️ Mean Squared Error (MSE): {mse:.2f}")
print(f"➡️ Mean Absolute Error (MAE): {mae:.2f}")
print(f"➡️ R² Score: {r2:.4f}")