# Regressão Linear com Dataset de Saúde
Este notebook realiza uma análise de regressão linear utilizando dados do dataset de saúde.
Ele explora a relação entre despesas totais de saúde e um indicador de cobertura.

In [None]:
# Importar bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import linear_model
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Configurações de exibição
sns.set()
plt.rcParams['figure.figsize'] = (15, 9)

In [None]:
# Carregar o dataset
dataset_path = 'datasets/saude_despesas_limpo.csv'
saude = pd.read_csv(dataset_path)

# Exibir informações iniciais
print(saude.head())

## Regressão Linear
Vamos explorar a relação entre as despesas totais de saúde per capita e a cobertura da atenção básica.

In [None]:
# Selecionar variáveis para regressão
X = saude['desp_tot_saude_pc_mun'].values.reshape(-1, 1)  # Variável independente
y = saude['cob_ab'].values.reshape(-1, 1)  # Variável dependente

# Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar e treinar o modelo
lin_regr = linear_model.LinearRegression()
lin_regr.fit(X_train, y_train)

# Fazer previsões
y_pred = lin_regr.predict(X_test)

# Exibir coeficientes e métricas
print(f'Coeficiente: {lin_regr.coef_[0][0]:.2f}')
print(f'Intercepto: {lin_regr.intercept_[0]:.2f}')
print(f'Erro Quadrático Médio: {mean_squared_error(y_test, y_pred):.2f}')
print(f'R²: {r2_score(y_test, y_pred):.2f}')

## Visualização da Regressão Linear
O gráfico abaixo mostra a linha de regressão e os pontos de dados.

In [None]:
# Plotar a regressão linear
sns.regplot(x='desp_tot_saude_pc_mun', y='cob_ab', data=saude, line_kws={'color': 'red'})
plt.title('Regressão Linear: Despesas Totais de Saúde vs. Cobertura da Atenção Básica')
plt.xlabel('Despesas Totais de Saúde per Capita (R$)')
plt.ylabel('Cobertura da Atenção Básica (%)')
plt.show()