# Regressão Logística

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import GridSearchCV

import joblib




In [None]:
df = pd.read_csv('../../dataset/heart-failure-tratado.csv')
df.head(3)

In [None]:
# Features
x = df.drop(columns=['HeartDisease'])

# Target
y = df['HeartDisease']

In [None]:
# Split do dataset em conjuntos de treinamento e teste.

# # 70% treino, 30% teste
# x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=45)

# 90% treino, 10% teste
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.1, random_state=45)




In [None]:
modelo = LogisticRegression()
modelo.fit(x_train, y_train)

# joblib.dump(modelo, 'modelo_regressao_logistica.pkl')

In [None]:
# Fazendo previsões sobre o conjunto de teste
y_pred = modelo.predict(x_test)

In [None]:
# Calculando métricas de desempenho (acurácia, precisão, revocação e F1-Score)

accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='micro')
recall = recall_score(y_test, y_pred, average='micro')
f1 = f1_score(y_test, y_pred, average='micro')

print("Acurácia:", accuracy)
print("Precisão:", precision)
print("Recall:", recall)
print("F1-Score:", f1)

In [None]:
## Criar arquivo do modelo treinado
# joblib.dump(modelo, 'modelo_regressao_logistica.pkl')

In [None]:
cm = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(6, 5))
sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", cbar=False,
            xticklabels=['Positivo', 'Negativo'],
            yticklabels=['Positivo', 'Negativo'],
            linewidths=1, linecolor='gray', square=True)

plt.title("Matriz de Confusão", fontsize=14, pad=15)
plt.xlabel("Classe Real", fontsize=12)
plt.ylabel("Classe Prevista", fontsize=12)
plt.tight_layout()
plt.show()

# Tuning dos hiperparâmetros

In [None]:
# 90% treino, 10% teste
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.1, random_state=45)

In [None]:
modelo = LogisticRegression()

# Encontrar os melhores parametros para o modelo (Tunning de hiperparâmetros)
parametros = [
    # Dicionário 1: Para o solver 'liblinear' que suporta l1 e l2
    {
        'solver': ['liblinear'],
        'penalty': ['l1', 'l2'],
        'C': [0.01, 0.1, 1, 10]
    },
    
    # Dicionário 2: Para solvers que suportam l2
    {
        'solver': ['lbfgs', 'newton-cg', 'sag'],
        'penalty': ['l2', None], # <-- CORRIGIDO AQUI
        'C': [0.01, 0.1, 1, 10]
    },
    
    # Dicionário 3: Para o solver 'saga'
    {
        'solver': ['saga'],
        'penalty': ['l1', 'l2', 'elasticnet', None],
        'C': [0.01, 0.1, 1, 10],
        'l1_ratio': np.linspace(0, 1, 10)
    }
]


clf = GridSearchCV(estimator=modelo,
    param_grid=parametros,
    cv=5,
    scoring='accuracy',
    n_jobs=-1,
    verbose=2)

clf.fit(x_train, y_train)

In [None]:
# Exibindo os melhores parâmetros encontrados
print(f"Melhores parâmetros encontrados: {clf.best_params_}")
best_model = clf.best_estimator_
best_model

In [None]:
# Fazendo previsões sobre o conjunto de teste com o melhor modelo
y_pred = best_model.predict(x_test)

In [None]:
# Calculando métricas de desempenho (acurácia, precisão, revocação e F1-Score)

accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='micro')
recall = recall_score(y_test, y_pred, average='micro')
f1 = f1_score(y_test, y_pred, average='micro')

print("Acurácia:", accuracy)
print("Precisão:", precision)
print("Recall:", recall)
print("F1-Score:", f1)

In [None]:
cm = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(6, 5))
sns.heatmap(cm, annot=True, fmt="d", cmap="Blues", cbar=False,
            xticklabels=['Positivo', 'Negativo'],
            yticklabels=['Positivo', 'Negativo'],
            linewidths=1, linecolor='gray', square=True)

plt.title("Matriz de Confusão", fontsize=14, pad=15)
plt.xlabel("Classe Real", fontsize=12)
plt.ylabel("Classe Prevista", fontsize=12)
plt.tight_layout()
plt.show()