# Predição de Doenças Cardíacas com MLP e Regressão Logística
Este notebook utiliza o dataset de doenças cardíacas da UCI para treinar dois modelos: um Perceptron Multicamadas (MLP) e uma Regressão Logística, comparando seus desempenhos.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score, precision_score, recall_score, f1_score

## Carregamento dos Dados

In [None]:
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/processed.cleveland.data"
columns = ['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg',
           'thalach', 'exang', 'oldpeak', 'slope', 'ca', 'thal', 'target']
df = pd.read_csv(url, names=columns)
df.replace('?', np.nan, inplace=True)
df[['ca', 'thal']] = df[['ca', 'thal']].astype(float)
df.dropna(inplace=True)
df['target'] = df['target'].apply(lambda x: 1 if int(x) > 0 else 0)
df.head()

## Pré-processamento

In [None]:
X = df.drop('target', axis=1)
y = df['target']
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42, stratify=y)

## Regressão Logística

In [None]:
logreg = LogisticRegression()
logreg.fit(X_train, y_train)
y_pred_lr = logreg.predict(X_test)

## Rede Neural MLP

In [None]:
mlp = MLPClassifier(hidden_layer_sizes=(32, 16), max_iter=1000, random_state=42)
mlp.fit(X_train, y_train)
y_pred_mlp = mlp.predict(X_test)

## Avaliação dos Modelos

In [None]:
def avaliar_modelo(nome, y_true, y_pred):
    print(f"\n{name:=^50}")
    print(f"Acurácia: {accuracy_score(y_true, y_pred):.2f}")
    print(f"Precisão: {precision_score(y_true, y_pred):.2f}")
    print(f"Recall: {recall_score(y_true, y_pred):.2f}")
    print(f"F1-score: {f1_score(y_true, y_pred):.2f}")
    print("\nRelatório de Classificação:\n")
    print(classification_report(y_true, y_pred))

In [None]:
avaliar_modelo("Regressão Logística", y_test, y_pred_lr)
avaliar_modelo("Rede Neural MLP", y_test, y_pred_mlp)

## Matriz de Confusão

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(12, 5))
for ax, pred, title in zip(axes, [y_pred_lr, y_pred_mlp], ["Regressão Logística", "Rede Neural MLP"]):
    sns.heatmap(confusion_matrix(y_test, pred), annot=True, fmt='d', cmap='Blues', ax=ax)
    ax.set_title(title)
    ax.set_xlabel("Predito")
    ax.set_ylabel("Real")
plt.tight_layout()
plt.show()

## Conclusão
- A Regressão Logística apresentou desempenho básico e interpretável.
- A MLP obteve melhor recall e F1-score, sendo mais eficaz na detecção de pacientes com risco.
- Em cenários reais, a escolha dependeria do equilíbrio entre interpretabilidade e desempenho.