# Importando as bibliotecas a serem utilizadas

In [None]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, accuracy_score, confusion_matrix

# Importando o dataset do CSV

In [None]:
data = pd.read_csv('heart_attack_prediction_dataset.csv')

# Limpeza e preparação dos dados

# Removendo a coluna ID

In [None]:
data = data.drop(columns=['Patient ID'])

# Edição da pressão sanguínea, dividindo em duas colunas

In [None]:
data["Systolic Pressure"] = data["Blood Pressure"].apply(
    lambda x: x.split("/")[0]).astype(int)
data["Dyastolic Pressure"] = data["Blood Pressure"].apply(
    lambda x: x.split("/")[1]).astype(int)

# Exclusão da pressão sanguínea do dataset importado

In [None]:
data = data.drop(columns=['Blood Pressure'])

# Redução de casas decimais para uma após a vírgula

In [None]:
pd.set_option('display.precision', 1)

# Conversão dos dados da 'Diet' e 'Sex'

In [None]:
ordinal_map = {'Healthy': 2, 'Average': 1, 'Unhealthy': 0}
data['Diet'] = data['Diet'].map(ordinal_map)

In [None]:
ordinal_map_sex = {'Male': 1, 'Female': 0}
data['Sex'] = data['Sex'].map(ordinal_map_sex)

# Aprendizado de máquina

# Removendo colunas desnecessárias para o modelo

In [None]:
data = data.drop(columns=['Country', 'Continent', 'Hemisphere'])

# Separar dados preditores e dados a serem previstos 

In [None]:
X = data.drop(columns=['Heart Attack Risk'])
y = data['Heart Attack Risk']

# Normalizar dados preditores

In [None]:
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Dividir conjunto de dados

# Conjunto de treinamento: 80%, Conjunto de teste: 20%

In [None]:
X_train, X_test, y_train, y_test = train_test_split(
    X_scaled, y, test_size=0.20, random_state=42)

# Criando modelo

In [None]:
logreg_model = LogisticRegression(random_state=16)
logreg_model.fit(X_train, y_train)

# Executar as predições usando o modelo criado

In [None]:
y_pred = logreg_model.predict(X_test)

# Exibindo as métricas: Precisão, Matriz de confusão e Classificação

In [None]:
print("Precisão:", accuracy_score(y_test, y_pred))
print("Matrix de confusão:\n", confusion_matrix(y_test, y_pred))
print("Classificação:\n", classification_report(y_test, y_pred))

# Resultados
Precisão: 0.6417569880205363
Matrix de confusão:
 [[1125    0]
 [ 628    0]]
Classificação:
               precision    recall  f1-score   support

           0       0.64      1.00      0.78      1125
           1       0.00      0.00      0.00       628

    accuracy                           0.64      1753
   macro avg       0.32      0.50      0.39      1753
weighted avg       0.41      0.64      0.50      1753