In [None]:
# Importar las librerías necesarias
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix, roc_auc_score, roc_curve
import matplotlib.pyplot as plt
import seaborn as sns

# Configurar estilo de gráficos
sns.set(style="whitegrid")

# Cargar los datos en un DataFrame
data_path = r'C:\DATASET\Enfermedad_Cardiaca.csv'
datos = pd.read_csv(data_path)

# Análisis Exploratorio de los Datos
print("Descripción de los datos:")
print(datos.describe())

print("\nRevisión de tipos de datos y datos faltantes:")
print(datos.info())

# Identificación de Datos Faltantes
print("\nDatos faltantes en cada columna:")
print(datos.isnull().sum())

# Visualizar Datos Atípicos 
plt.figure(figsize=(10, 8))
sns.boxplot(data=datos, orient="h")
plt.title("Visualización de Datos Atípicos")
plt.show()

# Separar variables independientes (X) y dependiente (y)
X = datos.drop(columns=['cp','age', 'trestbps', 'thalach', 'oldpeak'])  
y = datos['condition']  

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)

# Crear y ajustar el modelo de regresión logística
modelo = LogisticRegression(max_iter=1000) 
modelo.fit(X_train, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = modelo.predict(X_test)

# Evaluación del modelo
print("Precisión del modelo:", accuracy_score(y_test, y_pred))
print("\nReporte de clasificación:")
print(classification_report(y_test, y_pred))

# Matriz de confusión
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix(y_test, y_pred), annot=True, fmt='d', cmap='Blues')
plt.xlabel("Predicción")
plt.ylabel("Real")
plt.title("Matriz de Confusión")
plt.show()

# Curva ROC y AUC
y_pred_proba = modelo.predict_proba(X_test)[:, 1]
fpr, tpr, thresholds = roc_curve(y_test, y_pred_proba)
roc_auc = roc_auc_score(y_test, y_pred_proba)

plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, color='blue', label=f'AUC = {roc_auc:.2f}')
plt.plot([0, 1], [0, 1], color='red', linestyle='--')
plt.xlabel("Tasa de Falsos Positivos (FPR)")
plt.ylabel("Tasa de Verdaderos Positivos (TPR)")
plt.title("Curva ROC")
plt.legend()
plt.show()
