# Regresion Logistica

## 1.Importacion de modulos

In [14]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, roc_curve, auc, confusion_matrix
from sklearn.preprocessing import StandardScaler
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

## 2. Lectura del dataset

In [15]:
data = pd.read_csv('Anexo3-Dataset_Heart_Disease_Cleveland_UCI/heart_cleveland_upload.csv')

## 3. Seleccionar las variables dependiente e independiente

In [16]:
X = data[['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 'restecg', 
          'thalach', 'exang', 'oldpeak', 'slope', 'ca', 'thal']] # Var Independiente
y = data['condition'] # Var Dependiente


## 4. Dividir el dataset en conjunto de entrenamiento y de pruebas

In [17]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [18]:
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

## 5. Crear y entrenar el modelo de Regresion Lineal

In [None]:
# Crear el modelo
model = LogisticRegression(max_iter=2000)

# Ajustar el modelo
model.fit(X_train, y_train)

## 6. Hacer Predicciones

In [20]:
y_pred = model.predict(X_test)

## 7. Evaluacion del Modelo

In [None]:
report = classification_report(y_test, y_pred, target_names=['No Enfermedad', 'Enfermedad'])
print(report)

### Matriz de confusion

In [None]:
cm = confusion_matrix(y_test, y_pred)

plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=['No Enfermedad', 'Enfermedad'], yticklabels=['No Enfermedad', 'Enfermedad'])
plt.title('Matriz de Confusión')
plt.xlabel('Predicción')
plt.ylabel('Realidad')
plt.show()

### Curva ROC

In [None]:
# Calcular las probabilidades de predicción
y_prob = model.predict_proba(X_test_scaled)[:, 1]

# Calcular la curva ROC
fpr, tpr, thresholds = roc_curve(y_test, y_prob)
roc_auc = auc(fpr, tpr)

# Visualizar la curva ROC
plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, color='blue', lw=2, label='Curva ROC (área = {:.2f})'.format(roc_auc))
plt.plot([0, 1], [0, 1], color='red', lw=2, linestyle='--')  # Línea diagonal
plt.title('Curva ROC')
plt.xlabel('Tasa de Falsos Positivos')
plt.ylabel('Tasa de Verdaderos Positivos')
plt.legend(loc='lower right')
plt.show()

## Prediccion con un nuevo registro

In [24]:
nuevo_registro = pd.DataFrame(np.array([[69, 1, 0, 160, 234, 1, 2, 131, 0, 0.1, 1, 1, 0]]), 
                              columns=['age', 'sex', 'cp', 'trestbps', 'chol', 'fbs', 
                                       'restecg', 'thalach', 'exang', 'oldpeak', 
                                       'slope', 'ca', 'thal'])

In [25]:
nuevo_registro_escalado = scaler.transform(nuevo_registro)

In [None]:
prediccion = model.predict(nuevo_registro_escalado)

In [None]:
if prediccion[0] == 1:
    print("El paciente tiene enfermedad cardíaca.")
else:
    print("El paciente no tiene enfermedad cardíaca.")