<a href="https://colab.research.google.com/github/wilferalexander/varios/blob/main/RLogistica_diagn%C3%B3stico_de_enfermedades%3F.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🔍📈 ¿Qué es la regresión logística y cómo se usa en el diagnóstico de enfermedades?

La regresión logística es una técnica de machine learning que se utiliza para predecir el resultado de una variable categórica (como sí/no) basada en una o más variables independientes. En el área de la salud, puede ser una herramienta poderosa para predecir si un paciente tiene una enfermedad basándose en síntomas y resultados de pruebas.

**¿Cómo funciona?**

**Datos de entrada:**
 Tienes datos históricos con síntomas y resultados de pruebas de pacientes, junto con el diagnóstico (enfermedad sí/no).

**Modelo de probabilidad:**
La regresión logística utiliza una función logística (sigmoide) para modelar la probabilidad de que un paciente tenga la enfermedad.

**Clasificación:**
 Basándose en la probabilidad calculada, el modelo clasifica el resultado en "enfermedad sí" o "enfermedad no".


In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Datos de ejemplo: Síntomas y diagnóstico (1 = enfermedad, 0 = no enfermedad)
data = {
    'Edad': [25, 34, 45, 52, 23, 40, 60, 48, 33, 55],
    'Presion_Alta': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1],
    'Colesterol_Alto': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1],
    'Diagnostico': [0, 1, 1, 1, 0, 1, 1, 0, 0, 1]
}
df = pd.DataFrame(data)

# Variables independientes y dependiente
X = df[['Edad', 'Presion_Alta', 'Colesterol_Alto']]
y = df['Diagnostico']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Crear el modelo de regresión logística
modelo = LogisticRegression()
modelo.fit(X_train, y_train)

# Predicción
y_pred = modelo.predict(X_test)

# Evaluación del modelo
precision = accuracy_score(y_test, y_pred)
print(f"Precisión del modelo: {precision:.2f}")

# Predicción para un nuevo paciente
nuevo_paciente = np.array([[50, 1, 1]])  # Edad 50, Presión Alta, Colesterol Alto
prediccion = modelo.predict(nuevo_paciente)
probabilidad = modelo.predict_proba(nuevo_paciente)

print(f"Para un paciente de 50 años con presión alta y colesterol alto, la probabilidad de tener la enfermedad es: {probabilidad[0][1]:.2f}")
print(f"Diagnóstico: {'Enfermedad' if prediccion[0] == 1 else 'No Enfermedad'}")

Precisión del modelo: 0.33
Para un paciente de 50 años con presión alta y colesterol alto, la probabilidad de tener la enfermedad es: 0.84
Diagnóstico: Enfermedad




Este código crea un modelo de regresión logística usando datos de ejemplo (edad, presión alta, colesterol alto y diagnóstico). Luego, predice si un nuevo paciente de 50 años con presión alta y colesterol alto tiene la enfermedad y evalúa la precisión del modelo.

**Resultados esperados:**

**Precisión del modelo:**
La precisión del modelo indica qué tan bien el modelo clasifica correctamente los diagnósticos.

**Predicción para un nuevo paciente:**
 El modelo predice la probabilidad de que un nuevo paciente tenga la enfermedad y clasifica el diagnóstico como "Enfermedad" o "No Enfermedad".
¡Y eso es todo! La regresión logística es una herramienta poderosa para hacer predicciones categóricas en el área de la salud. 🚀