<a href="https://colab.research.google.com/github/wilferalexander/varios/blob/main/regresi%C3%B3n_log%C3%ADstica_.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **🔍📈 ¿Qué es la regresión logística y cuándo se usa? **


La regresión logística es una técnica de machine learning que se utiliza para predecir el resultado de una variable categórica (como sí/no, verdadero/falso) basada en una o más variables independientes.


A diferencia de la regresión lineal, que predice valores continuos, la regresión logística predice probabilidades y clasificaciones.


**¿Cómo funciona?**

**Datos de entrada:**

Tienes datos históricos con variables independientes (características) y una variable dependiente categórica (resultado).


**Modelo de probabilidad:**

 La regresión logística utiliza una función logística (también conocida como sigmoide) para modelar la probabilidad de que un evento ocurra.


**Clasificación**:
 Basándose en la probabilidad calculada, el modelo clasifica el resultado en una de las categorías.

**Ejemplos de uso:**

**Salud:**

**Diagnóstico de enfermedades:**

 Predecir si un paciente tiene una enfermedad (sí/no) basado en síntomas y resultados de pruebas.

**Finanzas:**

Aprobación de crédito: Determinar si un solicitante de crédito es probable que pague o no (aprobado/rechazado) basado en su historial financiero.

**Marketing:**

Respuesta a campañas: Predecir si un cliente responderá a una campaña publicitaria (sí/no) basado en su historial de compras y comportamiento.

**Recursos Humanos:**

Retención de empleados: Predecir si un empleado dejará la empresa (sí/no) basado en factores como satisfacción laboral y desempeño.

**Seguridad:**

**Detección de fraudes:**

Identificar transacciones fraudulentas (fraude/no fraude) basado en patrones de transacción.

In [1]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# Datos de ejemplo: Horas de estudio y aprobación del examen (1 = aprobado, 0 = no aprobado)
data = {'HorasEstudio': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
        'Aprobado': [0, 0, 0, 0, 1, 1, 1, 1, 1, 1]}
df = pd.DataFrame(data)

# Variables independientes y dependiente
X = df[['HorasEstudio']]
y = df['Aprobado']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Crear el modelo de regresión logística
modelo = LogisticRegression()
modelo.fit(X_train, y_train)

# Predicción
y_pred = modelo.predict(X_test)

# Evaluación del modelo
precision = accuracy_score(y_test, y_pred)
print(f"Precisión del modelo: {precision:.2f}")

# Predicción para un nuevo dato
nueva_hora_estudio = np.array([[7]])
prediccion = modelo.predict(nueva_hora_estudio)
print(f"Para 7 horas de estudio, la probabilidad de aprobar es: {'Aprobado' if prediccion[0] == 1 else 'No Aprobado'}")

Precisión del modelo: 1.00
Para 7 horas de estudio, la probabilidad de aprobar es: Aprobado




Este código crea un modelo de regresión logística usando datos de ejemplo (horas de estudio y aprobación del examen). Luego, predice si un estudiante que estudia 7 horas aprobará el examen y evalúa la precisión del modelo.