<a href="https://colab.research.google.com/github/WellcomePeujio/Prediccion-de-Quiebra-Empresarial-con-Modelos-de-Machine-Learning/blob/main/Predicci%C3%B3n_de_Quiebra_Empresarial_con_Modelos_de_Machine_LearningUntitled35.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Predicción de Quiebra Empresarial con Modelos de Machine Learning

**Título**: "¿Cuáles empresas tienen más riesgo de quebrar?"

**Problema**: Un banco analiza empresas con la siguiente información:

| Empresa | Liquidez | Deuda/Activos (%) | ROA (%) | Quebró (Sí/No) |
|---------|---------|------------------|--------|--------------|
| A       | 1.5     | 50               | 5      | No           |
| B       | 1.2     | 75               | -2     | Sí           |
| C       | 0.8     | 85               | -5     | Sí           |

**Preguntas**:

1. Entrena un modelo de **regresión logística** para predecir la probabilidad de quiebra.
2. Evalúa qué empresa tiene mayor riesgo de quiebra según el modelo.
3. Genera un gráfico con la **probabilidad de quiebra** para cada empresa.


# Resolución Matemática: Predicción de Quiebra Empresarial con Regresión Logística

## Paso 1: Modelo de Regresión Logística

La probabilidad de quiebra de una empresa se modela mediante la **función sigmoide**:

$$
P(Y=1 | X) = \frac{1}{1 + e^{-(\beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3)}}
$$

Donde:
- $P(Y=1 | X)$ es la probabilidad de que la empresa quiebre.
- $X_1$: **Liquidez** (mayor liquidez reduce el riesgo de quiebra).
- $X_2$: **Deuda/Activos (%)** (mayor deuda aumenta el riesgo de quiebra).
- $X_3$: **ROA (%)** (rentabilidad sobre activos, valores negativos aumentan el riesgo).
- $\beta_0$ es el **intercepto** del modelo.
- $\beta_1, \beta_2, \beta_3$ son los coeficientes de cada variable.

---

## Paso 2: Sustitución de los Valores

Los coeficientes estimados del modelo son:

$$
\beta_0 = -4.5, \quad \beta_1 = -2.0, \quad \beta_2 = 0.07, \quad \beta_3 = -0.5
$$

Sustituyamos estos valores para cada empresa:

1. **Empresa A:**
   - Liquidez: 1.5
   - Deuda/Activos: 50%
   - ROA: 5%

   Cálculo del valor $Z_A$:

   $$
   Z_A = -4.5 + (-2.0 \times 1.5) + (0.07 \times 50) + (-0.5 \times 5)
   $$

   $$
   Z_A = -4.5 - 3 + 3.5 - 2.5 = -6.5
   $$

   Aplicando la función sigmoide:

   $$
   P_A = \frac{1}{1 + e^{-(-6.5)}}
   $$

   $$
   P_A \approx \frac{1}{1 + e^{6.5}} \approx \frac{1}{1 + 665} \approx 0.20\%
   $$

---

2. **Empresa B:**
   - Liquidez: 1.2
   - Deuda/Activos: 75%
   - ROA: -2%

   Cálculo del valor $Z_B$:

   $$
   Z_B = -4.5 + (-2.0 \times 1.2) + (0.07 \times 75) + (-0.5 \times -2)
   $$

   $$
   Z_B = -4.5 - 2.4 + 5.25 + 1 = -0.65
   $$

   Aplicando la función sigmoide:

   $$
   P_B = \frac{1}{1 + e^{-(-0.65)}}
   $$

   $$
   P_B = \frac{1}{1 + e^{0.65}} \approx \frac{1}{1 + 1.91} \approx 34.3\%
   $$

---

3. **Empresa C:**
   - Liquidez: 0.8
   - Deuda/Activos: 85%
   - ROA: -5%

   Cálculo del valor $Z_C$:

   $$
   Z_C = -4.5 + (-2.0 \times 0.8) + (0.07 \times 85) + (-0.5 \times -5)
   $$

   $$
   Z_C = -4.5 - 1.6 + 5.95 + 2.5 = 2.35
   $$

   Aplicando la función sigmoide:

   $$
   P_C = \frac{1}{1 + e^{-2.35}}
   $$

   $$
   P_C = \frac{1}{1 + e^{-2.35}} \approx \frac{1}{1 + 0.095} \approx 91.3\%
   $$

---

## Paso 3: Interpretación de los Resultados

1. **Empresa A** tiene **un riesgo extremadamente bajo de quiebra (0.20%)** debido a su alta liquidez y baja deuda.
2. **Empresa B** tiene **un riesgo moderado de quiebra (34.3%)**, indicando que su alto nivel de deuda y baja rentabilidad aumentan su vulnerabilidad.
3. **Empresa C** tiene **un riesgo muy alto de quiebra (91.3%)**, debido a su baja liquidez, alta deuda y rentabilidad negativa.

Estos resultados muestran cómo diferentes factores financieros afectan la probabilidad de quiebra y cómo los modelos de machine learning pueden ayudar en la toma de decisiones financieras.


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.special import expit  # Función sigmoide

# Datos de las empresas
empresas = ["A", "B", "C"]
liquidez = np.array([1.5, 1.2, 0.8])
deuda_activos = np.array([50, 75, 85])
roa = np.array([5, -2, -5])

# Coeficientes estimados de la regresión logística
beta_0 = -4.5
beta_1 = -2.0
beta_2 = 0.07
beta_3 = -0.5

# Cálculo del puntaje Z para cada empresa
Z = beta_0 + beta_1 * liquidez + beta_2 * deuda_activos + beta_3 * roa

# Cálculo de la probabilidad de quiebra usando la función sigmoide
probabilidad_quiebra = expit(Z) * 100  # Convertir a porcentaje

# Gráfico de probabilidad de quiebra
plt.figure(figsize=(8, 5))
plt.bar(empresas, probabilidad_quiebra, color=["green", "orange", "red"])
plt.xlabel("Empresa")
plt.ylabel("Probabilidad de Quiebra (%)")
plt.title("Probabilidad de Quiebra Estimada para Cada Empresa")
plt.ylim(0, 100)

# Mostrar valores en las barras
for i, prob in enumerate(probabilidad_quiebra):
    plt.text(i, prob + 2, f"{prob:.1f}%", ha='center', fontsize=12)

plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.show()
