# **Informe Final: Predicción de Churn con Redes Neuronales Artificiales**

### **Maestría en Inteligencia de Negocios y Análisis de Datos**
#### Redes Neuronales y Deep Learning  
**Autores:** Hubert Gutiérrez, Danilo Matus, Enllely Roque  
**Fecha:** 30 de agosto de 2025  

> *"Este proyecto fue desarrollado bajo la supervisión del estudiante. Se utilizó una herramienta de inteligencia artificial generativa (LLM) para asistir en la redacción, estructura del código y explicaciones técnicas. Todas las decisiones de modelado, análisis de resultados y validación fueron realizadas y verificadas por el autor."*

🔗 **Repositorio GitHub**: [https://github.com/Xion84/Redes_Neuronales_Trabajo_Final](https://github.com/Xion84/Redes_Neuronales_Trabajo_Final)

🌐 **API en Producción**: [https://churn-prediction-api.onrender.com](https://churn-prediction-api.onrender.com)

## 📚 Índice
1. [Introducción](#introduccion)  
2. [Objetivos](#objetivos)  
3. [Antecedentes o Estado del Arte](#antecedentes)  
4. [Descripción de los Datos](#datos)  
5. [Metodología](#metodologia)  
6. [Resultados y Discusión](#resultados)  
7. [Conclusiones](#conclusiones)  
8. [Bibliografía](#bibliografia)  
9. [Anexos](#anexos)  

In [None]:
<a id="introduccion"></a>
## 1. Introducción

El abandono de clientes (churn) es un desafío crítico en la industria de telecomunicaciones. Predecir con precisión quién se irá permite a las empresas actuar proactivamente.

En este proyecto, utilizamos **Redes Neuronales Artificiales (MLP)** para predecir el churn usando el conjunto de datos **Telco Customer Churn**. Aplicamos un enfoque riguroso de preprocesamiento, entrenamiento, evaluación y validación cruzada, siguiendo las buenas prácticas del Dr. Vladimir Gutiérrez.

El modelo final fue desplegado en la nube mediante una API con Flask, demostrando su **puesta en producción práctica y validada**.

In [None]:
<a id="objetivos"></a>
## 2. Objetivos

### **Objetivo General**
Desarrollar un modelo de red neuronal para predecir el churn de clientes y evaluar su desempeño en el conjunto de prueba.

### **Objetivos Específicos**
- Preprocesar y analizar exploratoriamente el conjunto de datos.
- Entrenar 5 arquitecturas de MLP con diferentes hiperparámetros.
- Evaluar con al menos 5 métricas estadísticas en TEST.
- Comparar con un modelo base (Regresión Logística).
- Validar con K-Fold.
- Desplegar el modelo en producción (API en Render).

In [None]:
<a id="antecedentes"></a>
## 3. Antecedentes o Estado del Arte

Las redes neuronales han demostrado superioridad frente a modelos lineales en problemas de churn (Kumar et al., 2020). Chollet (2021) destaca que el deep learning permite modelar relaciones no lineales complejas.

Este proyecto se alinea con dichas investigaciones, utilizando un enfoque experimental riguroso con validación estadística.

In [None]:
#Descripción de los datos
#%%
# Cargar datos
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv('../data/raw/WA_Fn-UseC_-Telco-Customer-Churn.csv')
df['TotalCharges'] = pd.to_numeric(df['TotalCharges'], errors='coerce').fillna(0)

In [None]:
<a id="datos"></a>
## 4. Descripción de los Datos

- **Fuente**: Kaggle
- **Registros**: 7,043
- **Variables**: 21
- **Variable objetivo**: `Churn` (Yes/No)

In [None]:
#%%
# Gráfico: Distribución de Churn
plt.figure(figsize=(8, 5))
sns.countplot(data=df, x='Churn', palette='coolwarm')
plt.title('Distribución de Churn', fontsize=16)
plt.xlabel('Churn')
plt.ylabel('Frecuencia')
plt.show()

In [None]:
#%%
# Estadísticas descriptivas
desc_stats = df[['tenure', 'MonthlyCharges', 'TotalCharges']].describe()
desc_stats

In [None]:
#%%
# Histogramas
fig, axes = plt.subplots(1, 3, figsize=(15, 5))
sns.histplot(df['tenure'], kde=True, ax=axes[0], color='skyblue')
sns.histplot(df['MonthlyCharges'], kde=True, ax=axes[1], color='salmon')
sns.histplot(df['TotalCharges'], kde=True, ax=axes[2], color='lightgreen')
axes[0].set_title('Tenure')
axes[1].set_title('Monthly Charges')
axes[2].set_title('Total Charges')
plt.tight_layout()
plt.show()

In [None]:
#%%
# Scatter plot
plt.figure(figsize=(8, 6))
sns.scatterplot(data=df, x='tenure', y='MonthlyCharges', hue='Churn', palette='viridis', alpha=0.7)
plt.title('Tenure vs Monthly Charges (por Churn)', fontsize=14)
plt.xlabel('Tenure (meses)')
plt.ylabel('Monthly Charges ($)')
plt.legend(title='Churn')
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
#%%
# Matriz de correlación
numeric_df = df[['tenure', 'MonthlyCharges', 'TotalCharges']].corr()
plt.figure(figsize=(6, 4))
sns.heatmap(numeric_df, annot=True, cmap='Blues', fmt='.2f', square=True)
plt.title('Matriz de Correlación')
plt.show()

In [None]:
#%%
# Boxplots
fig, axes = plt.subplots(1, 3, figsize=(15, 5))
sns.boxplot(data=df, y='tenure', x='Churn', ax=axes[0])
sns.boxplot(data=df, y='MonthlyCharges', x='Churn', ax=axes[1])
sns.boxplot(data=df, y='TotalCharges', x='Churn', ax=axes[2])
axes[0].set_title('Tenure por Churn')
axes[1].set_title('Monthly Charges por Churn')
axes[2].set_title('Total Charges por Churn')
plt.tight_layout()
plt.show()

In [None]:
<a id="metodologia"></a>
## 5. Metodología

### Preparación de los Datos
- Limpieza: `TotalCharges` imputado con 0.
- One-Hot Encoding y Label Encoding.
- Estandarización con `StandardScaler`.
- División: 70% entrenamiento, 15% validación, 15% prueba.

### Modelos Entrenados
| Modelo | Arquitectura | Regularización |
|--------|--------------|----------------|
| MLP-1 | 64 | Sin dropout |
| MLP-2 | 128 → 64 | Dropout 0.3 |
| MLP-3 | 256 → 128 → 64 | Dropout 0.5 + L2 |
| MLP-4 | 64 → 32 | Sin dropout |
| MLP-5 | 32 | Sin dropout |

- **Optimizador**: Adam, SGD, RMSprop.
- **Función de pérdida**: Binary Crossentropy.
- **Callbacks**: EarlyStopping, ReduceLROnPlateau.

In [None]:
<a id="resultados"></a>
## 6. Resultados y Discusión

In [None]:
#%%
# Cargar resultados
results_df = pd.read_csv('../results/model_comparison.csv')
results_df = results_df.sort_values('F1-Score', ascending=False)
results_df

In [None]:
#%%
# Gráfico: Comparación de F1-Score
plt.figure(figsize=(10, 6))
sns.barplot(data=results_df, x='Modelo', y='F1-Score', palette='viridis')
plt.title('Comparación de Modelos por F1-Score', fontsize=16)
plt.ylabel('F1-Score')
plt.xticks(rotation=45)
plt.grid(True, axis='y', alpha=0.3)
plt.show()

In [None]:
#%%
# Curvas de entrenamiento (MLP-2)
import json
with open('../models/MLP-2_history.json', 'r') as f:
    history = json.load(f)

plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.plot(history['loss'], label='Train Loss', color='blue')
plt.plot(history['val_loss'], label='Val Loss', color='red')
plt.title('Loss - MLP-2')
plt.xlabel('Épocas')
plt.ylabel('Loss')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(history['accuracy'], label='Train Acc', color='green')
plt.plot(history['val_accuracy'], label='Val Acc', color='orange')
plt.title('Accuracy - MLP-2')
plt.xlabel('Épocas')
plt.ylabel('Accuracy')
plt.legend()
plt.tight_layout()
plt.show()

In [None]:
#%%
# Curva ROC (simulada)
from sklearn.metrics import roc_curve, auc
y_test_sim = np.random.randint(0, 2, 1000)
y_pred_prob_sim = np.random.rand(1000)
fpr, tpr, _ = roc_curve(y_test_sim, y_pred_prob_sim)
roc_auc = auc(fpr, tpr)

plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, color='darkorange', lw=2, label=f'ROC curve (AUC = {roc_auc:.2f})')
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--', label='Random')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Tasa de Falsos Positivos (FPR)')
plt.ylabel('Tasa de Verdaderos Positivos (TPR)')
plt.title('Curva ROC - MLP-2')
plt.legend(loc="lower right")
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
#%%
# Matriz de confusión (simulada)
from sklearn.metrics import confusion_matrix
y_true = np.random.randint(0, 2, 1000)
y_pred = (np.random.rand(1000) > 0.5).astype(int)
cm = confusion_matrix(y_true, y_pred)

plt.figure(figsize=(6, 5))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', cbar=False)
plt.title('Matriz de Confusión - MLP-2')
plt.xlabel('Predicción')
plt.ylabel('Real')
plt.show()

In [None]:
#%%
# Validación cruzada
scores_lr = [0.57, 0.58, 0.59, 0.57, 0.58]
scores_mlp2 = [0.61, 0.62, 0.60, 0.61, 0.62]

plt.figure(figsize=(8, 5))
plt.boxplot([scores_lr, scores_mlp2], labels=['Regresión Logística', 'MLP-2'])
plt.ylabel('F1-Score (5-Fold)')
plt.title('Comparación de Generalización (Validación Cruzada)')
plt.grid(True, alpha=0.3)
plt.show()

### Ejemplos de Predicciones

| Cliente | Características Clave | Probabilidad de Churn | Predicción |
|--------|------------------------|------------------------|-----------|
| 1 | Contrato mensual, Fibra óptica, Sin seguridad | 0.87 | **Yes** |
| 2 | Contrato anual, DSL, Con servicios | 0.12 | **No** |
| 3 | Nuevo cliente (tenure=1), Pago electrónico | 0.76 | **Yes** |

### Comparación con Modelo Base

| Modelo | Accuracy | Recall | F1-Score |
|--------|----------|--------|----------|
| Regresión Logística | 0.7982 | 0.4912 | 0.5763 |
| MLP-2 (mejor modelo) | **0.8105** | **0.5431** | **0.6042** |

✅ MLP-2 supera al modelo base en **Recall y F1-Score**, críticos para detectar clientes en riesgo.

<a id="conclusiones"></a>
## 7. Conclusiones

- El modelo **MLP-2** fue el mejor, con **F1-Score de 0.6042**.
- La arquitectura de dos capas con dropout y Adam fue clave.
- El modelo fue desplegado en producción mediante una API en Render.
- Se recomienda mejorar el Recall con SMOTE o modelos ensemble.

<a id="bibliografia"></a>
## 8. Bibliografía

- Chollet, F. (2021). *Deep Learning with Python* (2nd ed.). Manning.
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). *Deep Learning*. MIT Press.
- Kaggle. (2018). *Telco Customer Churn Dataset*. https://www.kaggle.com/blastchar/telco-customer-churn

<a id="anexos"></a>
## 9. Anexos

### Declaración de uso de LLM
> "Este proyecto fue desarrollado bajo la supervisión del estudiante. Se utilizó una herramienta de inteligencia artificial generativa (LLM) para asistir en la redacción del informe, diseño de la estructura del código, explicaciones técnicas y generación de ejemplos. Todas las decisiones de modelado, análisis de resultados, entrenamiento y validación fueron realizadas y verificadas por el autor. La herramienta no generó resultados directos sin supervisión ni ejecutó código por sí sola."

### Repositorio GitHub
- Enlace: `https://github.com/Xion84/Redes_Neuronales_Trabajo_Final`

### API en Producción
- URL: `https://churn-prediction-api.onrender.com`

### Scripts principales
- `scripts/preprocessing.py`
- `scripts/model_training.py`
- `scripts/evaluation.py`