# Informe & Conclusion del Modelo 

Lucho Jun|2025

<b>Consideracion:</b><br>
Antes de elaborar el informe, se detectaron dos cuestiones importantes relacionadas con la limpieza de datos. En primer lugar, se observó que algunos clientes realizaron múltiples consultas, con probabilidades de churn tanto positivas como negativas, lo que genera cierta ambigüedad en su clasificación. Este grupo representa entre el 5% y 10% del total. El número máximo de consultas registradas por un cliente es 16, aunque la mayoría de los casos se concentra en clientes con una sola consulta. Luego, se identifican algunos con dos motivos, llegando a un máximo de nueve, y a partir de ahí la frecuencia disminuye hasta estabilizarse en un solo motivo, que es el valor promedio y el más representativo.

En segundo lugar, se detectó una inconsistencia en las fechas: la fecha de finalización figura como fecha de inicio, y viceversa. Esto refleja un claro problema de calidad de datos.

Para abordar el problema de la recurrencia de los clientes, se propone utilizar tanto la variable temporal como el tipo de motivo de la consulta. Además, es importante considerar el contenido de las quejas, ya que al ser analizadas vectorialmente, estas aportan peso significativo dentro del algoritmo de predicción.

## Conclusion

Si bien el dataset presenta algunos problemas de calidad, estos fueron tenidos en cuenta durante el análisis. A medida que se avanzaba con el análisis exploratorio de datos (EDA), se identificaron nuevos inconvenientes, en su mayoría casos aislados. Por ejemplo, se observó que algunos clientes que presentaron reclamos pertenecían a zonas distintas, lo cual fue verificado durante el proceso.

Posteriormente, se aplicaron cuatro algoritmos distintos para el modelado. Se seleccionó aquel que mostró el mejor desempeño, evaluado principalmente a través del F1-score, dado que es la métrica más relevante en problemas de churn.

En cuanto al tema del desbalance poblacional, no se detecta un desbalance significativo en los datos, ya que la distribución de la variable objetivo no indica una relación desproporcionada entre clases.

### 1 Explicacion de implementacion y cuando se usa.
El modelo se implementaría en un entorno de producción para realizar predicciones en tiempo real o por lotes, dependiendo del caso de uso. Se usaría para clasificar eventos o casos en dos clases (por ejemplo, "True" o "False"), con el objetivo de maximizar el beneficio esperado según un umbral óptimo de decisión (0.35). Esto puede ser aplicado en escenarios como detección de fraude, segmentación de clientes o alertas tempranas.

El proceso típico sería:

- Preparar los datos en la entrada según las variables requeridas.  
- Ejecutar la predicción del modelo para cada registro.  
- Tomar decisiones basadas en la predicción y el umbral definido.  
- Monitorear el rendimiento del modelo y actualizarlo periódicamente con nuevos datos.

### 2 Explicacion del porque del algortimo

Se eligió Random Forest como algoritmo principal para predecir el churn en el banco PY debido a su capacidad para manejar datos complejos, con variables tanto numéricas como categóricas, y relaciones no lineales. A diferencia de otros modelos, no requiere una normalización estricta y puede captar interacciones complejas entre variables sin necesidad de un extenso trabajo de ingeniería de features. Esto lo hace especialmente adecuado para datos bancarios con estructuras mixtas. A pesar de que el dataset cuenta con más de 765.000 registros y presenta cierta asimetría en la clase objetivo, Random Forest mitiga el riesgo de sobreajuste

### 3 Explicar los resultados obtenidos (Métricas) y si tiene el rendimiento necesario para salir a producción.
 Umbral Óptimo y Beneficio

- **Umbral óptimo**: `0.38`  
- **Beneficio esperado**: `$309.936`

 Este umbral maximiza el beneficio esperado al combinar las predicciones con la estrategia de retención del banco.

 Métricas con Umbral Óptimo

| Clase      | Precision | Recall | F1-Score | Soporte  |
|------------|-----------|--------|----------|----------|
| No churn   | 0.83      | 0.69   | 0.75     | 160.523  |
| Churn      | 0.47      | 0.66   | 0.55     | 68.080   |
| **Accuracy** |         |        | 0.68     | 228.603  |

Interpretación:
- **Recall churn (0.66)**: El modelo detecta correctamente al 66% de los clientes que efectivamente se dieron de baja.  
- **Precision churn (0.47)**: De cada 100 clientes que el modelo predice que se darán de baja, 47 realmente lo hacen.  
- **F1-score churn (0.55)**: Equilibrio entre precisión y recall.  
- **Accuracy general (0.68)**: Correcta en el 68% de los casos totales.


El modelo tiene potencial de **uso productivo asistido**.
- Es **sensible (recall alto)**, lo que es útil en contextos donde **no detectar un churn es muy costoso**.
- Sin embargo, presenta **overfitting severo** y debe ser **mejorado antes de automatizar decisiones**.


- ¿Está Listo para Producción?

- Se usa como **alerta temprana** con validación humana posterior.
- Se aplica la estrategia de retención solo a casos evaluados por ejecutivos.
- El **beneficio supera el costo de intervenir falsos positivos**







### 4 Explicar cuales son las variables que más afectan a la predicción

El modelo identifica las siguientes 10 variables como las más influyentes para predecir si un cliente se dará de baja del banco:

| Ranking | Variable                      | Importancia | Desvío Estándar | Descripción |
|---------|-------------------------------|-------------|------------------|-------------|
| 1       | `puntos_de_loyalty`           | 0.291       | 0.0044           | Cantidad de puntos de fidelidad acumulados por el cliente. |
| 2       | `tiempo_atencion`             | 0.236       | 0.0051           | Tiempo que duró la atención en sucursal (en minutos). |
| 3       | `edad`                        | 0.138       | 0.0096           | Edad del cliente. |
| 4       | `longitud_descripcion`        | 0.137       | 0.0082           | Largo (en caracteres) de la descripción textual de la atención. |
| 5       | `segmento_cliente_B`          | 0.130       | 0.0573           | Si el cliente pertenece al segmento B. |
| 6       | `segmento_cliente_A`          | 0.022       | 0.0263           | Si el cliente pertenece al segmento A. |
| 7       | `segmento_cliente_C`          | 0.020       | 0.0248           | Si el cliente pertenece al segmento C. |
| 8       | `segmento_cliente_D`          | 0.020       | 0.0223           | Si el cliente pertenece al segmento D. |
| 9       | `prob_churn`                  | 0.002       | 0.0007           | Probabilidad estimada por el modelo anterior. |
| 10      | `tipo_asistencia_reclamo`     | 0.001       | 0.0005           | Si el motivo declarado fue un reclamo. |

Interpretación clave:

- **Loyalty** y **tiempo de atención** son las variables más fuertes: el modelo aprende que los clientes con menos puntos o con atenciones más largas tienen más probabilidad de churn.
- **Edad** y **contenido de la descripción** también aportan información relevante, posiblemente relacionada con el tipo de problemas expresados o la complejidad de la situación.
- Los **segmentos de clientes**, en especial el B, tienen peso importante: puede reflejar perfiles más sensibles al churn.
- Variables como el tipo de asistencia tienen muy poco impacto individual, aunque podrían ganar peso combinadas con otras.

> Esto sugiere que las variables **operativas y de comportamiento** (más que las categóricas o de motivo) son las más predictivas del churn.


### 5 A ¿El modelo final elegido es bueno?

**Sí, pero con matices.**  
El modelo cumple con los objetivos principales del negocio:

- **Detecta clientes con alta probabilidad de churn** con un *recall* del 66% en la clase positiva (clientes que efectivamente se dieron de baja), lo cual es clave para la estrategia de retención anticipada.
- Genera un **beneficio esperado de 309.936**, optimizando la relación entre costo de intervención y ganancia esperada.
- El **umbral fue ajustado** (a 0.38) para priorizar el beneficio y no simplemente la precisión clásica del modelo.
- El F1-score para churn es **0.55**, aceptable en un problema con clase desbalanceada y foco económico.

> Aunque las métricas clásicas no son perfectas, el modelo **logra un rendimiento económico claro y medible**, lo cual justifica su uso en producción bajo supervisión.

---

### 5 B ¿Existe overfitting o underfitting?

**Sí, hay indicios claros de *overfitting*.**

- Las métricas en **entrenamiento** son casi perfectas (Accuracy 99.95%, F1 0.9991, ROC AUC 1.00), lo cual es poco realista.
- En **test**, la performance cae notablemente (F1-score 0.4333, ROC AUC 0.76).
- Hay **diferencias marcadas** entre train y test:
  - F1-score: -0.5658
  - ROC AUC: -0.2385
- Sin embargo, la **validación cruzada** es estable y muy similar al test final (F1 ≈ 0.431), lo que sugiere que el *overfitting* no es catastrófico y se logró mitigar en parte con regularización o técnicas como early stopping.

> El modelo **tiene overfitting**, pero su impacto se ve compensado por un umbral ajustado y una métrica de negocio positiva, por lo que se puede considerar **viable en producción** si se monitorea y se entrena regularmente con nuevos datos.

<b>Notas</b><br>
Ahora se hace el testeo del modelo 

## Testeo Modelo

### Import Packages

In [1]:
import pandas as pd
import numpy as np
import joblib
import random
from datetime import datetime, timedelta

### Prueba de produccion

In [2]:
class ChurnPredictor:
    def __init__(self, model_path):
        try:
            # Cargar el modelo entrenado
            self.model = joblib.load(model_path)
            print("✅ Modelo cargado correctamente.")
        except Exception as e:
            print(f"❌ Error al cargar el modelo: {e}")
            self.model = None

    def predecir_churn(self, tipo_asistencia):
        """Función auxiliar para predecir probabilidad base de churn"""
        tipo_asistencia = str(tipo_asistencia)
        if tipo_asistencia.lower() == 'problema':
            return 1.0
        elif tipo_asistencia.lower() == 'reclamo':
            return 0.8 if random.random() < 0.5 else 0
        else:
            return 0

    def preparar_datos(self, datos_cliente):
        """
        Prepara los datos del cliente para la predicción.
        datos_cliente: Diccionario con los datos del cliente
        """
        cliente_df = pd.DataFrame([datos_cliente])

        # ✅ Validar y normalizar segmento_cliente
        segmento = cliente_df.at[0, 'segmento_cliente'].upper()
        if segmento not in ['A', 'B', 'C', 'D']:
            raise ValueError(f"segmento_cliente inválido: '{segmento}'. Debe estar entre A y D.")
        cliente_df.at[0, 'segmento_cliente'] = segmento

        # Calcular campos adicionales
        cliente_df['longitud_descripcion'] = cliente_df['descripcion_atencion'].str.len()
        cliente_df['tiempo_atencion'] = (
            pd.to_datetime(cliente_df['fin_atencion']) - 
            pd.to_datetime(cliente_df['inicio_atencion_utc'])
        ).dt.total_seconds() / 60
        cliente_df['zona_sucursal'] = cliente_df['zona_sucursal'].apply(lambda x: 0 if x == 'zona 1' else 1)
        cliente_df['prob_churn'] = cliente_df['tipo_asistencia'].apply(self.predecir_churn)

        # Eliminar columnas no necesarias
        columnas_a_eliminar = [
            'cliente_id', 'inicio_atencion_utc', 'fin_atencion',
            'geometry', 'descripcion_atencion'
        ]
        columnas_existentes = [col for col in columnas_a_eliminar if col in cliente_df.columns]
        
        return cliente_df.drop(columnas_existentes, axis=1)

    def predecir(self, datos_cliente, threshold=0.35):
        """
        Realiza la predicción de churn para un cliente.
        Devuelve:
        - probabilidad_churn: float entre 0 y 1
        - debe_retener: bool (True si probabilidad >= threshold)
        """
        if self.model is None:
            return {
                'error': 'Modelo no cargado',
                'probabilidad_churn': None,
                'debe_retener': None,
                'umbral': threshold
            }

        datos_preparados = self.preparar_datos(datos_cliente)
        proba = self.model.predict_proba(datos_preparados)[:, 1][0]

        return {
            'probabilidad_churn': proba,
            'debe_retener': proba >= threshold,
            'umbral': threshold
        }


In [3]:
if __name__ == "__main__":
    # Inicializar el predictor
    predictor = ChurnPredictor('modelo_entrenado1.pkl')

    # -------------------------
    # 🔎 Probar función auxiliar
    # -------------------------
    print("\n📌 Prueba función predecir_churn():")
    print(f"problema → {predictor.predecir_churn('problema')}")
    print(f"reclamo  → {predictor.predecir_churn('reclamo')}")
    print(f"consulta → {predictor.predecir_churn('consulta')}")

    # --------------------------
    # 🧪 Datos de prueba cliente
    # --------------------------
    datos_cliente = {
        'cliente_id': 12345,
        'segmento_cliente': 'd',
        'tipo_asistencia': 'problema',
        'descripcion_atencion': 'El cliente reporta problemas con su tarjeta',
        'inicio_atencion_utc': '2023-05-15 14:30:00',
        'fin_atencion': '2023-05-15 15:15:00',
        'puntos_de_loyalty': 85.0,
        'edad': 45,
        'zona_sucursal': 'zona 2',
        'geometry': '0101000020E6100000F4FDD478E9E24EC0DD24068195C33A40'
    }

    # --------------------------
    # 🔍 Probar preparación datos
    # --------------------------
    print("\n📋 Datos preparados:")
    df_preparado = predictor.preparar_datos(datos_cliente)
    print(df_preparado)

    # --------------------------
    # 🔮 Realizar predicción final
    # --------------------------
    print("\n📈 Resultado de la predicción:")
    resultado = predictor.predecir(datos_cliente)
    
    if 'error' in resultado:
        print("❌ No se pudo predecir porque el modelo no se cargó correctamente.")
    else:
        print(f"- Probabilidad de churn: {resultado['probabilidad_churn']:.1%}")
        print(f"- Debe retenerse: {'✅ SÍ' if resultado['debe_retener'] else '❌ NO'}")
        print(f"- Umbral utilizado: {resultado['umbral']:.0%}")

✅ Modelo cargado correctamente.

📌 Prueba función predecir_churn():
problema → 1.0
reclamo  → 0.8
consulta → 0

📋 Datos preparados:
  segmento_cliente tipo_asistencia  puntos_de_loyalty  edad  zona_sucursal  \
0                D        problema               85.0    45              1   

   longitud_descripcion  tiempo_atencion  prob_churn  
0                    43             45.0         1.0  

📈 Resultado de la predicción:
- Probabilidad de churn: 64.2%
- Debe retenerse: ✅ SÍ
- Umbral utilizado: 35%
