# üìû Optimizaci√≥n de Horarios de Llamadas en Cobranzas
## Demo Anal√≠tica - Proof of Concept

---

### üìä Contexto del Problema

En la gesti√≥n de cobranzas, una de las principales ineficiencias es realizar llamadas en horarios donde los clientes no atienden. Este notebook demuestra c√≥mo usar datos hist√≥ricos para identificar las franjas horarias m√°s efectivas y generar un plan de acci√≥n para reducir llamadas improductivas.

> **Objetivo:** Aumentar la tasa de contacto efectivo mediante un an√°lisis de patrones de respuesta.

### üõ†Ô∏è Stack T√©cnico y Librer√≠as

Este an√°lisis utiliza `Pandas` para la manipulaci√≥n de datos y `NumPy` para la generaci√≥n del dataset sint√©tico.

In [None]:
import pandas as pd
import numpy as np

print("‚úÖ Librer√≠as cargadas correctamente.")

### üì¶ Fase 1: Generaci√≥n de Datos Sint√©ticos

Para esta demo, simulamos **250 registros hist√≥ricos** de llamadas para 10 clientes, cubriendo un horario de 08:00 a 21:00 hs. Los resultados se distribuyen de forma realista para reflejar un escenario t√≠pico.

> **Nota sobre Privacidad:** Los datos son 100% sint√©ticos y generados con `numpy.random`. No se utiliza informaci√≥n real de clientes.

In [None]:
# Configuraci√≥n de semilla para reproducibilidad
np.random.seed(42)

clientes = range(1001, 1011)
registros = []

# Generar 25 intentos por cliente
for cliente in clientes:
    for _ in range(25):
        hora = np.random.randint(8, 21)
        minuto = np.random.randint(0, 60)
        resultado = np.random.choice(
            ["atendi√≥", "no atendi√≥", "rechaz√≥"],
            p=[0.35, 0.55, 0.10]
        )
        registros.append({
            "cliente_id": cliente,
            "hora": f"{hora:02d}:{minuto:02d}",
            "resultado": resultado
        })

df = pd.DataFrame(registros)

print(f"‚úÖ Dataset generado con {len(df)} registros.")
df.head()

### ‚öôÔ∏è Fase 2: Feature Engineering

Transformamos los datos crudos para el an√°lisis:

1.  **Segmentaci√≥n Horaria:** Clasificamos cada llamada en una de tres franjas:
    - **Ma√±ana** (08:00 - 11:59)
    - **Tarde** (12:00 - 17:59)
    - **Noche** (18:00 - 21:00)
2.  **Variable de Atenci√≥n:** Creamos una columna binaria (`atendida`) que es `True` si el resultado fue "atendi√≥" y `False` en caso contrario.

In [None]:
# Funci√≥n para clasificar horarios en franjas
def franja_horaria(hora_str):
    h = int(hora_str.split(":")[0])
    if 8 <= h < 12:
        return "Ma√±ana"
    elif 12 <= h < 18:
        return "Tarde"
    else:
        return "Noche"

# Aplicar transformaciones
df["franja"] = df["hora"].apply(franja_horaria)
df["atendida"] = df["resultado"] == "atendi√≥"

print("‚úÖ Features de franja horaria y atenci√≥n creadas.")
df.head()

### üìà Fase 3: An√°lisis de Patrones

Calculamos la **tasa de atenci√≥n** para cada cliente en cada franja horaria. Esta m√©trica es la clave para identificar los mejores horarios.

> **M√©trica Clave:** `tasa_atencion = (llamadas atendidas) / (total de intentos)`

In [None]:
# Agrupar por cliente y franja para calcular intentos y atenciones
resumen = (
    df.groupby(["cliente_id", "franja"])
      .agg(
          intentos=("atendida", "count"),
          atendidas=("atendida", "sum")
      )
      .reset_index()
)

# Calcular la tasa de atenci√≥n
resumen["tasa_atencion"] = resumen["atendidas"] / resumen["intentos"]

print("‚úÖ An√°lisis de tasas de atenci√≥n completado.")
resumen.head(10)

### üéØ Fase 4: Generaci√≥n de Recomendaciones

Con las tasas calculadas, seleccionamos para cada cliente la franja horaria con la **mayor probabilidad de atenci√≥n**.

In [None]:
# Encontrar la mejor franja por cliente (la de mayor tasa de atenci√≥n)
mejor_horario = (
    resumen.sort_values("tasa_atencion", ascending=False)
    .groupby("cliente_id")
    .first()
    .reset_index()
)

print("‚úÖ Mejores horarios por cliente identificados.")
mejor_horario

### üí∞ Fase 5: Impacto Empresarial y Plan de Acci√≥n

Finalmente, traducimos los hallazgos en un plan de acci√≥n concreto y cuantificamos el impacto potencial.

In [None]:
# Calcular m√©tricas de impacto
tasa_actual = df["atendida"].mean()
tasa_optimizada = mejor_horario["tasa_atencion"].mean()
mejora_relativa = (tasa_optimizada - tasa_actual) / tasa_actual

print("=" * 45)
print("      üí∞ IMPACTO PROYECTADO üí∞")
print("=" * 45)
print(f"Tasa de contacto actual (baseline): {tasa_actual:.1%}")
print(f"Tasa proyectada con optimizaci√≥n:   {tasa_optimizada:.1%}")
print(f"Mejora relativa potencial:          +{mejora_relativa:.1%}")
print("=" * 45)

#### Plan de Acci√≥n Operativo

In [None]:
# Generar el plan de acci√≥n priorizado
top_clientes = mejor_horario.sort_values("tasa_atencion", ascending=False)

print("=" * 60)
print("üéØ PLAN DE LLAMADAS OPTIMIZADO - RANKING DE PRIORIDAD")
print("=" * 60)

for _, row in top_clientes.iterrows():
    horario_map = {
        "Ma√±ana": "(08:00-12:00)",
        "Tarde": "(12:00-18:00)",
        "Noche": "(18:00-21:00)"
    }
    
    print(
        f"- Cliente {int(row['cliente_id'])}: "
        f"Llamar en {row['franja'].upper()} {horario_map[row['franja']]}. "
        f"(Prob. √©xito: {row['tasa_atencion']:.0%}, "
        f"basado en {int(row['intentos'])} intentos)"
    )

print("=" * 60)

### ‚úÖ Conclusiones

Este an√°lisis demuestra que es posible transformar datos simples de llamadas en una estrategia operativa que mejora la eficiencia.

**Pr√≥ximos Pasos Sugeridos:**
-   Analizar tambi√©n por d√≠a de la semana.
-   Integrar con una base de datos real (SQL).
-   Crear un dashboard interactivo (Streamlit/Plotly).