# üìà An√°lisis avanzado ‚Äì Cohortes y econom√≠a unitaria
Sesi√≥n 2 - Ciencia de Datos y Producto

### üéØ Objetivo de la sesi√≥n
Aplicar m√©todos de an√°lisis de cohortes para entender el comportamiento de los usuarios a lo largo del tiempo y evaluar la rentabilidad del negocio usando econom√≠a unitaria (LTV, CAC).


### 1Ô∏è‚É£ ¬øQu√© es una cohorte?

üìò **Concepto:** Grupo de usuarios con una acci√≥n com√∫n en un mismo periodo.  
üí° **Intuici√≥n:** Permite comparar c√≥mo evoluciona cada grupo a lo largo del tiempo.  
üõ†Ô∏è **Aplicaciones:** Analizar retenci√≥n, impacto de cambios y estacionalidad.

### 2Ô∏è‚É£ Tasa de retenci√≥n y cancelaci√≥n

üìò **Concepto:**  
- Retenci√≥n = usuarios activos / usuarios iniciales  
- Cancelaci√≥n = abandono respecto al mes anterior

üí° **Intuici√≥n:** Cu√°ntos usuarios siguen usando el producto.  
üõ†Ô∏è **Aplicaciones:** Medir fidelidad, detectar ca√≠das, monitorear salud del producto.

### 3Ô∏è‚É£ Cohortes por comportamiento

üìò **Concepto:** Agrupar por acciones espec√≠ficas, no solo por fecha.  
üí° **Intuici√≥n:** Segmentar por tipo de uso, no solo por cu√°ndo llegaron.  
üõ†Ô∏è **Aplicaciones:** Evaluar features, campa√±as o h√°bitos de uso.

### 4Ô∏è‚É£ Visualizaci√≥n con mapas de calor

üìò **Concepto:** Tabla de cohortes donde los colores indican intensidad (retenci√≥n o ingreso).  
üí° **Intuici√≥n:** F√°cil detecci√≥n visual de tendencias.  
üõ†Ô∏è **Aplicaciones:** Comunicaci√≥n de hallazgos, an√°lisis de retenci√≥n.

### 5Ô∏è‚É£ LTV (Lifetime Value)

üìò **Concepto:** Ingreso total que aporta un cliente durante su ciclo de vida.  
üí° **Intuici√≥n:** ¬øCu√°nto valor genera un usuario?  
üõ†Ô∏è **Aplicaciones:** Planeaci√≥n de marketing, modelos de pricing.

### 6Ô∏è‚É£ CAC (Customer Acquisition Cost)

üìò **Concepto:** Costo promedio de adquirir un cliente.  
üí° **Intuici√≥n:** ¬øCu√°nto nos cuesta cada usuario nuevo?  
üõ†Ô∏è **Aplicaciones:** Evaluaci√≥n de campa√±as y rentabilidad.

### 7Ô∏è‚É£ Relaci√≥n LTV / CAC

üìò **Concepto:** Medida clave de rentabilidad.  
üí° **Intuici√≥n:** Si LTV > CAC, hay ganancia. Ideal: LTV/CAC ‚âà 3.  
üõ†Ô∏è **Aplicaciones:** Decisiones de inversi√≥n, viabilidad del modelo.

### üß™ Simulaci√≥n de datos para cohortes y econom√≠a unitaria

In [None]:
import pandas as pd
import numpy as np

# Simulaci√≥n de datos
np.random.seed(42)
n_users = 50
user_ids = range(1001, 1001 + n_users)
registro = pd.to_datetime(np.random.choice(pd.date_range("2023-01-01", "2023-06-30", freq="D"), n_users))
compras = [registro[i] + pd.to_timedelta(np.random.randint(0, 120), unit="D") for i in range(n_users)]
montos = np.random.randint(20, 200, n_users)
cac = np.random.randint(5, 30, n_users)

df = pd.DataFrame({
    "user_id": user_ids,
    "fecha_registro": registro,
    "fecha_compra": compras,
    "monto": montos,
    "costo_adquisicion": cac
})

df["mes_cohorte"] = df["fecha_registro"].dt.to_period("M")
df["mes_compra"] = df["fecha_compra"].dt.to_period("M")
df.head()


### üìä Retenci√≥n de usuarios por cohorte

In [None]:
cohort_table = df.groupby(["mes_cohorte", "mes_compra"])["user_id"].nunique().unstack().fillna(0)
cohort_size = cohort_table.iloc[:, 0]
retencion = cohort_table.divide(cohort_size, axis=0)
retencion.style.format("{:.1%}")


### üå°Ô∏è Visualizaci√≥n con mapa de calor

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 6))
sns.heatmap(retencion, annot=True, fmt=".0%", cmap="Blues", linewidths=1, linecolor='gray')
plt.title("Mapa de calor de retenci√≥n por cohorte")
plt.ylabel("Cohorte de registro")
plt.xlabel("Mes de compra")
plt.tight_layout()
plt.show()


### üí∞ C√°lculo de LTV por cohorte

In [None]:
ltv_table = df.groupby(["mes_cohorte", "mes_compra"])["monto"].sum().unstack().fillna(0).cumsum(axis=1)
ltv_table.style.format("${:.0f}")


### üßÆ CAC promedio y comparaci√≥n con LTV

In [None]:
cac_promedio = df["costo_adquisicion"].mean()
ltv_promedio = df.groupby("user_id")["monto"].sum().mean()
ratio = ltv_promedio / cac_promedio

print(f"CAC promedio: ${cac_promedio:.2f}")
print(f"LTV promedio: ${ltv_promedio:.2f}")
print(f"Relaci√≥n LTV / CAC: {ratio:.2f}")
