# Proyecto Final - Minería de Datos  
## Predicción de LTV y CAC, y Simulación de ROMI

---

## 1. Introducción

Este cuaderno resume los resultados obtenidos a lo largo del proyecto de minería de datos enfocado en el análisis de campañas de marketing, predicción del LTV (Customer Lifetime Value) y CAC (Customer Acquisition Cost), así como la simulación del retorno de inversión en marketing (ROMI).

---

## 2. Objetivos

- Predecir el LTV acumulado a 30, 90 y 180 días desde la primera visita del usuario.
- Predecir el CAC por fuente de adquisición a 7, 14 y 30 días.
- Evaluar múltiples modelos de regresión.
- Seleccionar el mejor modelo por métrica (RMSE).
- Simular la asignación presupuestaria y estimar el ROMI.

---

## 3. Modelos Evaluados

Para cada variable objetivo se entrenaron y evaluaron los siguientes modelos:

- **Linear Regression**
- **Ridge Regression**
- **Lasso Regression**
- **SGD Regressor**
- **LightGBM Regressor**

La métrica principal utilizada para comparación fue el **Root Mean Squared Error (RMSE)**.

---

## 4. Resultados - Predicción de LTV

### Modelos evaluados para cada horizonte:

- **LTV a 30 días**:
  - Ridge: RMSE ≈ 0.0013 ✅ *(mejor)*
  - LightGBM: RMSE ≈ 6.90

- **LTV a 90 días**:
  - Ridge: RMSE ≈ 0.0013 ✅ *(mejor)*
  - LightGBM: RMSE ≈ 10.70

- **LTV a 180 días**:
  - Ridge: RMSE ≈ 0.0012 ✅ *(mejor)*
  - LightGBM: RMSE ≈ 12.68

> Ridge superó al resto por amplio margen, probablemente por la fuerte regularización y escala de los datos de LTV acumulado.

---

## 5. Resultados - Predicción de CAC

### Modelos evaluados por fuente y ventana temporal:

- **CAC por fuente a 30 días**:
  - LightGBM: RMSE ≈ 73.50 ✅ *(mejor)*
  - Ridge/Lasso: RMSE ≈ 140.63
  - Linear: RMSE ≈ 160.36

> A diferencia del LTV, en CAC los modelos lineales tradicionales fueron superados ampliamente por LightGBM, que logró modelar la no linealidad inherente a los datos de costos.

---

## 6. Simulación de ROMI

- Se utilizó el mejor modelo para LTV (`ridge`) y para CAC (`lightgbm`) por fuente.
- Se definió una estrategia de asignación de presupuesto `[0.3, 0.3, 0.2, 0.2]`.
- La función `simulate_marketing_budget()` (ver `utils.py`) calcula:

  - LTV estimado por fuente
  - CAC estimado por fuente
  - Presupuesto invertido
  - Clientes adquiridos (estimación)
  - Ingresos totales
  - ROMI

> ❗ *Nota: el script original presentó un error por falta del parámetro `source_assignment`. La simulación aún debe ejecutarse para obtener resultados concretos de ROMI.*

---

## 7. Conclusiones

- **Modelado exitoso de LTV y CAC** con bajo error para LTV (≈0.0012) y resultados competitivos en CAC (≈73.5).
- **Ridge** fue excelente para LTV, mientras que **LightGBM** fue óptimo para CAC.
- Se logró preparar un sistema completo para simulación de estrategias de inversión y retorno.

---