# 📊 Parcial – Análisis de Redes Sociales (Primer Corte)

## 🎯 Objetivo
Evaluar tu dominio de **filtros** y **agrupaciones** en Python (sin pivots ni gráficos) y tu capacidad de **análisis de negocio** en métricas de marketing: **CAC, LTV, churn rate, funnel, unit economics (LTV/CAC)**.

---
## 🧩 Contexto de Negocio (Caso Real)
**StartUp SaaS en crecimiento.** Vende planes **Basic, Pro, Enterprise** en **LatAm, North America, Europe, APAC**. Los canales de adquisición son: **meta_ads, google_ads, organic_search, outbound_sales**. Los usuarios se registran por **web** o **mobile_app**.

La dirección quiere decidir **dónde invertir el presupuesto del próximo trimestre**. Te piden:

1) Identificar **canales más rentables** (relación **LTV/CAC** y churn).  
2) Detectar **regiones** con mayor **potencial de crecimiento** y/o **riesgo**.  
3) Evaluar el desempeño por **tier** (Basic, Pro, Enterprise).  
4) Recomendar **asignación de presupuesto** por **canal + tier**.

---
## 📂 Instrucciones
- Trabaja únicamente con **filtros** y **agrupaciones**. **No uses** tablas dinámicas (pivot), merges ni gráficos.
- Archivo a usar: `clientes_marketing.csv`.
- Escribe **código + interpretación breve** para cada inciso.
- Si el enunciado dice **“Agrupa”**, usa `groupby`. Si dice **“Filtra”**, usa filtrado con máscaras booleanas. Si dice **“Ambas”**, realiza primero el **filtro** y luego la **agrupación**.

---


## Descargar Tabla (Correr una vez)

In [None]:
!wget https://github.com/javierherrera1996/IntroMarketingAnalytics/raw/refs/heads/main/PrimerCorte/cac_ltv_model.csv

--2025-09-17 23:43:48--  https://github.com/javierherrera1996/IntroMarketingAnalytics/raw/refs/heads/main/PrimerCorte/cac_ltv_model.csv
Resolving github.com (github.com)... 140.82.112.4
Connecting to github.com (github.com)|140.82.112.4|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/javierherrera1996/IntroMarketingAnalytics/refs/heads/main/PrimerCorte/cac_ltv_model.csv [following]
--2025-09-17 23:43:48--  https://raw.githubusercontent.com/javierherrera1996/IntroMarketingAnalytics/refs/heads/main/PrimerCorte/cac_ltv_model.csv
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.109.133, 185.199.111.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.109.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 661398 (646K) [text/plain]
Saving to: ‘cac_ltv_model.csv.2’


2025-09-17 23:43:48 (11.5 MB/s) - ‘cac_ltv_model.csv.2’ saved

## Importar Datos

In [None]:
import pandas as pd
pd.set_option('display.float_format', lambda x: f'{x:,.2f}')

# 1) Cargar dataset
data = pd.read_csv('cac_ltv_model.csv')


### ✅ Variables relevantes (recordatorio)
- `acquisition_channel`, `signup_source`, `region`, `customer_tier`
- `plan_price`, `discount_rate`, `arpu`, `gross_margin`, `churn_rate`
- `contract_length_months`, `marketing_spend`

### 🧮 Fórmulas de negocio (a usar en el examen)
- **CAC por canal**:  
    $$ CAC = \frac{\text{Total Marketing Spend}}{\text{Clientes adquiridos}} $$
  
- **LTV por observación** (aprox.):  
   $$ LTV = ARPU \times contract\_length\_months \times gross\_margin \times (1 - churn\_rate) $$

- **Unit economics**:  
  $$ LTV/CAC   $$(ideal \> 3 como regla general de SaaS)

---



### Parte Exploratoria: Cree una muestra de los primeros 5 elementos de esta tabla. ¿Cuantas observaciones tienes?

In [None]:
data = pd.read_csv('cac_ltv_model.csv')
print(data.head())
print(f"\nNumber of observations: {data.shape[0]}")

   year  month    date  customer_id acquisition_channel signup_source  \
0  2023      1  Jan-23         1001      outbound_sales           web   
1  2023      1  Jan-23         1002            meta_ads           web   
2  2023      1  Jan-23         1003      organic_search    mobile_app   
3  2023      1  Jan-23         1004      organic_search           web   
4  2023      1  Jan-23         1005      organic_search           web   

          region customer_tier  plan_price  discount_rate   arpu  \
0  North America         Basic       78.84           0.10  63.63   
1          LatAm           Pro      120.23           0.00 124.47   
2  North America    Enterprise      335.82           0.20 278.20   
3         Europe           Pro      193.89           0.10 190.65   
4           APAC    Enterprise      471.80           0.10 445.32   

   gross_margin  churn_rate  contract_length_months  marketing_spend  
0          0.76        0.02                      12           212.48  
1         

## 🔎 Parte A – Filtros

hint: Crea una tabla con el filtro y luego agrupa la variable que te piden.

1. **Filtra** los clientes del canal **`meta_ads`**. Calcula el **ARPU promedio** de este subconjunto.  



In [None]:
meta_ads_data = data[data['acquisition_channel'] == 'meta_ads']
meta_ads_arpu = meta_ads_data['arpu'].mean()
print(f"Average ARPU for 'meta_ads' customers: ${meta_ads_arpu:,.2f}")

Average ARPU for 'meta_ads' customers: $168.79


2. **Filtra** clientes de **LatAm** con **`churn_rate > 0.05`**. ¿Cuántos son? ¿Cuál es su **ARPU promedio**?  

In [None]:
latam_high_churn = data[(data['region'] == 'LatAm') & (data['churn_rate'] > 0.05)]
count_latam_high_churn = latam_high_churn.shape[0]
avg_arpu_latam_high_churn = latam_high_churn['arpu'].mean()
print(f"Number of LatAm customers with churn_rate > 0.05: {count_latam_high_churn}")
print(f"Average ARPU for this group: ${avg_arpu_latam_high_churn:,.2f}")

Number of LatAm customers with churn_rate > 0.05: 410
Average ARPU for this group: $174.78


3. **Filtra** clientes **Enterprise** con `contract_length_months > 6`. ¿Cuál es su **gross_margin promedio**?

In [None]:
enterprise_long_contract = data[(data['customer_tier'] == 'Enterprise') & (data['contract_length_months'] > 6)]
avg_gross_margin_enterprise_long = enterprise_long_contract['gross_margin'].mean()
print(f"Average gross_margin for Enterprise customers with contracts > 6 months: {avg_gross_margin_enterprise_long:.2%}")

Average gross_margin for Enterprise customers with contracts > 6 months: 82.48%


## 📊 Parte B – Agrupaciones (SOLO agrupar)
4. **Agrupa** por `acquisition_channel` y calcula **ARPU promedio**. Ordena de mayor a menor.  


In [None]:
arpu_by_channel = data.groupby('acquisition_channel')['arpu'].mean().sort_values(ascending=False)
print("Average ARPU by Acquisition Channel:")
print(arpu_by_channel)

Average ARPU by Acquisition Channel:
acquisition_channel
outbound_sales   173.61
google_ads       172.37
organic_search   171.14
meta_ads         168.79
Name: arpu, dtype: float64


5. **Agrupa** por `region` y calcula **churn_rate promedio**. Identifica la región con mayor churn.  



In [None]:
churn_by_region = data.groupby('region')['churn_rate'].mean().sort_values(ascending=False)
print("Average Churn Rate by Region:")
print(churn_by_region)
print(f"\nThe region with the highest churn rate is: {churn_by_region.index[0]}")

Average Churn Rate by Region:
region
Middle East     0.05
LatAm           0.05
North America   0.05
APAC            0.05
Europe          0.05
Africa          0.05
Name: churn_rate, dtype: float64

The region with the highest churn rate is: Middle East


6. **Agrupa** por `customer_tier` y calcula **marketing_spend total**. ¿Cuál tier consume más presupuesto?

In [None]:
marketing_spend_by_tier = data.groupby('customer_tier')['marketing_spend'].sum().sort_values(ascending=False)
print("Total Marketing Spend by Customer Tier:")
print(marketing_spend_by_tier)
print(f"\nThe tier that consumes the most budget is: {marketing_spend_by_tier.index[0]}")

Total Marketing Spend by Customer Tier:
customer_tier
Pro          589,265.04
Basic        584,419.11
Enterprise   584,348.87
Name: marketing_spend, dtype: float64

The tier that consumes the most budget is: Pro


## 🔀 Parte C – Filtro **y** Agrupación (Ambas)
7. **Filtra** solo registros de **`signup_source = 'web'`** y luego **agrupa** por `acquisition_channel` para obtener el **churn_rate promedio**.  


In [None]:
web_signups = data[data['signup_source'] == 'web']
web_churn_by_channel = web_signups.groupby('acquisition_channel')['churn_rate'].mean().sort_values(ascending=False)
print("Average Churn Rate for Web Signups by Acquisition Channel:")
print(web_churn_by_channel)

Average Churn Rate for Web Signups by Acquisition Channel:
acquisition_channel
google_ads       0.05
meta_ads         0.05
organic_search   0.05
outbound_sales   0.05
Name: churn_rate, dtype: float64


8. **Filtra** solo **`mobile_app`** y luego **agrupa** por `region` para calcular **ARPU promedio**.  


In [None]:
mobile_signups = data[data['signup_source'] == 'mobile_app']
mobile_arpu_by_region = mobile_signups.groupby('region')['arpu'].mean().sort_values(ascending=False)
print("Average ARPU for Mobile App Signups by Region:")
print(mobile_arpu_by_region)

Average ARPU for Mobile App Signups by Region:
region
North America   174.00
LatAm           173.20
Africa          172.60
Middle East     171.71
APAC            169.09
Europe          165.89
Name: arpu, dtype: float64


9. **Filtra** a clientes **`Pro`** y **agrupa** por `acquisition_channel` para calcular **marketing_spend total**.


In [None]:
pro_tier_data = data[data['customer_tier'] == 'Pro']
pro_spend_by_channel = pro_tier_data.groupby('acquisition_channel')['marketing_spend'].sum().sort_values(ascending=False)
print("Total Marketing Spend for Pro Tier Customers by Acquisition Channel:")
print(pro_spend_by_channel)

Total Marketing Spend for Pro Tier Customers by Acquisition Channel:
acquisition_channel
google_ads       226,721.68
meta_ads         211,517.60
outbound_sales   121,177.04
organic_search    29,848.72
Name: marketing_spend, dtype: float64


## 📈 Parte D – Métricas de negocio (CAC, LTV, LTV/CAC)
10. **CAC por canal (Agrupa)**: calcula el CAC de cada `acquisition_channel` como:  
   `CAC = marketing_spend_total_del_canal / #clientes_del_canal`  


In [None]:
channel_spend = data.groupby('acquisition_channel')['marketing_spend'].sum()
channel_customers = data.groupby('acquisition_channel').size()
cac_by_channel = channel_spend / channel_customers
print("CAC by Acquisition Channel:")
print(cac_by_channel.sort_values())

CAC by Acquisition Channel:
acquisition_channel
organic_search    49.95
outbound_sales   200.22
meta_ads         349.27
google_ads       401.02
dtype: float64


11. **CAC por tier (Agrupa)**: calcula el CAC de cada `customer_tier` como:  
   `CAC = marketing_spend_total_del_tier / #clientes_del_canal`  


In [None]:
tier_spend = data.groupby('customer_tier')['marketing_spend'].sum()
tier_customers = data.groupby('customer_tier').size()
cac_by_tier = tier_spend / tier_customers
print("CAC by Customer Tier:")
print(cac_by_tier.sort_values())

CAC by Customer Tier:
customer_tier
Pro          248.43
Enterprise   249.19
Basic        249.75
dtype: float64


12. **LTV por tier (Ambas)**: crea una columna `ltv_individual` con la fórmula dada.


In [None]:
data['ltv_individual'] = data['arpu'] * data['contract_length_months'] * data['gross_margin'] * (1 - data['churn_rate'])

12. A. Luego **agrupa** `ltv_individual` por
`acquisition_channel` para obtener el **LTV promedio**.  

In [None]:
ltv_by_channel = data.groupby('acquisition_channel')['ltv_individual'].mean().sort_values(ascending=False)
print("Average LTV by Acquisition Channel:")
print(ltv_by_channel)

Average LTV by Acquisition Channel:
acquisition_channel
organic_search   765.13
outbound_sales   751.57
meta_ads         729.05
google_ads       710.25
Name: ltv_individual, dtype: float64


12. B. Luego **agrupa** `ltv_individual`por `customer_tier` para obtener el **LTV promedio**.





In [None]:
ltv_by_tier = data.groupby('customer_tier')['ltv_individual'].mean().sort_values(ascending=False)
print("Average LTV by Customer Tier:")
print(ltv_by_tier)

Average LTV by Customer Tier:
customer_tier
Enterprise   1,349.02
Pro            577.63
Basic          291.77
Name: ltv_individual, dtype: float64


13. **Unit economics (Ambas)**: combina tus resultados para comparar **LTV promedio por tier** contra **CAC por canal** y comenta **qué combinaciones canal + tier** lucen más saludables (busca **LTV/CAC > 3**).


In [None]:
ltv_by_tier_calc = data.groupby('customer_tier')['ltv_individual'].mean()

print("Unit Economics (LTV/CAC) Analysis:")
print(f"LTV (Enterprise): ${ltv_by_tier_calc['Enterprise']:,.2f} vs. CAC (Organic Search): ${cac_by_channel['organic_search']:,.2f}. Ratio: {ltv_by_tier_calc['Enterprise'] / cac_by_channel['organic_search']:.2f}")
print(f"LTV (Enterprise): ${ltv_by_tier_calc['Enterprise']:,.2f} vs. CAC (Outbound Sales): ${cac_by_channel['outbound_sales']:,.2f}. Ratio: {ltv_by_tier_calc['Enterprise'] / cac_by_channel['outbound_sales']:.2f}")
print(f"LTV (Pro): ${ltv_by_tier_calc['Pro']:,.2f} vs. CAC (Google Ads): ${cac_by_channel['google_ads']:,.2f}. Ratio: {ltv_by_tier_calc['Pro'] / cac_by_channel['google_ads']:.2f}")
print(f"LTV (Basic): ${ltv_by_tier_calc['Basic']:,.2f} vs. CAC (Meta Ads): ${cac_by_channel['meta_ads']:,.2f}. Ratio: {ltv_by_tier_calc['Basic'] / cac_by_channel['meta_ads']:.2f}")

Unit Economics (LTV/CAC) Analysis:
LTV (Enterprise): $1,349.02 vs. CAC (Organic Search): $49.95. Ratio: 27.01
LTV (Enterprise): $1,349.02 vs. CAC (Outbound Sales): $200.22. Ratio: 6.74
LTV (Pro): $577.63 vs. CAC (Google Ads): $401.02. Ratio: 1.44
LTV (Basic): $291.77 vs. CAC (Meta Ads): $349.27. Ratio: 0.84


## 🧠 Parte E – Análisis crítico (respuesta abierta)
13. **CMO por un día**: con tus resultados, ¿en qué **canal(es)** invertirías más el próximo trimestre? ¿Por qué? (Cita **CAC** y **churn**).  
14. ¿Qué **región** ves con mayor riesgo? ¿Qué hipótesis explicarían su **churn**?  
15. Identifica **dos combinaciones canal + tier** con mejor **LTV/CAC** y propón **dos acciones** concretas de optimización (p. ej., creatividades, audiencias, pricing, retención).

---
✍️ **Nota**: Mantente disciplinado con el enunciado (**Filtra**, **Agrupa**, **Ambas**). La evaluación pondera **correctitud técnica** y **calidad de interpretación de negocio**.


13.: Si yo fuera CMO por un día invertiría en google adds y organic search. Organic search por el hecho de que tiene el CAC más bajo lo que indica que la tasa de adquisisión de clientes es muy eficiente, por lo mismo la tasa de abandono al ser tan baja, solo de un poco mas de dos porciento, hace que sea ideal invertir ahí. y en google adds esto ya que aunque el CAC es un poco más alto la tasa de abandono sigue sin superar el 3 porciento lo que hace que siga siendo una opción bastante buena para invertir.


14.: Para empezar latinoamérica es el mayor riesgo ya que tienen una tasa de abandono más alta que el resto, superior a un 3 porciento.
HIPOTESIS: mi hipotesis se basa principalmente en dos factores. El primero es la gran inestabilidad económica de los paises latinos lo que puede ser gran causante de buscar reducir costos ocasionando las cancelaciones. y el segundo factor es la atención al cliente, ya que al no ser un producto creado especificamente para el público latino y nunca ser el mercado principal puede que hayan falencias de atención las cuelaes ocasionan la perdida.


15.: google adds + pro
Acción 1 (precios): Probar un precio ligeramente más alto para el Pronivel desde google ads para obtener más valor por cliente, dada la alta rentabilidad de la relación LTV/CAC. Esto se puede lograr mediante pruebas A/B en páginas de destino.
Acción 2 (Audiencia): Refina la segmentación de google ads para enfocarte en audiencias similares que se asemejen a los clientes actuales de alto valor Pro, en lugar de solo palabras clave generales. Esto atraerá usuarios rentables similares y optimizará la inversión publicitaria.