# üìä Parcial ‚Äì An√°lisis de Redes Sociales (Primer Corte)

## üéØ Objetivo
Evaluar tu dominio de **filtros** y **agrupaciones** en Python (sin pivots ni gr√°ficos) y tu capacidad de **an√°lisis de negocio** en m√©tricas de marketing: **CAC, LTV, churn rate, funnel, unit economics (LTV/CAC)**.

---
## üß© Contexto de Negocio (Caso Real)
**StartUp SaaS en crecimiento.** Vende planes **Basic, Pro, Enterprise** en **LatAm, North America, Europe, APAC**. Los canales de adquisici√≥n son: **meta_ads, google_ads, organic_search, outbound_sales**. Los usuarios se registran por **web** o **mobile_app**.

La direcci√≥n quiere decidir **d√≥nde invertir el presupuesto del pr√≥ximo trimestre**. Te piden:

1) Identificar **canales m√°s rentables** (relaci√≥n **LTV/CAC** y churn).  
2) Detectar **regiones** con mayor **potencial de crecimiento** y/o **riesgo**.  
3) Evaluar el desempe√±o por **tier** (Basic, Pro, Enterprise).  
4) Recomendar **asignaci√≥n de presupuesto** por **canal + tier**.

---
## üìÇ Instrucciones
- Trabaja √∫nicamente con **filtros** y **agrupaciones**. **No uses** tablas din√°micas (pivot), merges ni gr√°ficos.
- Archivo a usar: `clientes_marketing.csv`.
- Escribe **c√≥digo + interpretaci√≥n breve** para cada inciso.
- Si el enunciado dice **‚ÄúAgrupa‚Äù**, usa `groupby`. Si dice **‚ÄúFiltra‚Äù**, usa filtrado con m√°scaras booleanas. Si dice **‚ÄúAmbas‚Äù**, realiza primero el **filtro** y luego la **agrupaci√≥n**.

---


## Descargar Tabla (Correr una vez)

In [1]:
!wget https://github.com/javierherrera1996/IntroMarketingAnalytics/raw/refs/heads/main/PrimerCorte/cac_ltv_model.csv

--2025-09-17 23:22:30--  https://github.com/javierherrera1996/IntroMarketingAnalytics/raw/refs/heads/main/PrimerCorte/cac_ltv_model.csv
Resolving github.com (github.com)... 140.82.112.3
Connecting to github.com (github.com)|140.82.112.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/javierherrera1996/IntroMarketingAnalytics/refs/heads/main/PrimerCorte/cac_ltv_model.csv [following]
--2025-09-17 23:22:30--  https://raw.githubusercontent.com/javierherrera1996/IntroMarketingAnalytics/refs/heads/main/PrimerCorte/cac_ltv_model.csv
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 661398 (646K) [text/plain]
Saving to: ‚Äòcac_ltv_model.csv‚Äô


2025-09-17 23:22:30 (11.2 MB/s) - ‚Äòcac_ltv_model.csv‚Äô s

## Importar Datos

In [2]:
import pandas as pd
pd.set_option('display.float_format', lambda x: f'{x:,.2f}')

# 1) Cargar dataset
data = pd.read_csv('cac_ltv_model.csv')


### ‚úÖ Variables relevantes (recordatorio)
- `acquisition_channel`, `signup_source`, `region`, `customer_tier`
- `plan_price`, `discount_rate`, `arpu`, `gross_margin`, `churn_rate`
- `contract_length_months`, `marketing_spend`

### üßÆ F√≥rmulas de negocio (a usar en el examen)
- **CAC por canal**:  
    $$ CAC = \frac{\text{Total Marketing Spend}}{\text{Clientes adquiridos}} $$
  
- **LTV por observaci√≥n** (aprox.):  
   $$ LTV = ARPU \times contract\_length\_months \times gross\_margin \times (1 - churn\_rate) $$

- **Unit economics**:  
  $$ LTV/CAC   $$(ideal \> 3 como regla general de SaaS)

---



### Parte Exploratoria: Cree una muestra de los primeros 5 elementos de esta tabla. ¬øCuantas observaciones tienes?

In [5]:
data.head()

Unnamed: 0,year,month,date,customer_id,acquisition_channel,signup_source,region,customer_tier,plan_price,discount_rate,arpu,gross_margin,churn_rate,contract_length_months,marketing_spend
0,2023,1,Jan-23,1001,outbound_sales,web,North America,Basic,78.84,0.1,63.63,0.76,0.02,12,212.48
1,2023,1,Jan-23,1002,meta_ads,web,LatAm,Pro,120.23,0.0,124.47,0.84,0.05,1,352.6
2,2023,1,Jan-23,1003,organic_search,mobile_app,North America,Enterprise,335.82,0.2,278.2,0.81,0.02,12,55.4
3,2023,1,Jan-23,1004,organic_search,web,Europe,Pro,193.89,0.1,190.65,0.8,0.08,1,49.1
4,2023,1,Jan-23,1005,organic_search,web,APAC,Enterprise,471.8,0.1,445.32,0.8,0.08,1,45.27


## üîé Parte A ‚Äì Filtros

hint: Crea una tabla con el filtro y luego agrupa la variable que te piden.

1. **Filtra** los clientes del canal **`meta_ads`**. Calcula el **ARPU promedio** de este subconjunto.  



In [6]:
data[data['acquisition_channel'] == 'meta_ads']['arpu'].mean()

np.float64(168.78858272162617)

2. **Filtra** clientes de **LatAm** con **`churn_rate > 0.05`**. ¬øCu√°ntos son? ¬øCu√°l es su **ARPU promedio**?  

In [10]:
data[(data['region'] == 'LatAm') & (data['churn_rate'] > 0.05)].shape[0]

410

In [11]:
data[(data['region'] == 'LatAm') & (data['churn_rate'] > 0.05)]['arpu'].mean()

np.float64(174.78453658536586)

3. **Filtra** clientes **Enterprise** con `contract_length_months > 6`. ¬øCu√°l es su **gross_margin promedio**?

In [9]:
data[(data['customer_tier'] == 'Enterprise') & (data['contract_length_months'] > 6)]['gross_margin'].mean()

np.float64(0.8248397435897435)

## üìä Parte B ‚Äì Agrupaciones (SOLO agrupar)
4. **Agrupa** por `acquisition_channel` y calcula **ARPU promedio**. Ordena de mayor a menor.  


In [12]:
data.groupby('acquisition_channel')['arpu'].mean().sort_values(ascending=False)

Unnamed: 0_level_0,arpu
acquisition_channel,Unnamed: 1_level_1
outbound_sales,173.61
google_ads,172.37
organic_search,171.14
meta_ads,168.79


5. **Agrupa** por `region` y calcula **churn_rate promedio**. Identifica la regi√≥n con mayor churn.  



In [13]:
data.groupby('region')['churn_rate'].mean().sort_values(ascending=False)

Unnamed: 0_level_0,churn_rate
region,Unnamed: 1_level_1
Middle East,0.05
LatAm,0.05
North America,0.05
APAC,0.05
Europe,0.05
Africa,0.05


6. **Agrupa** por `customer_tier` y calcula **marketing_spend total**. ¬øCu√°l tier consume m√°s presupuesto?

In [14]:
data.groupby('customer_tier')['marketing_spend'].sum().sort_values(ascending=False)

Unnamed: 0_level_0,marketing_spend
customer_tier,Unnamed: 1_level_1
Pro,589265.04
Basic,584419.11
Enterprise,584348.87


## üîÄ Parte C ‚Äì Filtro **y** Agrupaci√≥n (Ambas)
7. **Filtra** solo registros de **`signup_source = 'web'`** y luego **agrupa** por `acquisition_channel` para obtener el **churn_rate promedio**.  


In [15]:
data[data['signup_source'] == 'web'].groupby('acquisition_channel')['churn_rate'].mean()

Unnamed: 0_level_0,churn_rate
acquisition_channel,Unnamed: 1_level_1
google_ads,0.05
meta_ads,0.05
organic_search,0.05
outbound_sales,0.05


8. **Filtra** solo **`mobile_app`** y luego **agrupa** por `region` para calcular **ARPU promedio**.  


In [16]:
data[data['signup_source'] == 'mobile_app'].groupby('region')['arpu'].mean()

Unnamed: 0_level_0,arpu
region,Unnamed: 1_level_1
APAC,169.09
Africa,172.6
Europe,165.89
LatAm,173.2
Middle East,171.71
North America,174.0


9. **Filtra** a clientes **`Pro`** y **agrupa** por `acquisition_channel` para calcular **marketing_spend total**.


In [17]:
data[data['customer_tier'] == 'Pro'].groupby('acquisition_channel')['marketing_spend'].sum()

Unnamed: 0_level_0,marketing_spend
acquisition_channel,Unnamed: 1_level_1
google_ads,226721.68
meta_ads,211517.6
organic_search,29848.72
outbound_sales,121177.04


## üìà Parte D ‚Äì M√©tricas de negocio (CAC, LTV, LTV/CAC)
10. **CAC por canal (Agrupa)**: calcula el CAC de cada `acquisition_channel` como:  
   `CAC = marketing_spend_total_del_canal / #clientes_del_canal`  


In [18]:
data.groupby('acquisition_channel')['marketing_spend'].sum() / data.groupby('acquisition_channel')['marketing_spend'].count()

Unnamed: 0_level_0,marketing_spend
acquisition_channel,Unnamed: 1_level_1
google_ads,401.02
meta_ads,349.27
organic_search,49.95
outbound_sales,200.22


11. **CAC por tier (Agrupa)**: calcula el CAC de cada `customer_tier` como:  
   `CAC = marketing_spend_total_del_tier / #clientes_del_canal`  


In [19]:
data['LTV'] = data['arpu'] * data['contract_length_months'] * data['gross_margin'] * (1 - data['churn_rate'])
data['LTV'].head()

Unnamed: 0,LTV
0,567.54
1,99.2
2,2651.91
3,139.68
4,328.72


12. **LTV por tier (Ambas)**: crea una columna `ltv_individual` con la f√≥rmula dada.


In [20]:
data.groupby('acquisition_channel')['LTV'].mean()

Unnamed: 0_level_0,LTV
acquisition_channel,Unnamed: 1_level_1
google_ads,710.25
meta_ads,729.05
organic_search,765.13
outbound_sales,751.57


12. A. Luego **agrupa** `ltv_individual` por
`acquisition_channel` para obtener el **LTV promedio**.  

In [21]:
data['ltv_individual'] = data['arpu'] * data['contract_length_months'] * data['gross_margin'] * (1 - data['churn_rate'])

ltv_promedio_por_canal = data.groupby('acquisition_channel')['ltv_individual'].mean().sort_values(ascending=False)
ltv_promedio_por_canal

Unnamed: 0_level_0,ltv_individual
acquisition_channel,Unnamed: 1_level_1
organic_search,765.13
outbound_sales,751.57
meta_ads,729.05
google_ads,710.25


12. B. Luego **agrupa** `ltv_individual`por `customer_tier` para obtener el **LTV promedio**.





In [22]:
ltv_promedio_por_tier = data.groupby('customer_tier')['ltv_individual'].mean().sort_values(ascending=False)
ltv_promedio_por_tier

Unnamed: 0_level_0,ltv_individual
customer_tier,Unnamed: 1_level_1
Enterprise,1349.02
Pro,577.63
Basic,291.77


13. **Unit economics (Ambas)**: combina tus resultados para comparar **LTV promedio por tier** contra **CAC por canal** y comenta **qu√© combinaciones canal + tier** lucen m√°s saludables (busca **LTV/CAC > 3**).


In [23]:
ltv = data.groupby('acquisition_channel')['LTV'].mean()
cac = data.groupby('acquisition_channel')['marketing_spend'].sum() / data.groupby('acquisition_channel')['marketing_spend'].count()
ltv / cac

Unnamed: 0_level_0,0
acquisition_channel,Unnamed: 1_level_1
google_ads,1.77
meta_ads,2.09
organic_search,15.32
outbound_sales,3.75


## üß† Parte E ‚Äì An√°lisis cr√≠tico (respuesta abierta)
13. **CMO por un d√≠a**: con tus resultados, ¬øen qu√© **canal(es)** invertir√≠as m√°s el pr√≥ximo trimestre? ¬øPor qu√©? (Cita **CAC** y **churn**).  
14. ¬øQu√© **regi√≥n** ves con mayor riesgo? ¬øQu√© hip√≥tesis explicar√≠an su **churn**?  
15. Identifica **dos combinaciones canal + tier** con mejor **LTV/CAC** y prop√≥n **dos acciones** concretas de optimizaci√≥n (p. ej., creatividades, audiencias, pricing, retenci√≥n).

---
‚úçÔ∏è **Nota**: Mantente disciplinado con el enunciado (**Filtra**, **Agrupa**, **Ambas**). La evaluaci√≥n pondera **correctitud t√©cnica** y **calidad de interpretaci√≥n de negocio**.


**RESPUESTAS**

**13.** *CMO por un d√≠a: con tus resultados, ¬øen qu√© canal(es) invertir√≠as m√°s el pr√≥ximo trimestre? ¬øPor qu√©? (Cita CAC y churn).*

La elecci√≥n del canal depende del objetivo a alcanzar. Con Google Ads se obtuvo un menor n√∫mero de clientes, pero con un perfil ‚ÄúPro‚Äù que aporta m√°s valor. Por otro lado, si la meta es generar volumen de clientes, la estrategia m√°s conveniente ser√≠a invertir en la B√∫squeda Org√°nica, ya que all√≠ se obtuvo la mayor captaci√≥n.

**14.** *¬øQu√© regi√≥n ves con mayor riesgo? ¬øQu√© hip√≥tesis explicar√≠an su churn?*

Todas las regiones muestran un riesgo bajo y similar, por lo que mantendr√≠a la inversi√≥n en cada una. Pero, pondr√≠a mayor √©nfasis en la regi√≥n que atrae clientes ‚ÄúEnterprise‚Äù, dado que no implica un riesgo adicional y s√≠ un mayor beneficio estrat√©gico.

**15.** *Identifica dos combinaciones canal + tier con mejor LTV/CAC y prop√≥n dos acciones concretas de optimizaci√≥n (p. ej., creatividades, audiencias, pricing, retenci√≥n).*

Mi propuesta ser√≠a asignar m√°s presupuesto a los canales con mejor LTV/CAC, ya que esos son los m√°s rentables. Tambi√©n deber√≠a dirigirse inversi√≥n a las regiones con menor churn y mayor ARPU, ya que los clientes en esas regiones son m√°s estables y rentables a largo plazo. Adem√°s, reducir√≠a la inversi√≥n en canales con bajo LTV/CAC o que tienen churn alto, de esta manera, se maximiza la rentabilidad de la inversi√≥n en marketing.