# 📊 Parcial – Análisis de Redes Sociales (Primer Corte)

## 🎯 Objetivo
Evaluar tu dominio de **filtros** y **agrupaciones** en Python (sin pivots ni gráficos) y tu capacidad de **análisis de negocio** en métricas de marketing: **CAC, LTV, churn rate, funnel, unit economics (LTV/CAC)**.

---
## 🧩 Contexto de Negocio (Caso Real)
**StartUp SaaS en crecimiento.** Vende planes **Basic, Pro, Enterprise** en **LatAm, North America, Europe, APAC**. Los canales de adquisición son: **meta_ads, google_ads, organic_search, outbound_sales**. Los usuarios se registran por **web** o **mobile_app**.

La dirección quiere decidir **dónde invertir el presupuesto del próximo trimestre**. Te piden:

1) Identificar **canales más rentables** (relación **LTV/CAC** y churn).  
2) Detectar **regiones** con mayor **potencial de crecimiento** y/o **riesgo**.  
3) Evaluar el desempeño por **tier** (Basic, Pro, Enterprise).  
4) Recomendar **asignación de presupuesto** por **canal + tier**.

---
## 📂 Instrucciones
- Trabaja únicamente con **filtros** y **agrupaciones**. **No uses** tablas dinámicas (pivot), merges ni gráficos.
- Archivo a usar: `clientes_marketing.csv`.
- Escribe **código + interpretación breve** para cada inciso.
- Si el enunciado dice **“Agrupa”**, usa `groupby`. Si dice **“Filtra”**, usa filtrado con máscaras booleanas. Si dice **“Ambas”**, realiza primero el **filtro** y luego la **agrupación**.

---


## Descargar Tabla (Correr una vez)

In [1]:
!wget https://github.com/javierherrera1996/IntroMarketingAnalytics/raw/refs/heads/main/PrimerCorte/cac_ltv_model.csv

--2025-09-17 23:44:53--  https://github.com/javierherrera1996/IntroMarketingAnalytics/raw/refs/heads/main/PrimerCorte/cac_ltv_model.csv
Resolving github.com (github.com)... 20.27.177.113
Connecting to github.com (github.com)|20.27.177.113|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/javierherrera1996/IntroMarketingAnalytics/refs/heads/main/PrimerCorte/cac_ltv_model.csv [following]
--2025-09-17 23:44:53--  https://raw.githubusercontent.com/javierherrera1996/IntroMarketingAnalytics/refs/heads/main/PrimerCorte/cac_ltv_model.csv
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.111.133, 185.199.108.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.111.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 661398 (646K) [text/plain]
Saving to: ‘cac_ltv_model.csv’


2025-09-17 23:44:54 (2.66 MB/s) - ‘cac_ltv_model.csv’ saved [

## Importar Datos

In [13]:
import pandas as pd
pd.set_option('display.float_format', lambda x: f'{x:,.2f}')

# 1) Cargar dataset
df = pd.read_csv('cac_ltv_model.csv')


### ✅ Variables relevantes (recordatorio)
- `acquisition_channel`, `signup_source`, `region`, `customer_tier`
- `plan_price`, `discount_rate`, `arpu`, `gross_margin`, `churn_rate`
- `contract_length_months`, `marketing_spend`

### 🧮 Fórmulas de negocio (a usar en el examen)
- **CAC por canal**:  
    $$ CAC = \frac{\text{Total Marketing Spend}}{\text{Clientes adquiridos}} $$
  
- **LTV por observación** (aprox.):  
   $$ LTV = ARPU \times contract\_length\_months \times gross\_margin \times (1 - churn\_rate) $$

- **Unit economics**:  
  $$ LTV/CAC   $$(ideal \> 3 como regla general de SaaS)

---



### Parte Exploratoria: Cree una muestra de los primeros 5 elementos de esta tabla. ¿Cuantas observaciones tienes?

In [16]:
df.head(6)

Unnamed: 0,year,month,date,customer_id,acquisition_channel,signup_source,region,customer_tier,plan_price,discount_rate,arpu,gross_margin,churn_rate,contract_length_months,marketing_spend
0,2023,1,Jan-23,1001,outbound_sales,web,North America,Basic,78.84,0.1,63.63,0.76,0.02,12,212.48
1,2023,1,Jan-23,1002,meta_ads,web,LatAm,Pro,120.23,0.0,124.47,0.84,0.05,1,352.6
2,2023,1,Jan-23,1003,organic_search,mobile_app,North America,Enterprise,335.82,0.2,278.2,0.81,0.02,12,55.4
3,2023,1,Jan-23,1004,organic_search,web,Europe,Pro,193.89,0.1,190.65,0.8,0.08,1,49.1
4,2023,1,Jan-23,1005,organic_search,web,APAC,Enterprise,471.8,0.1,445.32,0.8,0.08,1,45.27
5,2023,1,Jan-23,1006,organic_search,mobile_app,APAC,Pro,138.52,0.1,133.17,0.8,0.08,1,56.92


## 🔎 Parte A – Filtros

hint: Crea una tabla con el filtro y luego agrupa la variable que te piden.

1. **Filtra** los clientes del canal **`meta_ads`**. Calcula el **ARPU promedio** de este subconjunto.  



In [31]:
dfmeta=df[df['acquisition_channel']=='meta_ads']
dfmeta['arpu'].mean()

np.float64(168.78858272162617)

2. **Filtra** clientes de **LatAm** con **`churn_rate > 0.05`**. ¿Cuántos son? ¿Cuál es su **ARPU promedio**?  

In [32]:
dfclientes=df[(df['region']=='LatAm') & (df['churn_rate']>0.05)]
dfclientes['arpu'].mean()

np.float64(174.78453658536586)

3. **Filtra** clientes **Enterprise** con `contract_length_months > 6`. ¿Cuál es su **gross_margin promedio**?

In [34]:
dfenterprise=df[(df['customer_tier']=='Enterprise') & (df['contract_length_months']>6)]
dfenterprise['gross_margin'].mean()

np.float64(0.8248397435897435)

## 📊 Parte B – Agrupaciones (SOLO agrupar)
4. **Agrupa** por `acquisition_channel` y calcula **ARPU promedio**. Ordena de mayor a menor.  


In [44]:
groupbyAC=df.groupby('acquisition_channel')
groupbyAC['arpu'].mean().sort_values(ascending=False)

Unnamed: 0_level_0,arpu
acquisition_channel,Unnamed: 1_level_1
outbound_sales,173.61
google_ads,172.37
organic_search,171.14
meta_ads,168.79


5. **Agrupa** por `region` y calcula **churn_rate promedio**. Identifica la región con mayor churn.  



In [47]:
groupbyRE=df.groupby('region')
groupbyRE['churn_rate'].mean().sort_values(ascending=False)

Unnamed: 0_level_0,churn_rate
region,Unnamed: 1_level_1
Middle East,0.05
LatAm,0.05
North America,0.05
APAC,0.05
Europe,0.05
Africa,0.05


6. **Agrupa** por `customer_tier` y calcula **marketing_spend total**. ¿Cuál tier consume más presupuesto?

In [48]:
groupbyCT=df.groupby('customer_tier')
groupbyCT['marketing_spend'].sum().sort_values(ascending=False)

Unnamed: 0_level_0,marketing_spend
customer_tier,Unnamed: 1_level_1
Pro,589265.04
Basic,584419.11
Enterprise,584348.87


## 🔀 Parte C – Filtro **y** Agrupación (Ambas)
7. **Filtra** solo registros de **`signup_source = 'web'`** y luego **agrupa** por `acquisition_channel` para obtener el **churn_rate promedio**.  


In [49]:
CHPromedio=df[df['signup_source']=='web'].groupby('acquisition_channel')['churn_rate'].mean()
CHPromedio

Unnamed: 0_level_0,churn_rate
acquisition_channel,Unnamed: 1_level_1
google_ads,0.05
meta_ads,0.05
organic_search,0.05
outbound_sales,0.05


8. **Filtra** solo **`mobile_app`** y luego **agrupa** por `region` para calcular **ARPU promedio**.  


In [50]:
Arpupromedio=df[df['signup_source']=='mobile_app'].groupby('region')['arpu'].mean()
Arpupromedio

Unnamed: 0_level_0,arpu
region,Unnamed: 1_level_1
APAC,169.09
Africa,172.6
Europe,165.89
LatAm,173.2
Middle East,171.71
North America,174.0


9. **Filtra** a clientes **`Pro`** y **agrupa** por `acquisition_channel` para calcular **marketing_spend total**.


In [51]:
mstotal=df[df['customer_tier']=='Pro'].groupby('acquisition_channel')['marketing_spend'].sum()
mstotal

Unnamed: 0_level_0,marketing_spend
acquisition_channel,Unnamed: 1_level_1
google_ads,226721.68
meta_ads,211517.6
organic_search,29848.72
outbound_sales,121177.04


## 📈 Parte D – Métricas de negocio (CAC, LTV, LTV/CAC)
10. **CAC por canal (Agrupa)**: calcula el CAC de cada `acquisition_channel` como:  
   `CAC = marketing_spend_total_del_canal / #clientes_del_canal`  


In [90]:
CAC_Por_Canal=df.groupby('acquisition_channel')['marketing_spend'].sum()/df.groupby('acquisition_channel')['customer_id'].count().sort_values(ascending=False)
CAC_Por_Canal

Unnamed: 0_level_0,0
acquisition_channel,Unnamed: 1_level_1
google_ads,401.02
meta_ads,349.27
organic_search,49.95
outbound_sales,200.22


11. **CAC por tier (Agrupa)**: calcula el CAC de cada `customer_tier` como:  
   `CAC = marketing_spend_total_del_tier / #clientes_del_canal`  


In [53]:
CAC_POR_TIER=df.groupby('customer_tier')['marketing_spend'].sum()/df.groupby('customer_tier')['customer_id'].count()
CAC_POR_TIER

Unnamed: 0_level_0,0
customer_tier,Unnamed: 1_level_1
Basic,249.75
Enterprise,249.19
Pro,248.43


12. **LTV por tier (Ambas)**: crea una columna `ltv_individual` con la fórmula dada.


In [60]:
df['ltv_individual'] = df['arpu'] * df['contract_length_months'] * df['gross_margin'] * (1 - df['churn_rate'])
df.head()

Unnamed: 0,year,month,date,customer_id,acquisition_channel,signup_source,region,customer_tier,plan_price,discount_rate,arpu,gross_margin,churn_rate,contract_length_months,marketing_spend,ltv_individual
0,2023,1,Jan-23,1001,outbound_sales,web,North America,Basic,78.84,0.1,63.63,0.76,0.02,12,212.48,567.54
1,2023,1,Jan-23,1002,meta_ads,web,LatAm,Pro,120.23,0.0,124.47,0.84,0.05,1,352.6,99.2
2,2023,1,Jan-23,1003,organic_search,mobile_app,North America,Enterprise,335.82,0.2,278.2,0.81,0.02,12,55.4,2651.91
3,2023,1,Jan-23,1004,organic_search,web,Europe,Pro,193.89,0.1,190.65,0.8,0.08,1,49.1,139.68
4,2023,1,Jan-23,1005,organic_search,web,APAC,Enterprise,471.8,0.1,445.32,0.8,0.08,1,45.27,328.72


12. A. Luego **agrupa** `ltv_individual` por
`acquisition_channel` para obtener el **LTV promedio**.  

In [61]:
groupbyLTVPromAChannel=df.groupby('acquisition_channel')['ltv_individual'].mean()
groupbyLTVPromAChannel

Unnamed: 0_level_0,ltv_individual
acquisition_channel,Unnamed: 1_level_1
google_ads,710.25
meta_ads,729.05
organic_search,765.13
outbound_sales,751.57


12. B. Luego **agrupa** `ltv_individual`por `customer_tier` para obtener el **LTV promedio**.





In [78]:
groupbyLTVPromCT= df.groupby('customer_tier')['ltv_individual'].mean()
groupbyLTVPromCT

Unnamed: 0_level_0,ltv_individual
customer_tier,Unnamed: 1_level_1
Basic,291.77
Enterprise,1349.02
Pro,577.63


13. **Unit economics (Ambas)**: combina tus resultados para comparar **LTV promedio por tier** contra **CAC por canal** y comenta **qué combinaciones canal + tier** lucen más saludables (busca **LTV/CAC > 3**).


In [89]:
UE=groupbyLTVPromAChannel/CAC_Por_Canal
UE

Unnamed: 0_level_0,0
acquisition_channel,Unnamed: 1_level_1
google_ads,1.77
meta_ads,2.09
organic_search,15.32
outbound_sales,3.75


***Las combinaciones Canal + Tier que resultan más saludables corresponden Oubound_Sales y Organic_Search***

## 🧠 Parte E – Análisis crítico (respuesta abierta)
13. **CMO por un día**: con tus resultados, ¿en qué **canal(es)** invertirías más el próximo trimestre? ¿Por qué? (Cita **CAC** y **churn**).  
14. ¿Qué **región** ves con mayor riesgo? ¿Qué hipótesis explicarían su **churn**?  
15. Identifica **dos combinaciones canal + tier** con mejor **LTV/CAC** y propón **dos acciones** concretas de optimización (p. ej., creatividades, audiencias, pricing, retención).

---
✍️ **Nota**: Mantente disciplinado con el enunciado (**Filtra**, **Agrupa**, **Ambas**). La evaluación pondera **correctitud técnica** y **calidad de interpretación de negocio**.


13. Teniendo en cuenta que el Churn es igual en todos los canales, la decisión más estrategica sería invertir organic_search y outbound_sales. Debido a que son los canales que más rentabilidad me generan en el tiempo y en las que menos inversión tengo que hacer para convertir.

14. Todas las regiones tienen en promedio el mismo Churn, por lo que, a partir de la data evaluada no hay una región con mayor riesgo que otra. Esto a partir de las variables consideradas.

***Primera Combinación***
1. Organic_Search: Una acción que nos puede ayudar a optimizar este canal es generar contenido de valor para el usuario, escribiendolo con términos que nos ayuden a lograr un buen SEO sin pauta. La segunda puede ser incentivar la creación de contenido UGC incentivando a nuestros clientes a compartir su experiencia con una dinámica creada en nuestras redes sociales que puede incluir un premio.

***Segunda Combinación***
2. Outbound_Sales: Una acción que me puede ayudar a optimizar este canal puede ser ofrecer un valor agregado por cada compra realizada de un tier especifico dentro de un punto de venta. Esto con el objetivo de que el cliente pueda encontrar un incentivo para ir al punto de venta y no adquirir nuestro servicio desde el .com. Otra acción que puede funcionar es generar puntos de activación de acuerdo a las campañas vigentes o estacionalidad en la que se encuentre el punto de venta. Esta iniciativa nos puede ayudar a incentivar el tráfico y también nos puede ayudar a nutrir el contenido organico que puede contribuir a la optimización de nuestro Organica_Search.