# Sprint 4: Analizando Journeys de usuario con SQL


## ü•Ö **Objetivo de la sesi√≥n**
Comprender c√≥mo modelar, medir y analizar el recorrido del usuario (*user journey*) dentro de un producto digital usando SQL.  
Al finalizar, los estudiantes podr√°n:
- Identificar y estructurar un **journey** en etapas claras.  
- Medir conversi√≥n, abandono y tiempos con SQL.  
- Crear tablas derivadas para journeys usando consultas SQL b√°sicas.  
- Construir embudos (funnels) y segmentaciones.  
- Introducir y aplicar **CTEs (Common Table Expressions)** para journeys complejos.

---

## üóÇÔ∏è **Agenda de la sesi√≥n**

### **1. Introducci√≥n al User Journey (Teor√≠a)**
- ¬øQu√© es un *user journey*?  
- Diferencias entre **macro-journey** y **micro-journey**.  
- Dimensiones clave de an√°lisis: usuario, sesi√≥n, evento.  
- M√©tricas fundamentales: conversi√≥n, drop-off, tiempo en etapa y volumen.  
- Ejemplos en e-commerce, educaci√≥n online y salud.

---

# üìä Resumen para clase: *User Journey, Funnels y M√©tricas Clave*

---

## üß≠ ¬øQu√© es un *User Journey*?
El **user journey** es la secuencia de pasos que realiza un usuario dentro de un producto o servicio hasta lograr (o no) un objetivo.

En bases de datos:  
Cada paso = **un evento registrado**, ordenado por tiempo.

**Ejemplo e-commerce:**
1. `page_view` ‚Üí visita general  
2. `view_item` ‚Üí ve un producto  
3. `add_to_cart` ‚Üí agrega al carrito  
4. `begin_checkout` ‚Üí inicia el pago  
5. `purchase` ‚Üí compra final  

Analizar este recorrido permite identificar:
- D√≥nde se pierden usuarios.
- Qu√© tan eficiente es cada paso.
- D√≥nde intervenir para mejorar conversi√≥n.

---

## üîΩ Funnel (Embudo de conversi√≥n)
Un funnel es la representaci√≥n visual del journey: muestra cu√°ntos usuarios pasan por cada etapa y d√≥nde se produce el **abandono**.

### üìâ Comportamientos t√≠picos del embudo
| Comportamiento | Qu√© indica |
|----------------|-----------|
| El embudo se estrecha gradualmente | Abandono natural. Flujo normal. |
| Ca√≠da abrupta en una etapa | **Punto de dolor** ‚Üí fricci√≥n, error t√©cnico o mala experiencia. |
| El embudo se ensancha | **Error de medici√≥n**, duplicados o eventos mal etiquetados. |

---

## üß© Tipos de Journey
### 1Ô∏è‚É£ **Macro-Journey**
- Recorre toda la experiencia del usuario de punta a punta.  
- Requiere unir m√∫ltiples eventos y tablas en SQL.  
- √ötil para ver la imagen general y detectar cuellos de botella globales.

### 2Ô∏è‚É£ **Micro-Journey**
- Analiza solo un paso concreto del proceso.  
- Usa consultas m√°s simples.  
- Ideal para investigar fricciones espec√≠ficas.

---

## üß± Dimensiones clave de an√°lisis
Antes de escribir SQL, define *qu√© est√°s contando*.

| Dimensi√≥n | Representa | Pregunta clave |
|----------|------------|----------------|
| **Usuario** (`user_id`) | Persona √∫nica | ¬øCu√°ntas personas avanzan o compran? |
| **Sesi√≥n** (`session_id`) | Conjunto de acciones en un periodo | ¬øCu√°ntos intentos necesita el usuario para avanzar? |
| **Evento** (`event_name`) | Acci√≥n puntual | ¬øCu√°ntas veces ocurre algo cr√≠tico? |

üí° Elegir la dimensi√≥n correcta cambia completamente la interpretaci√≥n del funnel.

---

## üìê M√©tricas fundamentales en un Funnel
Estas son las m√©tricas esenciales para evaluar eficiencia, fricci√≥n y velocidad del journey.

### 1. **Tasa de Conversi√≥n**
> Qu√© porcentaje avanza de A ‚Üí B  
**F√≥rmula:** `usuarios_B / usuarios_A`

Indica eficiencia del paso.

---

### 2. **Tasa de Abandono (Drop-off)**
> Qu√© porcentaje NO avanza de A ‚Üí B  
**F√≥rmula:** `1 - (usuarios_B / usuarios_A)`

Identifica el punto exacto donde se pierden usuarios.

---

### 3. **Tiempo en etapa**
> Tiempo que pasa un usuario entre acciones consecutivas.

Revela demoras, dudas o pasos demasiado complejos.

---

### 4. **Volumen**
> Cantidad absoluta de usuarios √∫nicos en cada etapa.

Sirve para dimensionar el problema.

---

### 5. **Velocidad de conversi√≥n**
> Tiempo total desde el inicio del journey hasta la conversi√≥n.

Eval√∫a la eficiencia temporal del proceso completo.

---

## üìö Diccionario de eventos clave (E-commerce)

| Orden | Evento | Significado | Etapa |
|-------|--------|-------------|-------|
| 1 | `page_view` | Vista de p√°gina | Visita general |
| 2 | `view_item` | Ver producto | Inter√©s |
| 3 | `add_to_cart` | Agregar al carrito | Intenci√≥n |
| 4 | `begin_checkout` | Iniciar checkout | Decisi√≥n |
| 5 | `purchase` | Compra | Conversi√≥n |

---

## üéØ ¬øQu√© se mide en cada etapa? (Objetivos de negocio)

| Evento | Conversion % | Drop-off % | Tiempo promedio |
|-------|--------------|------------|-----------------|
| page_view | ¬øCu√°ntos llegan al producto? | ¬øQui√©n no sigue? | Tiempo viendo info general |
| view_item | Inter√©s real | Abandono del producto | Tiempo para decidir |
| add_to_cart | Intenci√≥n de compra | Fricci√≥n antes del checkout | Tiempo antes de iniciar pago |
| begin_checkout | Decisi√≥n fuerte | Abandono del pago | Tiempo en completar datos |
| purchase | Conversi√≥n final | Oportunidad perdida | Velocidad total hacia la compra |

---

## üß† Ideas clave para llevar a clase
- Un journey bien definido nace de **objetivos de negocio**, no de la base de datos.
- Macro y micro journeys permiten an√°lisis estrat√©gico y t√°ctico.
- Elegir entre usuario, sesi√≥n o evento cambia la historia.
- El funnel muestra **qu√© pasa**, las m√©tricas muestran **por qu√© pasa**.
- Cada etapa ‚Äúcuenta una historia‚Äù sobre conversi√≥n, abandono y fricci√≥n.

---

## ‚úîÔ∏è Conclusi√≥n
Dominar user journeys te permite:
- Conectar comportamiento real con decisiones de negocio.  
- Detectar d√≥nde mejorar la experiencia del usuario.  
- Construir an√°lisis s√≥lidos en SQL para embudos de conversi√≥n.  
---


## üß™ Pr√°ctica guiada -  An√°lisis de Usuarios, Ventas y M√©tricas de Negocio con SQL  

**Base de datos:** [`ecommerce_demo.db`](https://github.com/gbuvoli/Datasets/raw/refs/heads/main/ecommerce_demo.db)


**Tablas:**  
- `customers`  
- `sales`  
- `discount_coupon`  
- `marketing_spend`  
- `tax_amount`  

![esquema](images\ecommerceDemo.png)

# üß™ SQL para Journeys y Funnels (MySQL)
Este notebook muestra consultas SQL y c√≥mo ejecutarlas desde Python usando `mysql.connector` y `pandas`.
Reemplaza las credenciales y par√°metros de conexi√≥n seg√∫n tu entorno.

In [None]:
import sqlite3
import pandas as pd

# Hacemos la conexi√≥n a la Database
conn = sqlite3.connect("ecommerce_demo.db")


## 1Ô∏è‚É£ SQL B√°sico
- Total de eventos


In [None]:
# Total de eventos

query= '''  SELECT COUNT(*) AS total_eventos FROM events '''

pd.read_sql(query, conn)

Unnamed: 0,total_eventos
0,269524


- Eventos por tipo


In [None]:
# Eventos por tipo

query= '''  SELECT event_name, COUNT(*) AS total FROM events GROUP BY event_name '''
pd.read_sql(query, conn)

Unnamed: 0,event_name,total
0,add_to_cart,53794
1,begin_checkout,53265
2,page_view,55096
3,purchase,52924
4,view_item,54445


## 2Ô∏è‚É£ Subqueries ‚Äî Micro Journey
- Sesiones que llegaron a `view_item`


In [None]:
# Sesiones que llegaron a view_item

query= ''' SELECT 
COUNT(DISTINCT session_id) AS total
FROM (SELECT session_id FROM events WHERE event_name='view_item') AS t'''
pd.read_sql(query, conn)

Unnamed: 0,total
0,26582


## 3Ô∏è‚É£ CTE ‚Äî Embudo Simple


In [None]:
# Embudo simple con CTEs
query = '''
WITH pv AS (
  SELECT COUNT(DISTINCT session_id) AS total_pv FROM events WHERE event_name='page_view'
),
vi AS (
  SELECT COUNT(DISTINCT session_id) AS total_vi FROM events WHERE event_name='view_item'
),
ac AS (
  SELECT COUNT(DISTINCT session_id) AS total_ac FROM events WHERE event_name='add_to_cart'
)
SELECT
  pv.total_pv AS page_views,
  vi.total_vi AS view_items,
  ac.total_ac AS add_to_cart,
  vi.total_vi / pv.total_pv AS conv_pv_vi,
  ac.total_ac / vi.total_vi AS conv_vi_ac
FROM pv, vi, ac;
'''
pd.read_sql(query, conn)

Unnamed: 0,page_views,view_items,add_to_cart,conv_pv_vi,conv_vi_ac
0,27233,26582,25931,0,0


## 4Ô∏è‚É£ Revenue con Cupones y Tax


In [None]:
# Revenue con cupones y despu√©s impuestos
query = '''
SELECT
  s.Product_Category,
  SUM(s.Quantity * s.Avg_Price * (1 - IFNULL(d.Discount_pct,0)/100)) AS rev_descuentos,
  SUM(s.Quantity * s.Avg_Price) - SUM(s.Quantity * s.Avg_Price * t.GST/100) AS rev_neto
FROM sales s
LEFT JOIN discount_coupon d ON s.Product_Category = d.Product_Category
JOIN tax_amount t ON s.Product_Category = t.Product_Category
GROUP BY s.Product_Category;
'''
df = pd.read_sql(query, conn)
df