# Clase de Data Analytics - Análisis de negocios

Este notebook abarca varios ejercicios enfocados en análisis de datos y visualización. Se revisan conceptos como tasas de conversión, embudos de marketing y análisis de cohortes.

| Dataset                  | Representa (empresa/escenario)                              | Análisis típico / KPI que se puede calcular                  |
|---------------------------|-------------------------------------------------------------|-------------------------------------------------------------|
| **funnel_daily.csv**      | impresiones, clics, registros de una página web  | Conversion rate diario, evolución de conversiones en el tiempo |
| **funnel_prod_events.csv**| Eventos de uso de un app (ej. chat, pageview, éxito)  | Embudo de acciones en producto, % de usuarios que completan pasos |
| **events.csv**            | Eventos de e-commerce (pageview → add_to_cart → checkout → payment) | Conversion funnel, tasa de abandono por paso                |
| **game_purchases.csv**    | Compras dentro de un videojuego (in-app purchases)          | Cohortes de usuarios, ticket promedio, ARPU (Average gasto           |
| **work_user_activity.csv**| Actividad de usuarios en una app          | Retención, churn, DAU (Daily Active Users)                   |

## Ejercicio 1: Tasa de conversión

### Concepto teórico:
La **tasa de conversión** es una métrica que permite medir el porcentaje de visitantes o usuarios que realizan una acción deseada (por ejemplo, una compra). Es fundamental en marketing digital para evaluar la eficacia de una campaña o la experiencia del usuario en una tienda.

$\text{Tasa de conversión} = \dfrac{\text{Usuarios/acciones en la etapa siguiente}}{\text{Usuarios/acciones en la etapa anterior}} \times 100$


### En este ejercicio:
Se muestran las tasas de CTR y CR

- **CTR (Click Through Rate):** Porcentaje de impresiones que generan clics.
- **CR (Conversion Rate):** Porcentaje de clics que se convierten en registros o ventas.

In [3]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy

## Ejercicio 2: Embudos

### Concepto teórico:
Un **embudo de conversión** es una representación gráfica que muestra las diferentes etapas que atraviesa un usuario antes de completar una acción (por ejemplo, comprar un producto). Permite identificar en qué punto se pierden los usuarios y optimizar el proceso.

### En este ejercicio:
Se visualiza el embudo de compra de la tienda, mostrando las etapas del proceso (desde la página principal hasta el pedido).

## Ejercicio 3: Embudo de marketing – Agrupación por semanas y meses

### Concepto teórico:
Agrupar datos por intervalos (semanas o meses) es fundamental para detectar tendencias a lo largo del tiempo. En el contexto de embudos de marketing, esto permite evaluar cómo varían las métricas (CTR y CR) en diferentes periodos y tomar decisiones basadas en patrones temporales.

### En este ejercicio:
Se agrupan los datos diarios para calcular métricas semanales y mensuales, facilitando el análisis de la evolución de las campañas publicitarias.

## Ejercicio 4: Embudos de producto simples

### Concepto teórico:
El análisis de **embudos de producto** se centra en medir la interacción de los usuarios con distintos eventos de una aplicación o plataforma, identificando la cantidad de usuarios únicos en cada evento (por ejemplo, ver una página, enviar un mensaje o completar una acción exitosa).

### En este ejercicio:
Se calcula la cantidad de usuarios únicos por evento y se visualiza la actividad utilizando tanto agrupaciones numéricas como gráficos de línea.

## Segundo momento: Análisis de cohortes

El análisis de cohortes es una técnica que agrupa a los usuarios según un evento común (por ejemplo, la primera compra o actividad) para analizar su comportamiento a lo largo del tiempo. Esto permite identificar patrones de retención, abandono y evolución en el comportamiento de los usuarios.

En las siguientes secciones se abordarán diferentes aspectos del análisis de cohortes, desde la agrupación inicial hasta la visualización de la retención y la tasa de cancelación.

### Cohorte 1: Análisis de cohortes en Python

#### Concepto teórico:
En este ejercicio se agrupa a los usuarios por el mes de su primera compra. De esta manera, se puede analizar cuánto gasta cada cohorte de usuarios a lo largo del tiempo. Esto es útil para identificar qué cohortes tienen mayor valor a lo largo de su ciclo de vida.

#### En este ejercicio:
Se convierte la fecha a un período mensual y vamos a determinar gasto total (price) por el primer mes de compra y la cantidad de usuarios, al igual que ver el ticket promedio.

### Cohorte 2: Evaluación de cambios en los valores absolutos por mes

#### Concepto teórico:
Este análisis compara, para cada cohorte (definida por el mes de la primera compra), el número de compras y usuarios únicos en distintos meses, permitiendo calcular el promedio de compras por jugador. Esto ayuda a evaluar la fidelidad y actividad de cada cohorte a lo largo del tiempo.

#### En este ejercicio:
Se agrupan las compras por el mes de la primera compra y el mes de la compra, calculando el promedio de compras por jugador.

### Cohorte 3: Evaluación de los cambios en los valores relativos por ciclo de vida

#### Concepto teórico:
Este ejercicio analiza la evolución del número de compras por jugador a lo largo del tiempo, desde su primera compra. La diferencia en meses entre el primer mes de compra y el mes actual se denomina "cohort lifetime" y permite medir cómo varía la actividad de la cohorte.

#### En este ejercicio:
Se calcula el ciclo de vida de la cohorte en meses y se genera una tabla pivote que muestra el promedio de compras por jugador a lo largo de este ciclo.

### Cohorte 5: Tasa de retención y de cancelación

#### Concepto teórico:
La **tasa de retención** mide el porcentaje de usuarios que continúan utilizando una aplicación o servicio en periodos sucesivos. La **tasa de cancelación** (churn rate) indica el porcentaje de usuarios que abandonan la plataforma. Estas métricas son fundamentales para evaluar la fidelidad del cliente y el éxito de estrategias de retención.

Tasa de retención (Retention) en el periodo t:

$\text{Retention}(t) = \dfrac{\text{Usuarios activos en el periodo } t}{\text{Usuarios iniciales en la cohorte}} \times 100$

Tasa de cancelación (Churn) en el periodo t:

$\text{Churn}(t) = \left( 1 - \dfrac{\text{Usuarios activos en el periodo } t}{\text{Usuarios iniciales en la cohorte}} \right) \times 100$

#### En este ejercicio:
1. Se realiza el cáclulo de la taza retención  semanal.

2. Se calcula la tasa de cancelación a partir del número de usuarios en distintos periodos y se visualiza mediante un mapa de calor.