# ¡Hola, Ulisis!  

Mi nombre es Francisco Benavides, soy code reviewer de Tripleten y voy a revisar el proyecto que acabas de desarrollar.


Cada ves que vea un error por primera vez, lo señalaré. Deberás encontrarlo y arreglarlo, ya que buscamos que te prepares para un trabajo real, en el cual tu líder de equipo hará lo mismo. Si no puedes solucionar el error, te brindaré algunos tips más especificos la proxima vez.

Podrás encontrar mis comentarios más abajo - **por favor, no los muevas, no los modifiques ni los borres**.

¿Cómo lo voy a hacer? Voy a leer cuidadosamente cada una de tus implementaciones que has llevado a cabo para complir con tu informe. Cada uno de mis comentarios tiene el siguiente código de colores:

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Si todo está perfecto.
</div>


<div class="alert alert-block alert-warning">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Si tu código está bien pero se puede mejorar o hay algún detalle que le hace falta.
</div>


<div class="alert alert-block alert-danger">
    
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
    
Si de pronto hace falta algo o existe algún problema con tu código o conclusiones.
</div>


Si encuentras que es necesario, puedes responderme de esta forma: 

<div class="alert alert-block alert-info">
<b>Respuesta del estudiante</b> <a class="tocSkip"></a>
</div>

Mucho éxito!

# Sprint 8: Proyecto - Análisis de Negocio

-   [Introducción](#introducción)
-   [Importar bibliotecas](#importar-bibliotecas)
-   [Cargar datos](#cargar-datos)
-   [Informes y cálculo de métricas](#informes-y-cálculo-de-métricas)
    -   [Visitas](#visitas)
        -   [Actividad del usuario](#actividad-del-usuario)
        -   [Factor de aherencia](#factor-de-adherencia)
    -   [Ventas](#ventas)
        -   [Tasa de conversióon](#tasa-de-conversión)
        -   [Pedidos mensuales](#pedidos-mensuales)
        -   [Tamaño promedio por compra en USD](#tamaño-promedio-por-compra-en-usd)
        -   [Economía unitaria por cliente: LTV](#economía-unitaria-por-cliente-ltv)
    -   [Marketing](#marketing)
        -   [Gastos generales en marketing](#gastos-generales-en-marketing)
        -   [Gastos por fuente de adquisición](#gastos-por-fuente-de-adquisición)
        -   [Economía unitaria por cliente: CAC](#economía-unitaria-por-cliente-cac)
        -   [Economía unitaria por cliente: ROMI](#economía-unitaria-por-cliente-romi)
-   [Conclusiones](#conclusiones)

## Introducción

Se te ha ido muy bien en el curso TripleTen y te han ofrecido hacer prácticas en el departamento analítico de Y.Afisha. Tu primera tarea es ayudar a optimizar los gastos de marketing.

Lo que tienes:

* registros del servidor con datos sobre las visitas a Y.Afisha desde enero de 2017 hasta diciembre de 2018;
* un archivo con los pedidos en este periodo;
* estadísticas de gastos de marketing.

Lo que vas a investigar:

* cómo los clientes usan el servicio;
* cuándo empiezan a comprar;
* cuánto dinero aporta cada cliente a la compañía;
* cuándo los ingresos cubren el costo de adquisición de los clientes.

Instrucciones para completar el proyecto:

Paso 1. Descarga los datos y prepáralos para el análisis

Almacena los datos de visitas, pedidos y gastos en variables.  Optimiza los datos para el análisis. Asegúrate de que cada columna contenga el tipo de datos correcto.

Rutas de archivos: 

`/datasets/visits_log_us.csv. Descarga el dataset`

`/datasets/orders_log_us.csv. Descarga el dataset`

`/datasets/costs_us.csv. Descarga el dataset`

Paso 2. Haz informes y calcula métricas 

1. Visitas:
    * ¿Cuántas personas lo usan cada día, semana y mes?
    * ¿Cuántas sesiones hay por día? (Un/a usuario/a puede tener más de una sesión).
    * ¿Cuál es la duración de cada sesión?
    * ¿Con qué frecuencia los usuarios y las usuarias regresan?

2. Ventas:
 
    * ¿Cuándo la gente empieza a comprar? (En el análisis de KPI, generalmente nos interesa saber el tiempo que transcurre entre el registro y la conversión, es decir, cuando el/la usuario/a se convierte en cliente. Por ejemplo, si el registro y la primera compra ocurren el mismo día, el/la usuario/a podría caer en la categoría Conversion 0d. Si la primera compra ocurre al día siguiente, será Conversion 1d.  Puedes usar cualquier enfoque que te permita comparar las conversiones de diferentes cohortes para que puedas determinar qué cohorte o canal de marketing es más efectivo).
    * ¿Cuántos pedidos hacen durante un período de tiempo dado?
    * ¿Cuál es el tamaño promedio de compra?
    * ¿Cuánto dinero traen? (LTV)

3. Marketing:
 
    * ¿Cuánto dinero se gastó? (Total/por fuente de adquisición/a lo largo del tiempo)
    * ¿Cuál fue el costo de adquisición de clientes de cada una de las fuentes?
    * ¿Cuán rentables eran las inversiones? (ROMI)

Traza gráficos para mostrar cómo difieren estas métricas para varios dispositivos y fuentes de anuncios y cómo cambian con el tiempo. 

## Importar bibliotecas

In [22]:
# Cargar todas las librerías
from scipy import stats as st
import numpy as np
import pandas as pd
import math as mt
from matplotlib import pyplot as plt
import seaborn as sns
import plotly.express as px
import re
from IPython.display import Image, display
import os


## Cargar datos

Se creó una función para cargar los datos de los archivos CSV ya que se llamará en más de una ocasión a lo largo del código.

In [25]:
def data_load():	
    ruta_archivo = os.path.join('datasets', 'costs_us.csv')
    costs_dl = pd.read_csv(
	    ruta_archivo, 
	    dtype={'source_id': 'category'}, 
	    parse_dates=['dt'], 
	    # nrows=500
	    )
    #
    ruta_archivo = os.path.join('datasets', 'orders_log_us.csv')
    orders_dl = pd.read_csv(
	    ruta_archivo,
	    parse_dates = ['Buy Ts'],
	    # nrows = 500
	)
    orders_dl.columns = ['buy_ts', 'revenue', 'uid']
    #
    ruta_archivo = os.path.join('datasets', 'visits_log_us.csv')
    visits_dl = pd.read_csv(
	    ruta_archivo,
	    dtype={'Device': 'category', 'Source Id': 'int'}, 
	    parse_dates = ['End Ts', 'Start Ts'],
	    # nrows = 500
	)
    visits_dl.columns = ['device', 'end_ts', 'source_id', 'start_ts', 'uid']
    return costs_dl, orders_dl, visits_dl

In [3]:
# costs_us = pd.read_csv(
#     'costs_us.csv', 
#     dtype={'source_id': 'category'}, 
#     parse_dates=['dt'], 
#     # nrows=500
#     )

# costs_us.info(memory_usage='deep')

In [4]:
# orders = pd.read_csv(
#     'orders_log_us.csv',
#     parse_dates = ['Buy Ts'],
#     # nrows = 500
# )

# orders.columns = ['buy_ts', 'revenue', 'uid']
# orders.info(memory_usage = 'deep')

In [5]:
# visits = pd.read_csv(
#     'visits_log_us.csv',
#     dtype={'Device': 'category', 'Source Id': 'int'}, 
#     parse_dates = ['End Ts', 'Start Ts'],
#     # nrows = 500
# )

# visits.columns = ['device', 'end_ts', 'source_id', 'start_ts', 'uid']
# visits.info(memory_usage = 'deep')

In [26]:
[costs_us, orders, visits] = data_load()


<div class="alert alert-block alert-danger">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Tu codigo se rompe aca debido a las rutas, por favor recuerda colocar las rutas que permiten ejecutar el notebook en la plataforma para su revisión.</div>

<div class="alert alert-block alert-info">
<b>Corrección:</b> Dado que soy usuario de windows, usando la biblioteca `os` y la línea de código `ruta_archivo = os.path.join('carpeta_datos', 'archivo.csv')` construyo la ruta para abrir los archivos .csv desde la carpeta datasets. <a class="tocSkip"></a>

In [None]:
#Buscando duplicados
print(costs_us.duplicated().unique())
print(orders.duplicated().unique())
print(visits.duplicated().unique())

## Informes y cálculo de métricas 

### Visitas

####    Actividad del usuario

Hay tres métricas principales que describen el número de usuarios activos:

*   DAU (usuarios activos diarios): el número de usuarios activos diarios (únicos).
*   WAU (usuarios activos semanales): el número de usuarios activos semanales.
*   MAU (usuarios activos mensuales): el número de usuarios activos mensuales.

In [None]:
visits['session_year']  = visits['start_ts'].dt.isocalendar().year
visits['session_month'] = visits['start_ts'].dt.month
visits['session_week'] = visits['start_ts'].dt.isocalendar().week
visits['session_date'] = visits['start_ts'].dt.date
# print(visits.head())

In [None]:
mau_total = (
    visits.groupby(['session_year', 'session_month'])
    .agg({'uid': 'nunique'})
    .mean()
)

wau_total = (
    visits.groupby(['session_year', 'session_week'])
    .agg({'uid': 'nunique'})
    .mean()
)

dau_total = (
    visits.groupby(['session_date'])
    .agg({'uid': 'nunique'})
    .mean()
)

In [None]:
print(f'----------------------------------------\n',
      'DAU (usuarios activos diarios): ', dau_total.astype('int').iloc[0],
      '\n----------------------------------------\n',
      '\nWAU (usuarios activos semanales): ', wau_total.iloc[0].astype('int'), 
      '\n----------------------------------------\n',
      '\nMAU (usuarios activos mensuales): ', mau_total.iloc[0].astype('int'),
      '\n----------------------------------------',)

In [None]:
daily_sessions = visits.groupby('session_date').agg({'uid': ['count', 'nunique']})
daily_sessions.columns = ['n_sessions', 'n_users']

daily_sessions_mean = daily_sessions['n_sessions'].mean()

print('Sesiones diarias:')
print(daily_sessions.head())
print(f'\n--------------------------------\n',
      'Sesiones dirias promedio: ', 
      int(daily_sessions_mean),
      '\n--------------------------------',)

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Muy buen calculados el dau, wau y mau
</div>

In [27]:
visits['session_duration_sec'] = (visits['end_ts'] - visits['start_ts'])#.dt.seconds
visits['session_duration_sec'] = (visits['session_duration_sec'] / np.timedelta64(1, 'm'))

print(f'Duración promedio de las sesiones :{visits['session_duration_sec'].mean():,.2f}', 'minutos')

Duración promedio de las sesiones :10.72 minutos



<div class="alert alert-block alert-danger">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
tu codigo se rompe aca, revisa bien los parentess de la ultima linea
</div>

<div class="alert alert-block alert-info">
<b>Nota sobre el comentario:</b> Ya revisé el código y funciona correctamente, obtengo el resultado `Duración promedio de las sesiones: 10.72 minutos` mostrando solo dos decimales. Puede que se rompiera el código debido a lo señalado en tu comentario anterior. <a class="tocSkip"></a>

Las métricas de actividad de los usuarios de la empresa muestran un comportamiento consistente y saludable en su base de usuarios activos, con niveles significativos de participación diaria, semanal y mensual.

1. DAU (Usuarios Activos Diarios): Con 907 usuarios activos diariamente, la empresa demuestra una buena retención diaria, lo que sugiere que una proporción sólida de usuarios encuentra valor en los servicios y los utiliza de manera frecuente.

2. WAU (Usuarios Activos Semanales): El número de usuarios activos semanales es de 5716, lo que indica que una mayor cantidad de usuarios se involucra con los servicios a lo largo de la semana, posiblemente reflejando patrones de uso que varían según días específicos o necesidades semanales.

3. MAU (Usuarios Activos Mensuales): Con 23,228 usuarios activos mensuales, la empresa tiene una base de usuarios considerable que interactúa con los servicios al menos una vez al mes. Este número, comparado con los DAU y WAU, sugiere que la mayoría de los usuarios son más esporádicos en su uso, aunque la base diaria sigue siendo robusta.

4. Sesiones Diarias:

    *   Las sesiones diarias registradas oscilan entre 477 y 893 en el periodo dado, con un promedio de 987 sesiones diarias. Esto sugiere que la actividad del usuario es estable, aunque podría haber días específicos con menor o mayor actividad.
    *   Relación entre DAU y Sesiones Diarias: Dado que el número de sesiones es similar al número de usuarios activos diarios, esto indica que los usuarios suelen realizar aproximadamente una sesión por día, lo que podría reflejar un hábito de uso específico o un patrón de interacción breve y eficaz.

5. Duración Promedio de las Sesiones: Con una duración promedio de 10.72 minutos por sesión, los usuarios parecen estar dedicando un tiempo razonable a cada sesión, lo que sugiere que el contenido o los servicios ofrecidos mantienen el interés durante un periodo suficientemente largo como para ser efectivos en cumplir sus objetivos.

#### Factor de adherencia

Esta métrica te dice qué tan leal es la audiencia, con qué frecuencia regresan a la aplicación. La fórmula es simple: 
*   Semanal
$$
sticky factor = DAU/WAU
$$
*   Mensual
$$
sticky factor = DAU/MAU
$$

<div class="alert alert-block alert-info">
<b>Nota:</b> No entendí a que se refieren con la prgunta `¿Con qué frecuencia los usuarios y las usuarias regresan?`. Creo que se refiere al `factor de adherencia`, pero, también obtuve el porcentaje de usuarios que regresan a la aplicación, el porcetaje de ususarios que vuelve a hacer un pedido. <a class="tocSkip"></a>

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Exactamente hace referencia a los sticky factor
</div>

In [None]:
aux = visits.groupby(['uid']).agg({'uid' : 'count'})
clients = aux[aux > 1].dropna()

# aux.info()
print('\n--------------------------------------------------------------------\n')
# clients.info()

print(f'\n\n -----------------------------------------------------------------------\n', 
      '| El ', int(len(clients)/len(aux)*100), 
      '% de los usuarios regresan a la aplicación al menos una vez. |',
      '\n -----------------------------------------------------------------------'
      )

In [None]:
aux = orders.groupby(['uid']).agg({'uid' : 'count'})
client_series = aux[aux > 1].dropna()

# aux.info()
print('\n--------------------------------------------------------------------\n')
# client_series.info()

print(f'\n\n ----------------------------------------------------\n', 
      '| El ', int(len(client_series)/len(aux)*100), 
      '% de los usuarios hacen más de una orden. |',
      '\n ----------------------------------------------------'
      )

In [None]:
sticky_wau = (dau_total/wau_total) * 100
print(f'Factor de adherencia: ', sticky_wau.astype('int').iloc[0])

Las métricas proporcionadas reflejan la capacidad de la empresa para atraer y retener usuarios, así como su efectividad en fomentar comportamientos de compra repetitiva. Aquí se presenta un análisis de los datos:

1. Retención de Usuarios:

    Solo el 22% de los usuarios regresan a la aplicación al menos una vez. Esta baja tasa de retención indica que la mayoría de los usuarios no encuentran suficiente valor o incentivo para volver a utilizar el servicio después de su primera interacción. Esto podría sugerir la necesidad de mejorar la experiencia de usuario, el contenido, o las estrategias de re-engagement.

2. Comportamiento de Compra:

    El 17% de los usuarios realizan más de una orden. Aunque este porcentaje es cercano al de retención, muestra que un número aún menor de usuarios se convierte en clientes recurrentes. Esto podría estar relacionado con la calidad del servicio, la satisfacción del cliente, o la oferta de productos. Mejorar las ofertas promocionales o programas de lealtad podría aumentar esta cifra.

3. Factor de Adherencia:

    Un factor de adherencia de 15 sugiere que aquellos usuarios que permanecen y realizan compras tienden a hacerlo con relativa frecuencia. Este es un punto positivo que indica que, aunque la base de usuarios recurrentes es pequeña, aquellos que se mantienen comprometidos muestran un alto nivel de interacción con el servicio.

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Muy bien calculado los factores de adherencia
</div>

<div class="alert alert-block alert-warning">
<b>Comentario del revisor</b> <a class="tocSkip"></a>

Tambien puedes calcular la tasa de retención por cohortes en esta sección
</div>

<div class="alert alert-block alert-info">
<b>Nota:</b> Tuve muchos problemas al hacer operaciones con las deltas de tiempo de numpy porque la versión de `pandas` que tengo instalada ya no permite las operaciones con varias de las deltas de tiempo que se utilizaron en este Sprint. ¿Pudieras comentarme que versión es la que usan en la plataforma, y la forma de instalarla sobre mi versión? Gracias 😁<a class="tocSkip"></a>

### Ventas

#### Tasa de conversión

In [None]:
clients = visits.merge(orders, on= 'uid', how = 'right')
print(len(clients), len(visits), len(orders))
# print(clients.head(10))

In [None]:
clients.info()

In [None]:
first_activity_date = clients.groupby(['uid'])['start_ts'].min().dt.date
first_activity_date.name = 'first_activity_date'
clients = clients.join(first_activity_date, on='uid')

In [None]:
first_buy_date = clients.groupby(['uid'])['buy_ts'].min().dt.date
first_buy_date.name = 'first_buy_date'
clients = clients.join(first_buy_date, on='uid')

In [None]:
# clients.info()
print(clients[['first_activity_date','source_id', 'first_buy_date']].sample(5, random_state= 4123))

In [None]:
clients_cohort = clients[['uid', 'device', 'source_id', 'first_activity_date', 'first_buy_date']]

print(f'-----------------------------------------\n',
      '\tDuplicated rows:',
      len(clients_cohort[clients_cohort.duplicated()]),
      '\n-----------------------------------------\n'
      )

clients_cohort = clients_cohort.drop_duplicates()
clients_cohort['first_buy_date'] = pd.to_datetime(clients_cohort['first_buy_date'])
clients_cohort['first_activity_date'] = pd.to_datetime(clients_cohort['first_activity_date'])
# clients_cohort['conversion'] = pd.to_datetime(clients_cohort['first_buy_date'].dt.date) - pd.to_timedelta(clients_cohort['first_activity_date'].dt.date)
clients_cohort['conversion'] = (clients_cohort['first_buy_date'] - clients_cohort['first_activity_date']).dt.days

# clients_cohort.info()
# print(clients_cohort.head())
# print(clients_cohort.sample(5, random_state= 4123))
print(clients_cohort['conversion'].nunique())
# print(clients_cohort['conversion'].value_counts().head(20))
print(clients_cohort['source_id'].unique())

In [None]:
source_conversion = []
for source in clients_cohort['source_id'].unique():
    source_conversion.append(
        len(clients_cohort[clients_cohort['source_id'] == source])
    )

# print(clients_cohort['source_id'].unique())
# print(source_conversion)

In [None]:
# source_conversion = dict(zip(clients_cohort['source_id'].unique(), source_conversion))
# print(source_conversion)
source_conversion = pd.DataFrame({
    'source_id': clients_cohort['source_id'].unique(),
    'conversion_count': source_conversion
}).sort_values('conversion_count', ascending= False).reset_index(drop=True)

print(source_conversion)


In [None]:
source_conversion.plot(
    x='source_id',
    y= 'conversion_count',
    kind='bar',
    figsize=[10,5],
    grid=True,
    color = '#FFA0FF',
    yticks = np.linspace(0, 15000, 16),
    title = 'Amount of first buys per source',
    ylabel = 'Amount of first buys',
    xlabel = 'Source Id',
    legend = False
    )

# plt.legend()
plt.xticks(rotation= 0)
plt.show()

In [None]:
def switch(case):
    if case == 0:
        return '0'
    elif case == 1:
        return '1'
    elif case == 2:
        return '2'
    elif case == 3:
        return '3'
    elif case == 4:
        return '4'
    elif case == 5:
        return '5'
    elif case == 6:
        return '6'
    elif case == 7:
        return '7'
    else:
        return '7+'

conversion = []

for conv in clients_cohort['conversion']:
    conversion.append(switch(conv))

print(len(conversion))
print(len(clients_cohort))

In [None]:
clients_cohort['conversion'] = conversion
# print(clients_cohort.sample(10))
# print(clients_cohort['conversion'].nunique())
print(clients_cohort['conversion'].value_counts())

In [None]:
clients_cohort['conversion'].value_counts().plot(
    # x='source_id',
    # y= 'conversion_count',
    kind='bar',
    figsize=[10,5],
    grid=True,
    color = '#FFA0FF',
    yticks = np.linspace(0, 35000, 15),
    title = 'Cantidad de clientes por categoría de conversión',
    ylabel = 'Clientes',
    xlabel = 'Categoría de conversión',
    legend = False
    )

# plt.legend()
plt.xticks(rotation= 0)
plt.show()

In [None]:
# clients_cln = visits.merge(orders, on= 'uid', how='inner')
# clients_cln = clients
# clients_cln.info()
# print(f'-----------------------------------------\n',
#       '\tDuplicated rows:',
#       len(clients_cln[clients_cln.duplicated()]),
#       '\n-----------------------------------------\n'
#       )
# # print(len(clients_cln))
clients.info()

In [None]:
clients['first_buy_date'] = pd.to_datetime(clients['first_buy_date'])
clients['buy_ts'] = pd.to_datetime(clients['buy_ts'])

clients['first_order_month'] = clients['first_buy_date'].dt.to_period('M')
clients['order_month'] = clients['buy_ts'].dt.to_period('M')
print(clients.head(10))

Los datos proporcionados ofrecen una visión sobre la efectividad de diferentes fuentes de marketing y el tiempo que tardan los usuarios en convertirse después de su primer contacto. Aquí se presentan las conclusiones basadas en estos datos:

1. Tasa de Conversión por Fuente de Marketing

    *   Fuentes de Marketing con Alta Tasa de Conversión:

        *   La fuente de marketing 4 tiene la tasa de conversión más alta, con 14,807 usuarios convertidos. Esto sugiere que esta fuente es la más efectiva en convertir usuarios potenciales en clientes.
        *   Otras fuentes con altas tasas de conversión son las fuentes 3 (14,363) y 5 (10,350), lo que indica que estas también son bastante efectivas.

    *   Fuentes de Marketing con Baja Tasa de Conversión:

        *   Las fuentes 10 (1,810) y 7 (1) tienen tasas de conversión significativamente menores, lo que indica que estas fuentes tienen un impacto reducido en la conversión de usuarios.

    *   Recomendación:

        *   Es recomendable enfocar recursos y esfuerzos en las fuentes de marketing con mayores tasas de conversión para maximizar el retorno sobre la inversión. Las fuentes con tasas más bajas podrían necesitar una revisión de estrategia o podrían ser menos efectivas en general.

2. Tiempo para la Conversión de Usuarios

    *   Tiempo de Conversión Rápido:

        *   Una gran mayoría de usuarios (34,099) se convierte en el mismo día (día 0), lo que indica una rápida conversión de la mayoría de los usuarios.

    *   Tiempo de Conversión Lento:

        *   Un número significativo de usuarios (16,633) tarda 7 días o más en convertirse. Esto sugiere que, para algunos usuarios, el proceso de conversión es más largo y puede requerir más interacciones o tiempo para tomar una decisión.

    *   Otros Intervalos de Tiempo:

        *   Los usuarios que se convierten en 1 a 6 días muestran un interés progresivo pero no inmediato, con una cantidad de usuarios decreciente conforme aumenta el tiempo de conversión.

    *   Recomendación:

        *   Dado que la mayoría de los usuarios se convierten rápidamente, se podría optimizar el proceso de conversión para estos usuarios rápidos para maximizar el rendimiento. Para los usuarios que tardan más tiempo en convertir, considerar estrategias de retención y seguimiento, como correos electrónicos de recordatorio o ofertas adicionales, podría ayudar a acelerar la conversión.

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Gran trabajo con las tasas de conversion
</div>

#### Pedidos mensuales

In [None]:
# Se usa el método count para contar la cantidad de compras por mes.
buys_cohort = clients.groupby('order_month').agg({'uid' : 'count', 'revenue' : 'sum'})
print(buys_cohort)

In [None]:
# print(clients[clients['order_month'] == '2018-06'])

#### Tamaño promedio por compra en USD

In [None]:
# Tamaño promedio de la compra
mean_buy = orders['revenue'].mean()
print(mean_buy)

#### Economía unitaria por cliente: LTV

El LTV (lifetime value en inglés) es el valor "de vida" del cliente. Es la cantidad total de dinero que un cliente aporta a la empresa en promedio al realizar compras. Al calcular el LTV, los y las analistas suelen considerar el beneficio bruto de un/a cliente/a por período.

In [None]:
orders.info()

In [None]:
orders['order_month'] = pd.to_datetime(orders['buy_ts'], format="%Y-%m").dt.date #.dt.to_period('M')
# clients['first_order_month'] = clients['first_buy_date'].dt.to_period('M')
# orders['order_month'] = orders['buy_ts'].astype('datetime64[M]')
orders['order_month'] = pd.to_datetime(orders['order_month'], format="%Y-%m")
orders['order_month'] = orders['order_month'].dt.strftime('%Y-%m')
orders['order_month'] = pd.to_datetime(orders['order_month'], format="%Y-%m")
orders.info()

In [None]:
first_orders = orders.groupby('uid').agg({'order_month': 'min'}).reset_index()
first_orders.columns = ['uid', 'first_order_month']
# first_orders['first_order_month'] = pd.to_datetime(first_orders['first_order_month'], format="%Y-%m")
first_orders.head()

In [None]:
cohort_sizes = first_orders.groupby('first_order_month').agg({'uid': 'nunique'}).reset_index()
cohort_sizes.columns = ['first_order_month', 'n_buyers']
cohort_sizes.head()

In [None]:
orders_ = pd.merge(orders,first_orders, on='uid')
orders_.head()

In [None]:
cohorts = orders_.groupby(['first_order_month','order_month']).agg({'revenue': 'sum'}).reset_index()
cohorts.head()

In [None]:
report = pd.merge(cohort_sizes, cohorts, on='first_order_month')
report['first_order_month'] =  pd.to_datetime(report['first_order_month'], format="%Y-%m")
# report.head()
report.info()

In [None]:
margin_rate = 0.5

report['gp'] = report['revenue'] * margin_rate
report['age'] = (
    report['order_month'] - report['first_order_month']
) / np.timedelta64(1, 'D') / 30
report['age'] = report['age'].round().astype('int')

# report.sample(20, random_state=1234)
# report.info()
report.head()

In [None]:
report['ltv'] = report['gp'] / report['n_buyers']
report.head()
# print(report.groupby(['first_order_month', 'order_month'])['ltv'].mean())
# print(len(report.groupby('first_order_month')['ltv'].mean()))

In [None]:
output = report.pivot_table(
    index='first_order_month', columns='age', values='ltv', aggfunc='mean'
)#.round()

output.fillna('')

El análisis de la métrica LTV (Lifetime Value) mensual de la empresa a lo largo del tiempo muestra varios patrones importantes que pueden influir en las decisiones estratégicas y operativas de la empresa:

1. Tendencia Inicial Elevada en el LTV
    *   En la mayoría de los meses, el LTV más alto se observa en el mes inicial (age = 0). Esto indica que los usuarios tienden a generar el mayor valor en su primer mes de actividad tras realizar su primera orden. Por ejemplo, en junio de 2017, el LTV es de 2.36, y en julio de 2017, es de 3.00, siendo estos valores significativamente más altos que los meses posteriores.

2. Disminución Gradual del LTV
    *   Después del primer mes, hay una tendencia general a la disminución del LTV con el paso del tiempo. Aunque hay algunos repuntes en meses específicos, la mayoría de las cohortes muestra una disminución constante. Esto podría indicar una baja en la actividad o en las compras de los usuarios a medida que pasa el tiempo desde su primera compra.

3. Variabilidad entre Cohortes
    *   Hay una considerable variabilidad entre los diferentes meses de primera orden. Por ejemplo, la cohorte de septiembre de 2017 muestra un aumento significativo en el tercer mes (age = 3) con un LTV de 1.98, mientras que en otros meses como julio y octubre, no se observa tal incremento. Esto sugiere que algunos factores específicos de esas cohortes, como campañas de marketing, promociones o cambios en la oferta de productos, pudieron haber influido en estos picos.

4. Cohortes Recientes con LTV Más Bajo
    *   Las cohortes más recientes (2018) muestran un LTV inicial más bajo en comparación con las cohortes anteriores. Esto puede ser indicativo de cambios en la base de usuarios, estrategias de adquisición, o en la oferta de productos/servicios de la empresa. Un LTV inicial más bajo podría ser una señal de alerta para revisar la estrategia de retención y fidelización de clientes.

5. Recomendaciones Estratégicas

   *   Optimización de Retención: La empresa debería enfocarse en estrategias para mantener y aumentar el LTV en los meses posteriores a la primera orden. Esto podría incluir programas de fidelización, ofertas especiales para usuarios recurrentes, o personalización en la comunicación.

   *   Análisis de Cohortes: Es recomendable llevar a cabo un análisis más profundo de las cohortes que muestran repuntes en el LTV en meses específicos para identificar qué factores pueden haber contribuido a esos aumentos y si pueden ser replicados.

   *   Ajuste de Estrategias de Adquisición: Dado que las cohortes más recientes muestran un LTV inicial más bajo, podría ser necesario revisar y ajustar las estrategias de adquisición de clientes para asegurarse de que la empresa está atrayendo a los usuarios adecuados, aquellos con un mayor potencial de LTV a largo plazo.

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Gran trabajo calculando el LTV
</div>

### Marketing

#### Gastos generales en marketing

In [None]:
total_mkt_costs = costs_us['costs'].sum()
print(f'Gastos totales de marketing: $',total_mkt_costs, 'USD')

#### Gastos por fuente de adquisición

In [None]:
source_costs = costs_us.groupby('source_id', observed=False).agg({'costs':'sum'}).sort_values(by= 'costs', ascending= False)
print(source_costs)

In [None]:
source_costs.plot(
    # x='source_id',
    # y= 'conversion_count',
    kind='bar',
    figsize=[10,8],
    grid=True,
    color = '#FFA0FF',
    yticks = np.linspace(0, 140000, 15),
    title = 'Gastos por fuente de adquisición',
    ylabel = 'Gastos (USD)',
    xlabel = 'Fuente de adquisición (ID)',
    legend = False
    )

# plt.legend()
plt.xticks(rotation= 0)
plt.show()

In [None]:
costs_us['month'] = costs_us['dt'].dt.strftime('%Y-%m')
# costs_us['month'] = pd.to_datetime(costs_us['month'], format="%Y-%m")
# costs_us.head()

In [None]:
# costs_us['month'].unique()

In [None]:
costs_time = costs_us.groupby(['source_id','month'], observed= False).agg({'costs' : 'sum'}).reset_index()
costs_time['month'] = pd.to_datetime(costs_time['month'], format="%Y-%m")
print(costs_time)
# costs_time.info()

In [None]:
sources = costs_time['source_id'].unique()#.astype('str')
print(sources)

In [None]:
plt.figure(figsize=(12, 5))

for source in sources:
    df = costs_time[costs_time['source_id'] == source][['month', 'costs']]
    # print(f'Gastos por mes de la fuente '+source+' de Marketing\n',df,#df.head(1),
    #       '\n-----------\n'
    #       )
    plt.plot(df['month'], df['costs'], label=str(source))

plt.title('Gastos totales por mes de cada funte de Marketing')
plt.xlabel('Meses registrados')
plt.ylabel('$ USD')
plt.grid(True)
plt.xticks(rotation= 30)
plt.legend(sources)


El análisis de los gastos mensuales de diferentes fuentes de marketing en la empresa revela tendencias y variaciones significativas en la inversión a lo largo del tiempo. Aquí se presentan las conclusiones clave:

1. Comparación de Gastos entre Fuentes de Marketing

    *   Fuente 3: Esta fuente es la que recibe la mayor inversión de marketing, con picos significativos en octubre y noviembre de 2017, superando los 15,000 y 17,000 unidades monetarias respectivamente. Estos altos niveles de gasto sugieren que esta fuente es considerada estratégica para la empresa.

    *   Fuente 2: También se observa una inversión considerable en la fuente 2, especialmente en los últimos meses de 2017 y principios de 2018, con gastos que superan los 5,000 unidades monetarias. Este gasto alto puede reflejar campañas agresivas o estrategias de adquisición clave.

    *   Fuentes 4 y 5: Estas fuentes muestran un gasto moderado, con un incremento significativo hacia finales de 2017 y principios de 2018. Aunque sus picos no alcanzan los niveles de la fuente 3, siguen siendo relevantes para la estrategia de marketing.

    *   Fuentes 1, 9 y 10: Estas fuentes tienen los niveles de gasto más bajos. En particular, la fuente 9 y la fuente 10 muestran inversiones mensuales que rara vez superan las 1,000 unidades monetarias. Esto podría indicar una menor prioridad estratégica o un enfoque en campañas más específicas o de menor escala.

2. Evolución de los Gastos a lo Largo del Tiempo

    *   Tendencia Ascendente en 2017: La mayoría de las fuentes muestran un aumento en los gastos a medida que se avanza en el año 2017, alcanzando picos hacia octubre y noviembre, posiblemente relacionados con campañas de fin de año o temporadas de mayor consumo.

    *   Estabilización en 2018: En el primer trimestre de 2018, se observa una estabilización o ligera disminución en los gastos, lo que puede reflejar un ajuste de las estrategias de marketing o una fase de optimización tras un período de inversión intensa.

3. Consideraciones Estratégicas

    *   Evaluación de Eficiencia: Dado el alto gasto en algunas fuentes (como la fuente 3), sería importante evaluar la eficiencia de estas inversiones en términos de retorno sobre la inversión (ROI) y conversión de usuarios. Las fuentes con menor gasto también deben ser revisadas para asegurarse de que están alcanzando su potencial.

    *   Diversificación de Estrategias: La variabilidad en los gastos sugiere que la empresa está probando diferentes estrategias en varias fuentes de marketing. Esta diversificación es positiva, pero debe estar acompañada de un análisis continuo para redirigir inversiones hacia las fuentes más rentables.

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Excelente trabajo
</div>

#### Economía unitaria por cliente: CAC

El CAC (costo de adquisición de clientes/as) es el costo de atraer a cada cliente: el dinero que un/a nuevo/a cliente/a le cuesta a una empresa. La economía unitaria por cliente es sólida si el LTV es mayor que el CAC.

$$
LTV > CAC
$$

In [None]:
# costs_us['month'] = pd.to_datetime(costs_us['month'], format="%Y-%m")
# costs_us.info()
# # costs_us.head()

In [None]:
# report.head()
# report.info()

In [None]:
def data_prep(device, visits, orders, costs_us, filter = False):

	# visits.info()
	if filter:
		visits = visits.merge(orders, on= 'uid', how= 'inner')
		
	else:
		visits = orders
		device = 'General'
	#
	visits['order_month'] = pd.to_datetime(visits['buy_ts'], format="%Y-%m").dt.date
	visits['order_month'] = pd.to_datetime(visits['order_month'], format="%Y-%m")
	visits['order_month'] = visits['order_month'].dt.strftime('%Y-%m')
	visits['order_month'] = pd.to_datetime(visits['order_month'], format="%Y-%m")
	#
	if filter:
		visits = visits[visits['device'] == device][['buy_ts','revenue', 'uid', 'order_month']]
		visits = visits.drop_duplicates()
	#
	first_orders = visits.groupby('uid').agg({'order_month': 'min'}).reset_index()
	first_orders.columns = ['uid', 'first_order_month']
	#
	cohort_sizes = first_orders.groupby('first_order_month').agg({'uid': 'nunique'}).reset_index()
	cohort_sizes.columns = ['first_order_month', 'n_buyers']
	#
	orders_ = pd.merge(visits,first_orders, on='uid')
	#
	cohorts = orders_.groupby(['first_order_month','order_month']).agg({'revenue': 'sum'}).reset_index()
	#
	report = pd.merge(cohort_sizes, cohorts, on='first_order_month')
	report['first_order_month'] =  pd.to_datetime(report['first_order_month'], format="%Y-%m")
	#
	margin_rate = 0.5
	#
	report['gp'] = report['revenue'] * margin_rate
	report['age'] = (
	    report['order_month'] - report['first_order_month']
	) / np.timedelta64(1, 'D') / 30
	report['age'] = report['age'].round().astype('int')
	#
	report['ltv'] = report['gp'] / report['n_buyers']
	#
	costs_us['month'] = costs_us['dt'].dt.strftime('%Y-%m')
	#
	costs_time = costs_us.groupby(['source_id','month'], observed= False).agg({'costs' : 'sum'}).reset_index()
	costs_time['month'] = pd.to_datetime(costs_time['month'], format="%Y-%m")
	#
	sources = costs_time['source_id'].unique()#.astype('str')
	#
	costs_us['month'] = pd.to_datetime(costs_us['month'], format="%Y-%m")

	return report, costs_time, sources, visits, orders, costs_us, device


In [None]:
def marketing_metrics(costs, source, report, case = 1, pnt = False):
    df = costs[costs['source_id'] == source][['month', 'costs']]
    report_ = report.merge(df, left_on='first_order_month', right_on='month', how='inner')
    report_ = report_.drop_duplicates()
    report_['cac'] = report_['costs'] / report_['n_buyers']
    
    report_['romi'] = report_['ltv'] / report_['cac']
    output = report_.pivot_table(
    index='first_order_month', columns='age', values='romi', aggfunc='mean')
    if(case == 1):
        if(pnt):
            print(report_)
        return report_
    if( case == 2):
        if(pnt):
            print(output)
        return output

In [None]:
def filter_name(filter = 0):
    if filter == 'desktop':
        return 'Desktop_'
    elif filter == 'touch':
        return 'Touch_'
    else:
        return 'No_filter_'

In [None]:
# rep = marketing_metrics(costs_time,sources[0], 1, True)

In [None]:
# Volvemos a leer los archivos CSV para reiniciar los dataframes para limpiarlos de datos inecesarios
[costs_us, orders, visits] = data_load()

#imprimimos la lista de dispositivos
print(visits['device'].unique(), f'\n\n')

#Configuraciones para la función `data_prep` para aplicar el filtro deseado por dispositivo o no aplicar el filtro
# apply_filter = True
apply_filter = False
# filter_nm = 'desktop'
filter_nm = 'touch'

# llamamos a la función `data_prep` para obtener las variables 
# necesarias y aplicar el filtro a los datos de ordenes para poder 
# calcular las métricas de marketing con la función `marketing_metrics`

[report, costs_time, sources, visits, orders, costs_us, filter_report] = data_prep(filter_nm, visits, orders, costs_us, apply_filter)

# print(visits.head())

# rep = marketing_metrics(costs_time,sources[1], report, 1, True)

In [None]:
for source_ in sources:
    rep = marketing_metrics(costs_time,source_, report, 1, False)
    print(f'Costo de adquisisción de clientes de la fuente ' + source_ + ': ',rep['cac'].sum(), ' USD.')

El análisis del Costo de Adquisición de Clientes (CAC) revela diferencias sustanciales en la eficiencia de las distintas fuentes de marketing utilizadas por la empresa:

1. Fuentes de Bajo Costo:
    *   Las fuentes 9 y 10 destacan por sus bajos CAC, con $12.16 USD y $12.82 USD respectivamente. Estas fuentes representan las opciones más económicas para adquirir nuevos clientes, lo que podría ser indicativo de una alta eficiencia en estas campañas o estrategias de marketing.

2. Fuentes de Costo Moderado:
    *   La fuente 1 tiene un CAC de $45.59 USD, lo cual es moderado en comparación con otras fuentes. Esta cifra sugiere que, aunque no es la más económica, podría estar obteniendo un balance aceptable entre costo y efectividad.

3. Fuentes de Alto Costo:
    *   Las fuentes 3, 4 y 5 presentan CAC significativamente altos, especialmente la fuente 3 con un CAC de $309.73 USD. La fuente 4 tiene un CAC de $139.47 USD, y la fuente 5 un CAC de $113.23 USD. Estos altos costos de adquisición pueden ser preocupantes, especialmente si no se justifican con un alto valor de vida del cliente (LTV).

4. Estrategia de Optimización:
    *   Dados los altos costos de algunas fuentes, la empresa debería considerar revisar su estrategia de asignación de presupuesto en marketing. Es posible que se deba reducir la inversión en las fuentes más costosas o encontrar maneras de optimizar su rendimiento para mejorar la eficiencia general del gasto en marketing.

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Bien calculado el CaC
</div>

#### Economía unitaria por cliente: ROMI

El ROMI (Retorno de la Inversión en Marketing) es una métrica que mide la efectividad de una inversión en marketing al calcular el retorno generado por dicha inversión. Es similar al ROI (Return on Investment), pero específicamente aplicado a las actividades de marketing.

In [None]:
for source_ in sources:
    rep = marketing_metrics(costs_time,source_, report, 2, False)

    rep.index = costs_time['month'].dt.strftime('%Y-%m').unique()

    plt.figure(figsize=(9, 5))
    # plt.title('')
    ax = sns.heatmap(
        rep,
        annot=True,
        fmt='.2f',
        linewidths=1,
        linecolor='gray',
    )

    filename = filter_name(filter_report) + 'heatmap_source_' + str(source_)

    plt.title(('Retorno de la inversión en marketing (ROMI) de la fuente ' + str(source_) + ' (' + filter_report + ')'))

    # print(filename)
    # plt.savefig(f"{filename}.png")

plt.show()

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Muy buen trabajo con el ROMI
</div>

<div class="alert alert-block alert-danger">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
Con la url, puedes colocar la imagen en el notebook con la siguiente sintaxis:
    
    ![nombre_imagen](url)
</div>

<img src="https://raw.githubusercontent.com/UMonCar/Sprint8_Project/main/General_ROMI_group.png" alt="General ROMI Group" width="1000"/>

<div class="alert alert-block alert-info">
<b>Nota:</b> Precisamene utilizé dicho comando, sin embargo, subí la imagen a múltiples plataformas y siempretenía error o no aparecía la imagen, supongo que debe subirse a google o a otro medio más público, la verdad no he usado ese código con imagenes propias, intentaré con github. <a class="tocSkip"></a>

A partir de la información visualizada en las tablas pivote que muestran el ROMI de diferentes fuentes de marketing, se pueden extraer las siguientes conclusiones:

1. Desempeño Consistente:
    *   La fuente 9 muestra un ROMI consistentemente alto a lo largo del tiempo, especialmente en los primeros meses, alcanzando valores superiores a 16. Esto indica que la inversión en esta fuente es extremadamente rentable en el corto plazo, con un retorno significativo desde el primer mes.

2. Crecimiento Moderado:
    *   Las fuentes 1 y 5 presentan un ROMI moderado que se estabiliza rápidamente. Aunque no alcanzan valores tan altos como la fuente 9, su rentabilidad es aceptable y parece mantener una tendencia positiva, lo que sugiere que pueden ser fuentes confiables de retorno a mediano plazo.

3. Fuentes Menos Eficientes:
    *   Las fuentes 2, 3 y 4 muestran un ROMI bajo o fluctuante en comparación con otras fuentes. En particular, la fuente 3 tiene valores iniciales muy bajos y sólo muestra una ligera mejora en meses posteriores. Esto sugiere que estas fuentes podrían estar generando un retorno insuficiente en relación con la inversión, lo que podría justificar una reevaluación de su efectividad.

4. Tendencias Positivas Tardías:
    *   Aunque algunas fuentes como la fuente 10 empiezan con un ROMI bajo, muestran una mejora significativa con el tiempo, especialmente después del tercer o cuarto mes. Esto indica que estas fuentes pueden requerir un periodo de maduración más largo para que el retorno sobre la inversión sea visible, pero eventualmente pueden ofrecer buenos resultados.

5. Variabilidad en el ROMI:
    *   Existe una notable variabilidad en el ROMI no solo entre diferentes fuentes, sino también en diferentes periodos para la misma fuente. Esto sugiere que el éxito de las campañas de marketing puede depender de múltiples factores, incluyendo estacionalidad, cambios en la estrategia, o fluctuaciones en la demanda del mercado.

6. Recomendaciones:
    *   Optimizar la inversión en fuentes de alto rendimiento como la fuente 9, mientras se reduce o reevalúa la inversión en aquellas con un ROMI bajo, como la fuente 3.
    *   Monitorear las tendencias de fuentes como la fuente 10, que muestran mejoras significativas a lo largo del tiempo, para capitalizar en su rendimiento futuro.
    *   Realizar ajustes estratégicos en las campañas de las fuentes con menor rendimiento para intentar mejorar su ROMI o considerar la redistribución del presupuesto hacia fuentes más eficientes.

<img src="https://raw.githubusercontent.com/UMonCar/Sprint8_Project/main/Desktop_ROMI_group.png" alt="Desktop ROMI Group" width="1000"/>

A partir de la visualización de las tablas pivote que muestran el ROMI de diferentes fuentes de marketing en dispositivos de escritorio (desktop), se pueden extraer las siguientes conclusiones:

1. Desempeño Consistente y Alto Retorno:
    *   La fuente 9 nuevamente destaca con un ROMI muy alto, especialmente en los primeros meses, con valores que superan ampliamente el 15. Esto indica que las campañas en esta fuente son altamente rentables en dispositivos de escritorio, y el retorno es sustancial desde el principio.

2. Crecimiento Gradual:
    *   Las fuentes 1 y 5 presentan un crecimiento gradual en su ROMI, manteniendo valores moderados pero consistentes a lo largo del tiempo. Aunque no alcanzan los niveles de la fuente 9, su comportamiento sugiere una estabilidad y una rentabilidad que puede ser confiable a mediano y largo plazo.

3. Fuentes con Rendimiento Limitado:
    *   Las fuentes 2, 3 y 4 muestran un ROMI bajo en general, con algunas fluctuaciones y pequeñas mejoras en ciertos periodos. Esto sugiere que estas fuentes podrían no estar generando el retorno esperado en la inversión realizada para dispositivos de escritorio, lo que podría justificar una reevaluación de las estrategias aplicadas en estas plataformas.

4. Tendencias Tardías en el ROMI:
    *   La fuente 10 muestra un patrón interesante donde los primeros meses presentan un ROMI bajo, pero después de aproximadamente seis meses, se observa una mejora significativa. Esto indica que las campañas en esta fuente pueden necesitar más tiempo para madurar y comenzar a ofrecer un retorno significativo.

5. Variabilidad en el Retorno:
    *   Existe una alta variabilidad en el ROMI tanto entre diferentes fuentes como en diferentes periodos dentro de la misma fuente. Este patrón sugiere que el rendimiento de las campañas de marketing en dispositivos de escritorio puede estar influenciado por múltiples factores, como la estacionalidad, los cambios en la demanda, o las modificaciones en las estrategias publicitarias.

6. Recomendaciones:
    *   Maximizar la inversión en la fuente 9, ya que consistentemente demuestra ser la más rentable, especialmente en dispositivos de escritorio.
    *   Monitorear y ajustar las campañas en fuentes como la 1 y la 5, que muestran un crecimiento estable y podrían beneficiarse de inversiones adicionales para optimizar aún más su retorno.
    *   Reevaluar la estrategia para las fuentes 2, 3 y 4, dado su bajo rendimiento, con el fin de determinar si es más eficiente redirigir los recursos a fuentes más efectivas o mejorar las campañas actuales.
    *   Aprovechar el potencial de fuentes como la 10 para periodos más largos, ya que, aunque su ROMI inicial es bajo, mejora significativamente con el tiempo.

<img src="https://raw.githubusercontent.com/UMonCar/Sprint8_Project/main/Touch_ROMI_group.png" alt="Touch ROMI Group" width="1000"/>

Al analizar las tablas pivote que representan el ROMI de diferentes fuentes de marketing en dispositivos táctiles (touch), se pueden extraer las siguientes conclusiones:

1. Rendimiento Bajo y Negativo en la Mayoría de las Fuentes:
    *   La mayoría de las fuentes, especialmente las fuentes 1, 2, 3, 4 y 5, muestran un ROMI consistentemente bajo e incluso negativo en varios meses. Esto sugiere que las campañas en estas fuentes están generando pérdidas en lugar de beneficios en los dispositivos táctiles, lo que indica un rendimiento subóptimo en estos canales.

2. La Excepción Notable: Fuente 10:
    *   La fuente 10 es una excepción destacada, con un ROMI relativamente alto en comparación con las otras fuentes. Aunque los primeros meses muestran valores más bajos, el ROMI aumenta considerablemente en los meses posteriores, indicando un potencial retorno positivo en dispositivos táctiles para esta fuente.

3. Rendimiento Volátil en la Fuente 9:
    *   La fuente 9 presenta una mezcla de resultados, con algunos periodos de alto ROMI (especialmente en los primeros meses de ciertas cohortes) seguidos de caídas significativas. Esto sugiere una alta volatilidad en el rendimiento de las campañas en esta fuente para dispositivos táctiles.

4. Estancamiento y Declive en el Tiempo:
    *   Un patrón común entre la mayoría de las fuentes es que el ROMI tiende a disminuir o mantenerse estancado con el tiempo, sin mostrar una recuperación significativa. Esto indica que las campañas no logran mejorar su efectividad en dispositivos táctiles a medida que pasa el tiempo, lo que podría ser un signo de saturación del mercado o de ineficiencias en la estrategia de marketing.

5. Comparación con Otros Dispositivos:
    *   En comparación con las métricas de ROMI para desktop y general, el rendimiento en dispositivos táctiles es considerablemente peor. Esto sugiere que las estrategias de marketing que funcionan en otros dispositivos no se traducen bien a los dispositivos táctiles, y podría ser necesario rediseñar las campañas para este segmento específico.

6. Recomendaciones:
    *   Reevaluar y optimizar las campañas en dispositivos táctiles para las fuentes 1, 2, 3, 4 y 5, ya que están generando un retorno negativo o bajo, lo que indica que los recursos pueden estar mejor invertidos en otros canales o en ajustar las estrategias actuales.
    *   Aumentar la inversión en la fuente 10 en dispositivos táctiles, dado su rendimiento relativamente superior, con la posibilidad de obtener un retorno positivo a largo plazo.
    *   Monitorear de cerca la fuente 9 debido a su volatilidad, y considerar estrategias de mitigación de riesgos, como la diversificación o el ajuste de la segmentación, para estabilizar el rendimiento.
    *   Rediseñar las campañas específicamente para dispositivos táctiles, enfocándose en las características únicas de estos dispositivos, como la usabilidad, la experiencia del usuario y los patrones de comportamiento, para intentar mejorar el ROMI en estos canales.

## Conclusiones

En conjunto, las `métricas de actividad de los asuarios` indican una base de usuarios leal y activa que interactúa regularmente con los servicios de la empresa. La estabilidad en las sesiones diarias y la duración promedio de las mismas refleja una experiencia de usuario efectiva. Sin embargo, la empresa podría explorar estrategias para aumentar el número de usuarios que utilizan los servicios de forma diaria, buscando convertir más usuarios semanales y mensuales en usuarios diarios. Esto podría mejorar aún más el compromiso y la retención a largo plazo.

Los datos sugieren que, aunque la empresa tiene un grupo pequeño pero comprometido de usuarios que regresan y realizan compras, hay un área significativa de mejora en la retención general y la conversión de usuarios en clientes recurrentes. Fomentar una mayor retención y mejorar la tasa de compra repetida debería ser una prioridad estratégica. Esto podría implicar mejoras en la experiencia de usuario, comunicación personalizada, incentivos para la repetición de compras, y análisis más profundo de los factores que impulsan el compromiso de los usuarios actuales.

Las fuentes de marketing con alta tasa de conversión deben ser priorizadas en las estrategias de marketing, mientras que las de baja conversión deberían ser revisadas o ajustadas. La mayoría de los usuarios se convierten rápidamente, pero una proporción significativa requiere más tiempo. Implementar estrategias para acelerar el proceso de conversión para los usuarios que tardan más tiempo y mantener el enfoque en las fuentes de marketing más efectivas son pasos clave para mejorar la eficiencia y efectividad en la conversión de usuarios.

En general, la empresa presenta una tendencia de disminución del LTV después del primer mes, con variabilidad significativa entre cohortes. Es crucial que se revisen las estrategias de retención y adquisición de usuarios para maximizar el LTV y asegurar el crecimiento sostenible a largo plazo.

En general, la empresa está invirtiendo fuertemente en ciertas fuentes de marketing, especialmente la fuente 3, mientras que otras fuentes reciben un menor enfoque. La tendencia de gasto ascendente hacia finales de 2017, seguida de una estabilización en 2018, sugiere una fase inicial de inversión intensiva seguida de un ajuste estratégico. Es crucial que la empresa continúe evaluando el rendimiento de estas inversiones para optimizar el uso de los recursos y maximizar los resultados.

La empresa tiene una mezcla de fuentes de marketing con variabilidad en su eficiencia de adquisición de clientes. El enfoque debería estar en optimizar la inversión en fuentes de alto costo y maximizar el retorno de aquellas que ya son más eficientes.

El rendimiento del ROMI varía considerablemente entre las diferentes fuentes de marketing. Algunas fuentes muestran un alto retorno inicial que tiende a disminuir con el tiempo, mientras que otras mantienen un rendimiento más consistente pero con menor retorno general. Esto indica la necesidad de ajustar y monitorear las estrategias de marketing según la fuente para maximizar el retorno.

Las campañas de marketing en dispositivos táctiles presentan un rendimiento generalmente bajo y, en muchos casos, negativo en la mayoría de las fuentes. La fuente 10 es una excepción, con un rendimiento relativamente mejor. Sin embargo, en general, se recomienda reevaluar y optimizar las campañas para mejorar el ROMI en estos dispositivos, ya que los resultados actuales indican ineficiencia y la posibilidad de obtener mejores retornos con un enfoque adaptado.

Este resumen sugiere que las estrategias de adquisición y marketing requieren ajustes específicos según la fuente y el dispositivo para mejorar la eficiencia y maximizar los retornos.

<div class="alert alert-block alert-success">
<b>Comentario del revisor</b> <a class="tocSkip"></a>
    
hicisste un excelente trabajo y tus conclusiones son muy completas! felicidades
</div>