# Proyecto Marketing Con A/B Test


## Introduccion

En el entorno altamente competitivo del comercio electrónico, identificar estrategias efectivas para aumentar los ingresos es esencial. Como analista de una gran tienda online, se ha trabajado en colaboración con el departamento de marketing para desarrollar una serie de hipótesis orientadas a mejorar el desempeño del negocio. Estas hipótesis abordan diferentes aspectos del embudo de conversión, la experiencia del usuario y el comportamiento de compra.

Para tomar decisiones fundamentadas, es necesario evaluar y priorizar estas hipótesis en función de su impacto potencial, facilidad de implementación y confianza en su éxito. Posteriormente, se llevará a cabo un experimento controlado A/B para validar la efectividad de una de las hipótesis seleccionadas, utilizando datos reales de comportamiento de los usuarios.

## Objetivo General

Priorizar estratégicamente un conjunto de hipótesis de marketing mediante marcos analíticos y ejecutar un experimento A/B controlado con el fin de identificar cambios que generen un incremento significativo en los ingresos de la tienda online.

## Descripcion de los Datos 
``/datasets/hypotheses_us.csv``:

- Hypotheses: breves descripciones de las hipótesis.
- Reach: alcance del usuario, en una escala del uno a diez.
- Impact: impacto en los usuarios, en una escala del uno al diez.
- Confidence: confianza en la hipótesis, en una escala del uno al diez.
- Effort: los recursos necesarios para probar una hipótesis, en una escala del uno al diez. Cuanto mayor sea el valor Effort, más recursos requiere la prueba.

``/datasets/orders_us.csv``:

- transactionId: identificador de pedido.
- visitorId: identificador del usuario que realizó el pedido.
- date: fecha del pedido.
- revenue: ingresos del pedido.
- group: el grupo del test A/B al que pertenece el usuario.

``/datasets/visits_us.csv``:

- date: la fecha.
- group: grupo de la prueba A/B.
- visits: el número de visitas en la fecha especificada en el grupo de pruebas A/B especificado.

In [97]:
# Cargar todas las librerias
import pandas as pd 
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

In [98]:
# Designar las variables de los Dataframe 

hypotheses=pd.read_csv('/Users/ASUS/OneDrive/Documentos/Tripleten/Proyecto spring 10/hypotheses_us.csv', sep=';')
orders=pd.read_csv('/Users/ASUS/OneDrive/Documentos/Tripleten/Proyecto spring 10/orders_us_export.csv', sep=',')
visits=pd.read_csv('/Users/ASUS/OneDrive/Documentos/Tripleten/Proyecto spring 10/visits_us_export.csv', sep=',')


## Nombres asignados a los DataFrames

Para garantizar un desarrollo estructurado y eficiente del proyecto, se asignaron nombres descriptivos a los *DataFrames* generados a partir de las consultas a los servidores. Esta práctica permite mantener un flujo de trabajo organizado y facilita la interpretación de los resultados en las distintas etapas del análisis. Las asignaciones realizadas son las siguientes:

- `hypotheses`: corresponde al resultado de la consulta ``hypotheses_us``.
- `orders`: corresponde al resultado de la consulta `orders_us_export`.
- `visits`: corresponde al resultado de la consulta `visits_us_export`.

A continuación, el análisis exploratorio de los datos.

In [99]:
# Visualizacion preliminar de los dataframes:

hypotheses.info()
print(hypotheses)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9 entries, 0 to 8
Data columns (total 5 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   Hypothesis  9 non-null      object
 1   Reach       9 non-null      int64 
 2   Impact      9 non-null      int64 
 3   Confidence  9 non-null      int64 
 4   Effort      9 non-null      int64 
dtypes: int64(4), object(1)
memory usage: 492.0+ bytes
                                          Hypothesis  Reach  Impact  \
0  Add two new channels for attracting traffic. T...      3      10   
1  Launch your own delivery service. This will sh...      2       5   
2  Add product recommendation blocks to the store...      8       3   
3  Change the category structure. This will incre...      8       3   
4  Change the background color on the main page. ...      3       1   
5  Add a customer review page. This will increase...      3       2   
6  Show banners with current offers and sales on ...      5       3 

In [100]:
# Visualizacion preliminar de los dataframes:

orders.info()
print( orders.sample(n=5))

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1197 entries, 0 to 1196
Data columns (total 5 columns):
 #   Column         Non-Null Count  Dtype  
---  ------         --------------  -----  
 0   transactionId  1197 non-null   int64  
 1   visitorId      1197 non-null   int64  
 2   date           1197 non-null   object 
 3   revenue        1197 non-null   float64
 4   group          1197 non-null   object 
dtypes: float64(1), int64(2), object(2)
memory usage: 46.9+ KB
      transactionId   visitorId        date  revenue group
476       457171476  1377447894  2019-08-28      5.6     B
525      3031564664   393266494  2019-08-19    335.5     A
5         182168103   935554773  2019-08-15     35.0     B
497       246848596  3951559397  2019-08-29     40.3     A
1042      265631116  3656415546  2019-08-11      5.8     B


In [101]:
# Visualizacion preliminar de los dataframes:

visits.info()
print(visits.sample(n=5))

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 62 entries, 0 to 61
Data columns (total 3 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   date    62 non-null     object
 1   group   62 non-null     object
 2   visits  62 non-null     int64 
dtypes: int64(1), object(2)
memory usage: 1.6+ KB
          date group  visits
40  2019-08-10     B     369
23  2019-08-24     A     395
5   2019-08-06     A     667
53  2019-08-23     B     546
8   2019-08-09     A     617
