# Descripción del proyecto
## Contexto

Eres analista en una gran tienda online. Junto con el departamento de marketing has recopilado una lista de hipótesis que pueden ayudar a aumentar los ingresos.

Tienes que priorizar estas hipótesis, lanzar un test A/B y analizar los resultados.

# Parte 1. Priorizar hipótesis


El archivo hypotheses_us.csv contiene nueve hipótesis sobre cómo aumentar los ingresos de una tienda online con Reach, Impact, Confidence y Effort especificados para cada una:

### Datos del archivo hypotheses_us.csv

- Hypotheses: breves descripciones de las hipótesis.
- Reach: alcance del usuario, en una escala del uno a diez.
- Impact: impacto en los usuarios, en una escala del uno al diez.
- Confidence: confianza en la hipótesis, en una escala del uno al diez.
- Effort: los recursos necesarios para probar una hipótesis, en una escala del uno al diez. Cuanto mayor sea el valor Effort, más recursos requiere la prueba

### Actividades:
1. Aplicar el framework ICE para priorizar hipótesis. Ordenarlas en orden descendente de prioridad.
2. Aplicar el framework RICE para priorizar hipótesis. Ordenarlas en orden descendente de prioridad.
3. Mostrar cómo cambia la priorización de hipótesis cuando utilizas RICE en lugar de ICE. Proporcionar una explicación de los cambios.

In [49]:
# Importamos las librerias
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

# Visualizamos la data 
hypothesis_data = pd.read_csv('Datasets/hypotheses_us.csv', sep = ';')
hypothesis_data.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9 entries, 0 to 8
Data columns (total 5 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   Hypothesis  9 non-null      object
 1   Reach       9 non-null      int64 
 2   Impact      9 non-null      int64 
 3   Confidence  9 non-null      int64 
 4   Effort      9 non-null      int64 
dtypes: int64(4), object(1)
memory usage: 492.0+ bytes


In [50]:
# Reiniciamos los índices para que el número de índice indique el número de hipótesis
hypothesis_data.reset_index(drop= True)
hypothesis_data.index = range(1, len(hypothesis_data) + 1)
hypothesis_data

Unnamed: 0,Hypothesis,Reach,Impact,Confidence,Effort
1,Add two new channels for attracting traffic. T...,3,10,8,6
2,Launch your own delivery service. This will sh...,2,5,4,10
3,Add product recommendation blocks to the store...,8,3,7,3
4,Change the category structure. This will incre...,8,3,3,8
5,Change the background color on the main page. ...,3,1,1,1
6,Add a customer review page. This will increase...,3,2,2,3
7,Show banners with current offers and sales on ...,5,3,8,3
8,Add a subscription form to all the main pages....,10,7,8,5
9,Launch a promotion that gives users discounts ...,1,9,9,5


### Conclusiones:
Para el paso de revisión de datos y limpieza vemos que todos tienen un formato correcto y lo único que hicimos fue separar los espacios donde había ';'.
Ahora podemos continuar a resolver los ejercicios.

### 1. Aplicar el framework ICE para priorizar hipótesis. Ordenarlas en orden descendente de prioridad.

In [54]:
hypothesis_data['ICE'] = ((hypothesis_data['Impact'] * hypothesis_data['Confidence']) / hypothesis_data['Effort']).round(2)

print(hypothesis_data[['Hypothesis', 'ICE']].sort_values(by= 'ICE', ascending= False))

                                          Hypothesis    ICE
9  Launch a promotion that gives users discounts ...  16.20
1  Add two new channels for attracting traffic. T...  13.33
8  Add a subscription form to all the main pages....  11.20
7  Show banners with current offers and sales on ...   8.00
3  Add product recommendation blocks to the store...   7.00
2  Launch your own delivery service. This will sh...   2.00
6  Add a customer review page. This will increase...   1.33
4  Change the category structure. This will incre...   1.12
5  Change the background color on the main page. ...   1.00


### Conclusiones:
Las ICE presenta las hipóteisis 9, 1 y 8 como las más prometedoras.

### 2. Aplicar el framework RICE para priorizar hipótesis. Ordenarlas en orden descendente de prioridad.

In [58]:
hypothesis_data['RISE'] = (hypothesis_data['Reach'] * hypothesis_data['Impact'] * hypothesis_data['Confidence']) / hypothesis_data['Effort']

print(hypothesis_data[['Hypothesis', 'RISE']].sort_values(by= 'RISE', ascending= False))

                                          Hypothesis   RISE
8  Add a subscription form to all the main pages....  112.0
3  Add product recommendation blocks to the store...   56.0
1  Add two new channels for attracting traffic. T...   40.0
7  Show banners with current offers and sales on ...   40.0
9  Launch a promotion that gives users discounts ...   16.2
4  Change the category structure. This will incre...    9.0
2  Launch your own delivery service. This will sh...    4.0
6  Add a customer review page. This will increase...    4.0
5  Change the background color on the main page. ...    3.0


### Conclusión 
El RICE nos arroja un resultado un poco diferente, nos dice que las hipótesis más prometedoras son la 8, 3 y 1.

### 3. Mostrar cómo cambia la priorización de hipótesis cuando utilizas RICE en lugar de ICE. Proporcionar una explicación de los cambios.

In [60]:
hypothesis_data

Unnamed: 0,Hypothesis,Reach,Impact,Confidence,Effort,ICE,RISE
1,Add two new channels for attracting traffic. T...,3,10,8,6,13.33,40.0
2,Launch your own delivery service. This will sh...,2,5,4,10,2.0,4.0
3,Add product recommendation blocks to the store...,8,3,7,3,7.0,56.0
4,Change the category structure. This will incre...,8,3,3,8,1.12,9.0
5,Change the background color on the main page. ...,3,1,1,1,1.0,3.0
6,Add a customer review page. This will increase...,3,2,2,3,1.33,4.0
7,Show banners with current offers and sales on ...,5,3,8,3,8.0,40.0
8,Add a subscription form to all the main pages....,10,7,8,5,11.2,112.0
9,Launch a promotion that gives users discounts ...,1,9,9,5,16.2,16.2


### Conclusión:
Al utilizar RISE podemos obtener una decisión más estratégica, más detallada y precisa, aunqué toma más tiempo realizarla porque utiliza 4 parámetros (Alcance, Impacto, Confianza y Esfuerzo) en vez de 3 (Impacto, Confianza y Esfuerzo) como ICE, eso la hace más confiable. 
Entonces, si tenemos el tiempo y los recuersos para realizar RICE es la mejor opción para priorizar las hipótesis, si queremos rápidez es mejor utilizar ICE.

# Parte 2. Análisis del test A/B

Realizaste una prueba A/B y obtuviste los resultados descritos en los archivos orders_us.csv y visits_us.csv.

### Datos del archivo orders_us.csv:

- transactionId: identificador de pedido.
- visitorId: identificador del usuario que realizó el pedido.
- date: fecha del pedido.
- revenue: ingresos del pedido.
- group: el grupo del test A/B al que pertenece el usuario.

### Datos del archivo visits_us.csv:

- date: la fecha.
- group: grupo de la prueba A/B.
- visits: el número de visitas en la fecha especificada en el grupo de pruebas A/B especificado.