# Ejercicio Práctico: Análisis de Pedidos de Delivery

En este ejercicio, llevarás a cabo un análisis de un conjunto de datos que contiene información sobre pedidos de socios falsos dentro de una aplicación de delivery. 
Los socios falsos son tiendas que no están integradas directamente con la plataforma, y el equipo de contenido gestiona su catálogo de productos y precios. 
El objetivo de este análisis es descubrir discrepancias en los pedidos y ayudar en la transición a un nuevo modelo de autorización y captura.

## 1. Descripción del Conjunto de Datos
Familiarízate con las columnas del conjunto de datos que vas a analizar. 
Los nombres de las columnas actuales son confusos, así que procederemos a renombrarlas para que sean más descriptivas. 
Utiliza los siguientes nombres de columnas:

- `order_id`: Identificador único para cada pedido.
- `activation_time_local`: Hora local cuando se activó el pedido.
- `country_code`: Código de país para el pedido.
- `store_address`: Dirección de la tienda.
- `final_status`: Estado final del pedido.
- `payment_status`: Estado de pago del pedido.
- `products`: Número de productos en el pedido.
- `products_total`: Monto total en el momento de la compra en euros (€).
- `purchase_total_price`: Monto que el mensajero pagó en la tienda en euros (€).


In [14]:
import pandas as pd
df = pd.read_csv("datasets/fake_orders_test.csv")
df.columns = ['order_id', 'activation_time_local', 'country_code', 'store_address', 'final_status', 'payment_status', 'products', 'products_total', 'purchase_total_price']
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 60399 entries, 0 to 60398
Data columns (total 9 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   order_id               60399 non-null  int64  
 1   activation_time_local  60399 non-null  object 
 2   country_code           60399 non-null  object 
 3   store_address          60399 non-null  int64  
 4   final_status           60399 non-null  object 
 5   payment_status         60399 non-null  object 
 6   products               60399 non-null  int64  
 7   products_total         60399 non-null  float64
 8   purchase_total_price   60399 non-null  float64
dtypes: float64(2), int64(3), object(4)
memory usage: 4.1+ MB


## 2. Contexto del Análisis
Los pedidos de socios falsos pueden mostrar discrepancias entre el `products_total` y el `purchase_total_price`. 
Cuando `products_total` es menor que `purchase_total_price`, clasificamos estos pedidos como "no autorizados suficientemente". 
Tu tarea será investigar estas discrepancias y responder a preguntas clave sobre los pedidos.

## 3. Actividades a Realizar

### Carga y Preprocesamiento
1. **Carga de Datos**: Carga el conjunto de datos en un DataFrame y renombra las columnas según la lista proporcionada.

### Análisis Exploratorio
2. **Porcentaje de Pedidos No Autorizados**: Calcula el porcentaje de pedidos que no están suficientemente autorizados (donde `products_total < purchase_total_price`).

3. **Autorización Incremental**: Determina el porcentaje de pedidos que serían correctamente autorizados si se aplicara un incremento del 20% sobre el `products_total`.

4. **Análisis por País**: Utiliza `country_code` para analizar si hay diferencias en los porcentajes anteriores desglosados por país.

5. **Valores Faltantes**: Para los pedidos que no cumplen con la autorización, calcula qué valores adicionales serían necesarios para capturar el monto restante (`purchase_total_price - products_total`).

6. **Tiendas Problemáticas**: Identifica las tiendas que tienen más problemas en términos de número de pedidos y su valor monetario utilizando la dirección de la tienda (`store_address`).

7. **Correlación de Cancelaciones**: Para los pedidos no autorizados suficientemente, investiga si existe una correlación entre la diferencia de precios (`purchase_total_price - products_total`) y las cancelaciones de pedidos (verifica la columna `final_status`).

## 4. Técnicas de Análisis
Durante tu análisis, considera aplicar las siguientes técnicas:

### Subconjuntos
- **Selección de Columnas**: Selecciona columnas específicas para análisis como `products_total` y `purchase_total_price`.

### Agregaciones
- **Groupby**: Realiza agregaciones basadas en `country_code`, calculando la media de `products_total` y el máximo de `purchase_total_price`.

- **Tablas Pivote**: Crea una tabla pivote que muestre el promedio de `products_total` por `country_code`.

- **Tabulaciones Cruzadas**: Calcula una tabla de frecuencias cruzadas para analizar la relación entre `payment_status` y `final_status`.

## 5. Unión, Merge & Concatenación
Al finalizar tu análisis, aplica las siguientes técnicas para combinar y consolidar los resultados obtenidos:

- **Subtablas**: Crea DataFrames a partir de subtablas o agrupaciones de datos.
  - Por ejemplo, genera un DataFrame que contenga solo los pedidos no autorizados suficientemente y otro que contenga solo pedidos de un país específico.

- **Operaciones de Agrupación**: 
  - Realiza operaciones como `mean`, `sum`, y `count` sobre las subtablas creadas para obtener insights adicionales sobre los pedidos.
  - Por ejemplo, agrupa los pedidos por `country_code` y calcula el total de `products_total` por país.

- **Concatenación de Resultados**: Si has realizado varios análisis, considera concatenar los resultados en un solo DataFrame para una revisión más sencilla.
  - Usa `pd.concat()` para combinar DataFrames obtenidos de diferentes análisis, asegurándote de que tengan la misma estructura.

- **Merge de Resultados**: Si has creado DataFrames de análisis distintos, puedes combinarlos basándote en columnas comunes.
  - Por ejemplo, si tienes un DataFrame que contiene el total de pedidos por tienda y otro con el total de ingresos por tienda, puedes hacer un merge para tener un análisis más completo.
  - `merged_df = pd.merge(df1, df2, on='store_address')`

- **Join de Resultados**: Para combinar DataFrames basados en sus índices, utiliza `join()`.
  - Por ejemplo, si tienes un DataFrame con información adicional sobre los estados de pago, puedes unirlo con el DataFrame principal.
  - `joined_df = df1.join(df2.set_index('order_id'), on='order_id', how='inner')`

Al final de este ejercicio, deberías haber obtenido insights significativos sobre las fluctuaciones de precios en pedidos pasados 
y haber evaluado el riesgo asociado con la transición a un nuevo modelo de autorización. 
Recuerda documentar tus hallazgos a lo largo del análisis.