# Tarea 7: Recomendación de productos y experiencia de compra. 

Este notebook guía a los estudiantes a través de un análisis de datos de transacciones de e-commerce, utilizando el dataset "Online Retail II".

## Objetivo del Ejemplo
- Demostrar técnicas de análisis exploratorio de datos (EDA).
- Mostrar cómo limpiar y visualizar datos de transacciones.
- Proveer ejemplos prácticos para responder preguntas clave de negocio.



## Dataset Utilizado

Usaremos el dataset **"Online Retail II"**, que contiene transacciones de una tienda de e-commerce. Este dataset incluye información como:
- **InvoiceNo**: Número de factura.
- **StockCode**: Código del producto.
- **Description**: Descripción del producto.
- **Quantity**: Cantidad comprada.
- **InvoiceDate**: Fecha de la transacción.
- **UnitPrice**: Precio unitario.
- **CustomerID**: Identificador del cliente.
- **Country**: País del cliente.

Puedes descargar el dataset desde [Online Retail II](https://archive.ics.uci.edu/ml/datasets/Online+Retail+II).



## 1. Carga y Limpieza de los Datos

Comenzaremos cargando el dataset y realizando la limpieza necesaria para garantizar que los datos sean utilizables.


In [None]:

import pandas as pd

# Carga del dataset
data = pd.read_csv('Online_Retail.csv')

# Vista inicial de los datos
data.head()



### Limpieza de los Datos

1. Identificar valores faltantes y decidir cómo manejarlos.
2. Filtrar transacciones con valores negativos o nulos.
3. Asegurar que las columnas tengan los tipos de datos correctos.


In [None]:

# Identificar valores faltantes
data.isnull().sum()

# Eliminar filas con valores faltantes
data = data.dropna()

# Filtrar valores negativos o nulos en Quantity y UnitPrice
data = data[(data['Quantity'] > 0) & (data['UnitPrice'] > 0)]

# Asegurar tipos de datos correctos
data['InvoiceDate'] = pd.to_datetime(data['InvoiceDate'])
data.info()



## 2. Análisis Exploratorio de Datos (EDA)

### Preguntas Clave a Responder
1. ¿Cuáles son los productos más vendidos?
2. ¿Qué países generan más ingresos?
3. ¿Existen patrones estacionales en las ventas?


In [None]:

# Productos más vendidos
top_products = data.groupby('Description')['Quantity'].sum().sort_values(ascending=False).head(10)
top_products.plot(kind='bar', title='Top 10 Productos Más Vendidos', figsize=(10, 5))


In [None]:

# Países con más ingresos
data['Revenue'] = data['Quantity'] * data['UnitPrice']
top_countries = data.groupby('Country')['Revenue'].sum().sort_values(ascending=False).head(10)
top_countries.plot(kind='bar', title='Top 10 Países por Ingreso', figsize=(10, 5))



### Visualización de Estacionalidad

Exploraremos las ventas a lo largo del tiempo para identificar posibles patrones estacionales.


In [None]:

# Ventas mensuales
data['Month'] = data['InvoiceDate'].dt.to_period('M')
monthly_sales = data.groupby('Month')['Revenue'].sum()
monthly_sales.plot(kind='line', title='Ventas Mensuales', figsize=(12, 6))



## 3. Conclusiones y Recomendaciones

Con base en los insights obtenidos:
1. **Productos más vendidos**: Aumentar inventario y promociones para los productos con mayor demanda.
2. **Segmentación por país**: Dirigir estrategias de marketing a los países que generan mayores ingresos.
3. **Estacionalidad**: Aprovechar los picos de venta en temporadas específicas mediante campañas dirigidas.


# Requerimientos Entregables

1. Un reporte en formato PDF que contenga:
    * Respuestas organizadas por secciones.
    * Capturas de pantalla o gráficos para apoyar los cálculos y análisis, si es necesario.
2. Código fuente en Python en formato Jupyter Notebook (.ipynb).
3. Gráficos relevantes (como curva ROC, importancia de características) exportados en alta calidad.