# 📊 Análisis de Ventas - Plataforma Retail

Este notebook explora las ventas enriquecidas generadas por el pipeline ETL del proyecto `cloud-retail-data-platform`.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Cargar datos procesados
df = pd.read_csv('../data/processed/sales_enriched.csv')
df['sale_date'] = pd.to_datetime(df['sale_date'])
df.head()

## 🏬 Ventas totales por tienda

In [None]:
ventas_por_tienda = df.groupby('store_name')['total_value'].sum().sort_values(ascending=False)
ventas_por_tienda.plot(kind='bar', figsize=(10,6), title='Ventas por Tienda', ylabel='Total €', xlabel='Tienda')
plt.tight_layout()
plt.show()

## 📦 Productos más vendidos (por unidades)

In [None]:
productos_top = df.groupby('product_name')['quantity'].sum().sort_values(ascending=False).head(10)
productos_top.plot(kind='barh', figsize=(10,6), title='Top 10 Productos más vendidos')
plt.xlabel('Unidades vendidas')
plt.tight_layout()
plt.show()

## 💶 Valor medio del ticket por cliente

In [None]:
ticket_cliente = df.groupby('client_id')['total_value'].sum()
print("Valor medio del ticket por cliente: €", round(ticket_cliente.mean(), 2))