# Visualización de Datos con Seaborn - Tabla `sales`

In [None]:
# Importar librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configurar estilo
sns.set(style='whitegrid')

In [None]:
# Cargar los datos limpios del análisis anterior
df = pd.read_csv('./output/ventas_limpias.csv')

# Convertir fechas al tipo datetime
df['orderdate'] = pd.to_datetime(df['orderdate'])
df['shippeddate'] = pd.to_datetime(df['shippeddate'])
df['requireddate'] = pd.to_datetime(df['requireddate'])

## 1. Ventas Totales por Estado del Pedido (`status`)

In [None]:
plt.figure(figsize=(10,6))
sns.countplot(data=df, x='status', order=df['status'].value_counts().index)
plt.title('Distribución de Estados de Pedidos')
plt.xticks(rotation=45)
plt.xlabel('Estado del Pedido')
plt.ylabel('Cantidad')
plt.tight_layout()
plt.show()

## 2. Top 10 Productos por Ventas Totales

In [None]:
# Calcular ventas por producto
ventas_por_producto = df.groupby('productcode')['sales_amount'].sum().sort_values(ascending=False).head(10)

plt.figure(figsize=(12,6))
sns.barplot(x=ventas_por_producto.values, y=ventas_por_producto.index, palette='viridis')
plt.title('Top 10 Productos por Ventas Totales')
plt.xlabel('Ventas Totales ($)')
plt.ylabel('Código de Producto')
plt.tight_layout()
plt.show()

## 3. Tendencia Mensual de Ventas

In [None]:
df['orderdate']

In [None]:
# Agrupar por mes
df_monthly = df.resample('ME', on='orderdate')['sales_amount'].sum().reset_index()

In [None]:

plt.figure(figsize=(12,6))
sns.lineplot(data=df_monthly, x='orderdate', y='sales_amount', marker='o')
plt.title('Tendencia Mensual de Ventas')
plt.xlabel('Fecha')
plt.ylabel('Ventas Totales ($)')
plt.grid(True)
plt.tight_layout()
plt.show()

## 4. Distribución de Precios Unitarios

In [None]:
plt.figure(figsize=(10,6))
sns.histplot(df['priceeach'], bins=30, kde=True, color='blue')
plt.title('Distribución de Precios Unitarios')
plt.xlabel('Precio ($)')
plt.ylabel('Frecuencia')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

## 5. Boxplot de Cantidad Vendida por Línea de Pedido

In [None]:
plt.figure(figsize=(10,6))
sns.boxplot(x=df['quantityordered'])
plt.title('Distribución de Cantidades Vendidas por Línea')
plt.xlabel('Cantidad Vendida')
plt.tight_layout()
plt.show()

## 6. Tiempo de Envío por Estado del Pedido

In [None]:
# Filtrar pedidos enviados
df_shipped = df[df['status'] == 'Shipped']

plt.figure(figsize=(12,6))
sns.barplot(data=df_shipped, x='status', y='days_to_ship', estimator=np.mean, errorbar=None, palette='muted', hue='status')
plt.title('Tiempo Promedio de Envío por Estado')
plt.xlabel('Estado del Pedido')
plt.ylabel('Días promedio hasta envío')
plt.grid(True, axis='y')
plt.tight_layout()
plt.show()

## 7. Relación entre Precio y Cantidad Vendida

In [None]:
plt.figure(figsize=(10,6))
sns.scatterplot(data=df, x='priceeach', y='quantityordered', alpha=0.6)
plt.title('Relación entre Precio y Cantidad Vendida')
plt.xlabel('Precio Unitario ($)')
plt.ylabel('Cantidad Vendida')
plt.grid(True)
plt.tight_layout()
plt.show()