In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime
import matplotlib.gridspec as gridspec

# Configuración del estilo para los gráficos
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette("husl")


# Leer el archivo CSV
df = pd.read_csv('Chocolate Sales.csv')

df.describe()

# Preparación de datos
# Convertir 'Date' a formato datetime
df['Date'] = pd.to_datetime(df['Date'])

# Convertir 'Amount' a numérico (remover cualquier símbolo de moneda si existe)
df['Amount'] = df['Amount'].str.replace('$', '').str.replace(',', '').astype(float)

# Cálculo de KPIs principales
kpi1_total_ventas = df['Amount'].sum()
kpi2_promedio_cajas = df['Boxes Shipped'].mean()

# # Crear el dashboard con 3 diagramas y 2 KPIs
# fig = plt.figure(figsize=(16, 10))
# gs = gridspec.GridSpec(3, 3, width_ratios=[1, 1, 1], height_ratios=[0.5, 1.5, 1.5])

# # -------------------- KPI Section --------------------
# ax_kpi = fig.add_subplot(gs[0, :])
# ax_kpi.axis('off')

# # KPI 1: Total de Ventas
# ax_kpi.text(0.2, 0.5, 'Total de Ventas', fontsize=14, ha='center', va='center', fontweight='bold')
# ax_kpi.text(0.2, 0.2, f'${kpi1_total_ventas:,.2f}', fontsize=18, ha='center', va='center', color='green')

# # KPI 2: Promedio de Cajas por Envío
# ax_kpi.text(0.8, 0.5, 'Promedio Cajas/Envío', fontsize=14, ha='center', va='center', fontweight='bold')
# ax_kpi.text(0.8, 0.2, f'{kpi2_promedio_cajas:.1f}', fontsize=18, ha='center', va='center', color='blue')

# # -------------------- Gráfico 1: Ventas por País --------------------
# ax1 = fig.add_subplot(gs[1, 0])
# ventas_por_pais = df.groupby('Country')['Amount'].sum().sort_values(ascending=True).tail(10)
# ventas_por_pais.plot(kind='barh', ax=ax1, color='skyblue')
# ax1.set_title('Top 10 Países por Ventas', fontsize=12, fontweight='bold')
# ax1.set_xlabel('Ventas Totales ($)')
# ax1.set_ylabel('País')

# # -------------------- Gráfico 2: Tendencia Mensual de Ventas --------------------
# ax2 = fig.add_subplot(gs[1, 1:])
# df['YearMonth'] = df['Date'].dt.to_period('M')
# ventas_mensuales = df.groupby('YearMonth')['Amount'].sum()
# ventas_mensuales.index = ventas_mensuales.index.astype(str)
# ax2.plot(range(len(ventas_mensuales)), ventas_mensuales.values, marker='o', linewidth=2, color='red')
# ax2.set_title('Tendencia Mensual de Ventas', fontsize=12, fontweight='bold')
# ax2.set_xlabel('Mes')
# ax2.set_ylabel('Ventas ($)')
# ax2.set_xticks(range(0, len(ventas_mensuales), max(1, len(ventas_mensuales)//12)))
# ax2.set_xticklabels(ventas_mensuales.index[::max(1, len(ventas_mensuales)//12)], rotation=45)
# ax2.grid(True, alpha=0.3)

# # -------------------- Gráfico 3: Top 10 Vendedores --------------------
# ax3 = fig.add_subplot(gs[2, :])
# top_vendedores = df.groupby('Sales Person')['Amount'].sum().sort_values(ascending=False).head(10)
# bars = ax3.bar(range(len(top_vendedores)), top_vendedores.values, color='lightgreen')
# ax3.set_title('Top 10 Vendedores por Volumen de Ventas', fontsize=12, fontweight='bold')
# ax3.set_xlabel('Vendedor')
# ax3.set_ylabel('Ventas Totales ($)')
# ax3.set_xticks(range(len(top_vendedores)))
# ax3.set_xticklabels(top_vendedores.index, rotation=45, ha='right')

# # Agregar etiquetas de valor a las barras
# for i, bar in enumerate(bars):
#     height = bar.get_height()
#     ax3.text(bar.get_x() + bar.get_width()/2., height,
#              f'${height:,.0f}',
#              ha='center', va='bottom')

# # Ajustar el diseño
# plt.tight_layout()
# plt.subplots_adjust(top=0.95, bottom=0.08, hspace=0.4)

# # Título general del dashboard
# fig.suptitle('Dashboard de Análisis de Ventas de Chocolate', fontsize=16, fontweight='bold', y=0.98)

# # Mostrar el dashboard
# plt.show()

# -------------------- Análisis Adicional --------------------
# Imprimir un resumen adicional de los datos
print("\n=== RESUMEN DEL ANÁLISIS ===")
print(f"Período de datos: {df['Date'].min().strftime('%Y-%m-%d')} a {df['Date'].max().strftime('%Y-%m-%d')}")
print(f"Total de transacciones: {len(df)}")
print(f"Número de vendedores: {df['Sales Person'].nunique()}")
print(f"Número de países: {df['Country'].nunique()}")
print(f"Número de productos: {df['Product'].nunique()}")
print(f"\nTop 3 productos por ventas:")
top_productos = df.groupby('Product')['Amount'].sum().sort_values(ascending=False).head(3)
for i, (producto, venta) in enumerate(top_productos.items(), 1):
    print(f"{i}. {producto}: ${venta:,.2f}")

  df['Date'] = pd.to_datetime(df['Date'])
