# Análisis de Ventas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import os

## 1. Cargar el dataset

In [None]:
# La ruta es relativa al directorio /app en el contenedor
file_path = 'data/sales_data.csv'

if os.path.exists(file_path):
    df = pd.read_csv(file_path)
    print("Dataset cargado correctamente:")
    print(df)
else:
    print(f"Error: No se encontró el archivo en {file_path}")
    df = None

In [None]:
if df is not None:
    # --- 2. Preparación de datos ---
    # Convertir la columna 'date' a formato de fecha
    df['date'] = pd.to_datetime(df['date'])
    
    # Calcular las ventas totales por región
    sales_by_region = df.groupby('region')['sales'].sum().reset_index()
    print("\nVentas totales por región:")
    print(sales_by_region)
    
    # --- 3. Visualización de datos ---
    # Crear un gráfico de barras para las ventas por región
    plt.figure(figsize=(8, 6))
    plt.bar(sales_by_region['region'], sales_by_region['sales'], color=['skyblue', 'salmon'])
    plt.title('Ventas Totales por Región')
    plt.xlabel('Región')
    plt.ylabel('Ventas Totales')
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    
    # Guardar el gráfico
    plot_filename = 'sales_by_region.png'
    plt.savefig(plot_filename)
    print(f"\nGráfico guardado como '{plot_filename}'")
    
    plt.show()