# Exploración inicial de ventas

Este notebook realiza una exploración de las ventas mensuales totales (2019–2025) usando el archivo de datos exportado de SAP.

In [None]:

import pandas as pd
import matplotlib.pyplot as plt

# Configuración de gráficos en notebooks
%matplotlib inline


## Cargar archivo de datos

In [None]:

# Cargar el archivo de ventas desde la carpeta data/raw/
file_path = "../data/raw/EXPORT_20251001_134920.xlsx"

df = pd.read_excel(file_path, sheet_name="Data")
df.head()


## Preprocesamiento de datos

In [None]:

# Nos quedamos con columnas relevantes: Fecha y Cantidad
df = df[["Fecha contabiliz.", "Cantidad"]].copy()

# Convertir cantidades negativas en positivas (ventas)
df["Cantidad"] = df["Cantidad"].abs()

# Asegurar que la fecha es tipo datetime
df["Fecha contabiliz."] = pd.to_datetime(df["Fecha contabiliz."])

df.head()


## Agregación mensual de ventas

In [None]:

# Agrupar ventas por mes
ventas_mensuales = df.groupby(pd.Grouper(key="Fecha contabiliz.", freq="M"))["Cantidad"].sum().reset_index()

ventas_mensuales.head()


## Gráfico de ventas mensuales

In [None]:

plt.figure(figsize=(12,6))
plt.plot(ventas_mensuales["Fecha contabiliz."], ventas_mensuales["Cantidad"], marker="o")
plt.title("Ventas mensuales totales (2019–2025)")
plt.xlabel("Fecha")
plt.ylabel("Unidades vendidas")
plt.grid(True)

# Guardar gráfico en carpeta results/figures/
plt.savefig("../results/figures/ventas_mensuales.png")
plt.show()


## Estadísticos básicos

In [None]:

ventas_mensuales.describe()
