In [3]:
import pandas as pd
import numpy as np
import locale

## Carga el DataFrame desde un archivo Excel

In [4]:
df = pd.read_excel("../data/ventas.xlsx")

## Utiliza df.melt() para transformar el DataFrame de un formato ancho a un formato largo. Asegúrate de mantener la columna rama como identificador, nombrar la columna de variables como "periodo" y la de valores como "facturacion".

In [5]:
df = df.melt(id_vars=["rama"], var_name="periodo", value_name="facturacion")

## Extrae el año y mes del nombre de la columna "periodo" utilizando expresiones regulares.

In [6]:
df["periodo"] = df["periodo"].str.extract(r"(\d{2}\d{2}$)", expand=True)

## Convierte los valores de "periodo" a objetos datetime utilizando el formato adecuado para año y mes

In [7]:
df["periodo"] = pd.to_datetime(df["periodo"], format="%m%y")

## Calcula el último periodo de tiempo disponible en el DataFrame.
## Luego, marca los registros de los últimos tres meses como provisionales, crea una columna "provisional"

In [8]:
ultimo_periodo = df["periodo"].max()
periodo_ultimo_tres_meses = ultimo_periodo - pd.DateOffset(months=3)
df["provisional"] = np.where(
    (df["periodo"] >= periodo_ultimo_tres_meses) & (df["periodo"] <= ultimo_periodo),
    "p",
    "",
)

1. Extrae el año y el mes del periodo para su uso en cálculos futuros.
2. Configura el entorno local a "es_ES.UTF-8" para asegurar que los meses se presenten en español.
3. Formatea el campo "mes" para que el nombre del mes esté en español y con la primera letra en mayúscula.

In [9]:
df["anio"] = df["periodo"].dt.year

In [10]:
df["orden_mes"] = df["periodo"].dt.month

In [11]:
locale.setlocale(locale.LC_ALL, "es_ES.UTF-8")
df["mes"] = df["periodo"].dt.strftime("%B").str.capitalize()

## Calcula la variación interanual e intermensual de la facturación

In [12]:
df["last_year_value"] = df.groupby("rama")["facturacion"].shift(12)
df["variacion_interanual"] = (
    (df["facturacion"] - df["last_year_value"]) / df["last_year_value"]
) * 100

In [13]:
df["last_month_value"] = df.groupby("rama")["facturacion"].shift(1)
df["variacion_intermensual"] = (
    (df["facturacion"] - df["last_month_value"]) / df["last_month_value"]
) * 100

## Calcula la media de la facturación anual y compárala con el año anterior

In [14]:
df["media_anio"] = (
    df.groupby(["rama", "anio"])["facturacion"].cumsum() / df["orden_mes"]
)
df["media_anio_anterior"] = df.groupby("rama")["media_anio"].shift(12)
df["var_media_va_anio"] = (df["media_anio"] / df["media_anio_anterior"] - 1) * 100

## Transforma nuevamente el DataFrame a un formato largo que incluya las medidas calculadas en los pasos anteriores.

In [15]:
df = pd.melt(
    df,
    id_vars=["provisional", "rama", "anio", "orden_mes", "mes"],
    value_vars=[
        "facturacion",
        "variacion_interanual",
        "variacion_intermensual",
        "var_media_va_anio",
    ],
    var_name="medida",
    value_name="valor",
)

## Renombra las columnas de medidas para que sean más descriptivas.

In [16]:
cambio_nombre = {
    "facturacion": "Facturación (Miles de €)",
    "variacion_intermensual": "Variación intermensual (%)",
    "variacion_interanual": "Variación interanual (%)",
    "var_media_va_anio": "Variación de la media en lo que va de año (%)",
}

## Define y aplica un orden específico para las medidas utilizando una columna "orden_medida"

In [17]:
df["medida"] = df["medida"].replace(cambio_nombre)

In [18]:
orden_medida = {
    "Índice": 1,
    "Variación intermensual (%)": 2,
    "Variación interanual (%)": 3,
    "Variación de la media en lo que va de año (%)": 4,
}

In [19]:
df["orden_medida"] = df["medida"].map(orden_medida)

## Exporta el DataFrame transformado a un archivo CSV 

In [21]:
df.to_csv("../data/resultados.csv", sep="\t", encoding="utf-8", index=False)