[![img/pythonista.png](img/pythonista.png)](https://www.pythonista.io)

# Window Functions (Funciones de Ventana).

In [None]:
import pandas as pd
import numpy as np
from datetime import datetime
from IPython.display import display


Las funciones de ventana (window functions) permiten realizar cálculos sobre **rangos dinámicos de filas** en un *dataframe*, manteniendo el contexto original.

Estas funciones son útiles para realizar operaciones como:
- Cálculo de medias móviles.
- Cálculo de sumas acumulativas.
- Cálculo de diferencias entre filas.
- Cálculo de estadísticas móviles.

https://pandas.pydata.org/docs/user_guide/window.html

## *Dataframe* ilustrativo.

* La siguiente celda creará al dataframe ```facturas``` con la estructura de columnas:

 * ```'folio'```.
 * ```'sucursal'```.
 * ```'monto'```.
 * ```'fecha'```.
 * ```'cliente'```.

In [None]:
facturas = pd.DataFrame({'folio':(15234, 
                      15235, 
                      15236, 
                      15237, 
                      15238, 
                      15239, 
                      15240,
                      15241,
                      15242),
             'sucursal':('CDMX01',
                         'MTY01',
                         'CDMX02',
                         'CDMX02',
                         'MTY01',
                         'GDL01',
                         'CDMX02',
                         'MTY01',
                         'GDL01'),
             'monto':(1420.00,
                     1532.00,
                     890.00,
                     1300.00,
                     3121.47,
                     1100.5,
                     12230,
                     230.85,
                     1569),
             'fecha':(datetime(2019,3,11,17,24),
                     datetime(2019,3,24,14,46),
                     datetime(2019,3,25,17,58),
                     datetime(2019,3,27,13,11),
                     datetime(2019,3,31,10,25),
                     datetime(2019,4,1,18,32),
                     datetime(2019,4,3,11,43),
                     datetime(2019,4,4,16,55),
                     datetime(2019,4,5,12,59)),
            'cliente':(19234,
                       19232,
                       19235,
                       19233,
                       19236,
                       19237,
                       19232,
                       19233,
                       19232)
                        })

In [None]:
facturas

## El método ```df.rolling()```.

El método ```df.rolling()``` permite realizar cálculos sobre una ventana móvil de tamaño fijo. Por ejemplo, si deseas calcular la media móvil de los montos de las facturas con una ventana de 3 filas, puedes usar el siguiente código:

```
df.rolling(window=<n>, on=<col>).<método>()
```
Donde:
* `<n>` es el tamaño de la ventana (en este caso, 3).
* `<col>` es la columna sobre la cual deseas aplicar la función de ventana.
* `<método>` es el método de agregación que deseas aplicar (por ejemplo, `mean`, `sum`, `max`, etc.).

La documenttación de `df.rolling()` se encuentra en: 

https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.rolling.html


**Ejemplo:**

* La siguiente celda calculará la media móvil de los montos de las facturas con una ventana de 3 filas y la agregará como una nueva columna llamada ```'monto_rolling_mean'``` al dataframe ```facturas```.

In [None]:
facturas["rolling_media"] =facturas.rolling(window=3)["monto"].mean()
facturas

## El método `df.expanding()`.

El método `df.expanding()` permite realizar cálculos acumulativos desde el inicio hasta la fila actual. Por ejemplo, si deseas calcular la suma acumulativa de los montos de las facturas, puedes usar el siguiente código:

```df.expanding()[<col>].<método>()
```
Donde:
* `<col>` es la columna sobre la cual deseas aplicar la función de ventana.
* `<método>` es el método de agregación que deseas aplicar (por ejemplo, `mean`, `sum`, `max`, etc.).   

**Ejemplo:**

* La siguiente celda calculará la suma acumulativa de los montos de las facturas y la agregará como una nueva columna llamada ```'monto_expanding_sum'``` al dataframe ```facturas```.

In [None]:
facturas["monto_expanding_sum"] = facturas.expanding()["monto"].sum()
facturas

### Tabla sintética para funciones de ventana.

In [None]:
fechas = pd.date_range('2019-01-01', '2019-12-31', freq='D')
fechas

In [None]:
ventas_diarias = pd.DataFrame({'fechas': fechas, 'ventas': np.random.randint(1000, 5000, size=len(fechas))})
ventas_diarias

In [None]:
ventas_diarias["semana"] = ventas_diarias["fechas"].dt.isocalendar().week
ventas_diarias

In [None]:
ventas_diarias["semana"] = ventas_diarias["semana"].mask((ventas_diarias["semana"] == 1) & (ventas_diarias["fechas"] >= "2019-12-01"), 53)
ventas_diarias

In [None]:
ventas_diarias["dias_semana"] = ventas_diarias["fechas"].dt.day_name()
ventas_diarias

In [None]:
ventas_diarias.info()

In [None]:
ventas_diarias.groupby("semana")["ventas"].rolling(window=4).mean()

In [None]:
ventas_diarias

### Agrupación por categorías y funciones de ventana.

In [None]:
promedio_semanal = ventas_diarias.groupby("semana")["ventas"].shift(1).rolling(window=4).mean()
promedio_semanal

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2017-2026.</p>