[Enlace](https://machinelearningmastery.com/xgboost-for-time-series-forecasting/)

In [2]:
import numpy as np
import pandas as pd
from sklearn.metrics import mean_absolute_error
from xgboost import XGBRegressor
import matplotlib.pyplot as plt

## Time series data preparation

In [3]:
# Transform a time series dataset into a supervised learning dataset

def series_to_supervised(data, n_in=1, n_out=1, dropnan=True):
    '''
    Convierte una serie de tiempo en un conjunto de datos de aprendizaje supervisado.
    Argumentos:
        data: Secuencia de observaciones como una lista o un DataFrame.
        n_in: Número de observaciones retrasadas como entrada (X).
        n_out: Número de observaciones como salida (Y).
        dropnan: Booleano que indica si se deben eliminar las filas con valores NaN.
    Devuelve:
        DataFrame de pandas de la serie enmarcada para aprendizaje supervisado.

    '''
    # Si los datos son una lista, n_vars será 1, de lo contrario será el número de características (columnas) en el conjunto de datos
    n_vars = 1 if type(data) is list else data.shape[1]
    # Convierte los datos en DataFrame
    df = pd.DataFrame(data)
    # Inicializa una lista para guardar los datos
    cols = list()

    # Construye la secuencia de entrada, Input sequence (t-n, ..., t-1)
    for i in range(n_in, 0, -1):
        cols.append(df.shift(i))
    
    # Construye la secuencia de pronóstico, Forecast sequence (t, t+1, ..., t+n)
    for i in range(0, n_out):
        cols.append(df.shift(-i))

    # Concatena todas las columnas
    agg = pd.concat(cols, axis=1)

    # Elimina filas con valores NaN
    if dropnan:
        agg.dropna(inplace=True)
    
    return agg.values

**Descripción de la función :**

1. `series_to_supervised(data, n_in=1, n_out=1, dropnan=True)`: Esta función convierte una serie temporal en un conjunto de datos de aprendizaje supervisado. El argumento 'data' se refiere a la serie temporal de entrada, 'n_in' es el número de pasos de tiempo como entrada (X), y 'n_out' es el número de pasos de tiempo a predecir (Y). 'dropnan' es un booleano que determina si se deben eliminar o no los valores NaN.

2. `n_vars = 1 if type(data) is list else data.shape[1]`: Esta línea determina el número de variables de entrada. Si 'data' es una lista, entonces hay una variable. De lo contrario, el número de variables es el número de columnas en los datos.

3. `df = DataFrame(data)`: Aquí se convierte la serie temporal de entrada 'data' en un DataFrame de pandas.

4. `cols = list()`: Aquí se inicializa una lista vacía para guardar las columnas del DataFrame de salida.

5. `for i in range(n_in, 0, -1): cols.append(df.shift(i))`: Este bucle crea las columnas de entrada (X) en el DataFrame de salida. Cada columna es una versión desplazada de la serie temporal de entrada.

6. `for i in range(0, n_out): cols.append(df.shift(-i))`: Este bucle crea las columnas de salida (Y) en el DataFrame de salida. Cada columna es una versión desplazada de la serie temporal de entrada.

7. `agg = concat(cols, axis=1)`: Aquí se concatena todas las columnas en un solo DataFrame.

8. `if dropnan: agg.dropna(inplace=True)`: Esta línea elimina cualquier fila con valores NaN si 'dropnan' es True.

9. `return agg.values`: Finalmente, la función devuelve los valores del DataFrame de salida como una matriz numpy.