# Series de Tiempo
Una serie de tiempo es una secuencia de observaciones tomadas secuencialmente en el tiempo. Por ejemplo, la altura de la marea cada día durante un mes, las ventas diarias de una empresa durante un año, o la temperatura horaria durante una semana, son todas series de tiempo.

Las series de tiempo son importantes porque nos permiten entender patrones y tendencias en los datos a lo largo del tiempo. Esto es útil en una variedad de campos, desde las finanzas (por ejemplo, predecir precios de acciones) hasta la meteorología (por ejemplo, predecir el clima).

En el siguiente ejemplo, vamos a generar una serie de tiempo simple y visualizarla usando Python y la biblioteca de visualización Seaborn.

In [None]:
# Importamos las bibliotecas necesarias
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Generamos una serie de tiempo simple
np.random.seed(0)
time = pd.date_range('2020-01-01', periods=200)
series = pd.Series(np.random.randn(len(time)), index=time)

# Visualizamos la serie de tiempo
sns.lineplot(data=series)
plt.title('Serie de Tiempo Aleatoria')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.show()
     

# Definición Formal de una Serie de Tiempo
Formalmente, una serie de tiempo puede ser vista como una realización de un proceso estocástico en el tiempo. Un proceso estocástico es una colección de variables aleatorias indexadas por el tiempo.

Si denotamos la serie de tiempo como 
, entonces 
 es la variable aleatoria en el tiempo 
. El conjunto completo 
 para todos los tiempos 
 es el proceso estocástico.

Existen diferentes tipos de procesos estocásticos que se utilizan para modelar series de tiempo, dependiendo de las propiedades de la serie. Por ejemplo, si la serie es estacionaria (es decir, sus propiedades estadísticas no cambian con el tiempo), se pueden utilizar modelos como el modelo autorregresivo (AR), el modelo de media móvil (MA), o el modelo autorregresivo de media móvil (ARMA). Si la serie tiene una tendencia o una estacionalidad, se pueden utilizar modelos como el modelo autorregresivo integrado de media móvil (ARIMA) o el modelo de suavizado exponencial.

# Estacionalidad en las Series de Tiempo
La estacionalidad se refiere a las variaciones periódicas en una serie de tiempo. Por ejemplo, las ventas de helados pueden ser altas durante el verano y bajas durante el invierno, lo que constituiría una estacionalidad anual. De manera similar, las ventas de una tienda pueden ser altas durante el día y bajas durante la noche, lo que constituiría una estacionalidad diaria.

Una serie de tiempo es estacionaria si sus propiedades estadísticas (como la media, la varianza y la autocorrelación) son constantes en el tiempo. Esto significa que no tiene tendencia ni estacionalidad. Por otro lado, una serie de tiempo que tiene una tendencia o una estacionalidad se dice que es no estacionaria.

A continuación, vamos a generar una serie de tiempo estacionaria y una no estacionaria, y vamos a comprobar su estacionariedad utilizando el test de Dickey-Fuller aumentado, que es un método estadístico para probar la estacionariedad. También vamos a visualizar las series.

In [None]:
# Importamos la biblioteca para el test de Dickey-Fuller
from statsmodels.tsa.stattools import adfuller

# Generamos una serie de tiempo estacionaria
stationary_series = pd.Series(np.random.randn(200), index=pd.date_range('2020-01-01', periods=200))

# Realizamos el test de Dickey-Fuller
result = adfuller(stationary_series)
print(f'P-value para la serie estacionaria: {result[1]}')

# Visualizamos la serie de tiempo estacionaria
sns.lineplot(data=stationary_series)
plt.title('Serie de Tiempo Estacionaria')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.show()

# Generamos una serie de tiempo no estacionaria
non_stationary_series = pd.Series(np.random.randn(200).cumsum(), index=pd.date_range('2020-01-01', periods=200))

# Realizamos el test de Dickey-Fuller
result = adfuller(non_stationary_series)
print(f'P-value para la serie no estacionaria: {result[1]}')

# Visualizamos la serie de tiempo no estacionaria
sns.lineplot(data=non_stationary_series)
plt.title('Serie de Tiempo No Estacionaria')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.show()

# Test de Dickey-Fuller Aumentado
El test de Dickey-Fuller aumentado (ADF) es un test estadístico que se utiliza para determinar si una serie de tiempo es estacionaria. El test se basa en la estimación de la siguiente regresión por mínimos cuadrados ordinarios:

donde 
, 
 es la serie de tiempo, 
 es la tendencia, y 
 es el término de error.

La hipótesis nula del test es que 
, lo que indica que la serie de tiempo tiene una raíz unitaria y por lo tanto es no estacionaria. Si el p-value del test es menor que un nivel de significancia dado (por ejemplo, 0.05), entonces rechazamos la hipótesis nula y concluimos que la serie de tiempo es estacionaria.

A continuación, vamos a realizar el test de Dickey-Fuller aumentado en una serie de tiempo.

In [None]:
# Generamos una serie de tiempo
series = pd.Series(np.random.randn(200).cumsum(), index=pd.date_range('2020-01-01', periods=200))

# Realizamos el test de Dickey-Fuller
result = adfuller(series)
print(f'ADF Statistic: {result[0]}')
print(f'p-value: {result[1]}')
print(f'Critical Values:')
for key, value in result[4].items():
    print(f'\t{key}: {value}')

# Ejercicios
Ahora que hemos aprendido cómo generar series de tiempo estacionarias y no estacionarias, y cómo comprobar su estacionariedad utilizando el test de Dickey-Fuller, es tu turno de practicar.

#### Ejercicio 1:

Genera una serie de tiempo que sea una caminata aleatoria (es decir, cada valor es la suma del valor anterior y un ruido aleatorio), y comprueba si es estacionaria utilizando el test de Dickey-Fuller. Visualiza la serie de tiempo.

#### Ejercicio 2:

Genera una serie de tiempo que sea la suma de una tendencia y un ruido aleatorio, y comprueba si es estacionaria utilizando el test de Dickey-Fuller. Visualiza la serie de tiempo.

In [None]:
#Ejercicio 1

# Generamos una serie de tiempo que es una caminata aleatoria
np.random.seed(0)
time = pd.date_range('2020-01-01', periods=200)
series = pd.Series(np.random.randn(len(time)), index=time)

# Realizamos el test de Dickey-Fuller
result = adfuller(series)
print(f'ADF Statistic: {result[0]}')
print(f'p-value: {result[1]}')
print(f'Critical Values:')
for key, value in result[4].items():
    print(f'\t{key}: {value}')

# Visualizamos la serie de tiempo
sns.lineplot(data=series)
plt.title('Serie de Tiempo Caminata Aleatoria')
plt.xlabel('Tiempo')
plt.ylabel('Valor')
plt.show()





In [None]:
#Ejercicio 2
#Genera una serie de tiempo que sea la suma de una tendencia y un ruido aleatorio
series = pd.Series(np.random.randn(200) + np.linspace(0, 10, 200), index=pd.date_range('2020-01-01', periods=200))

# Visualiza la serie de tiempo
plt.plot(series)
plt.title('serie de tiempo con ruido aleatorio')
plt.show()

# Test de Dickey-Fuller
result = adfuller(series)
print(f'ADF Statistic: {result[0]}')
print(f'p-value: {result[1]}')
print(f'Critical Values:')
for key, value in result[4].items():
    print(f'\t{key}: {value}')




# Series de Tiempo con Prophet
Prophet es una biblioteca de Python desarrollada por Facebook que se utiliza para el análisis y la predicción de series de tiempo. Prophet es especialmente útil para trabajar con series de tiempo que tienen patrones fuertes de tendencia y estacionalidad, y que pueden tener puntos de cambio en su tendencia.

Algunas de las ventajas de Prophet son:

Manejo de datos faltantes: Prophet puede manejar datos faltantes y no requiere que la serie de tiempo sea interpolada para llenar los datos faltantes.
Flexibilidad: Prophet permite al usuario especificar manualmente los puntos de cambio, en lugar de tener que confiar únicamente en la detección automática.
Modelado de días festivos y eventos especiales: Prophet permite modelar días festivos y eventos especiales que pueden afectar a la serie de tiempo.
Robustez a outliers: Prophet es robusto a los outliers y no se ve afectado significativamente por ellos.
A continuación, vamos a utilizar Prophet para descomponer una serie de tiempo en su tendencia y componentes estacionales.

In [None]:

# Importamos la biblioteca Prophet
from fbprophet import Prophet

# Generamos una serie de tiempo con una tendencia y una estacionalidad
time = pd.date_range('2020-01-01', periods=365)
trend = np.linspace(0, 1, 365)
seasonality = np.sin(2 * np.pi * np.arange(365) / 7)
series = pd.Series(trend + seasonality + np.random.randn(365) * 0.1, index=time)
df = pd.DataFrame({'ds': series.index, 'y': series.values})

# Ajustamos el modelo Prophet
model = Prophet(weekly_seasonality=True)
model.fit(df)

# Hacemos una predicción para el mismo período de tiempo
future = model.make_future_dataframe(periods=0)
forecast = model.predict(future)

# Visualizamos la descomposición de la serie de tiempo
model.plot_components(forecast)

# Ejercicios con Prophet
Ahora que hemos aprendido cómo usar Prophet para descomponer una serie de tiempo en su tendencia y componentes estacionales, es tu turno de practicar.

#### Ejercicio 1:

Genera una serie de tiempo que tenga una tendencia lineal y una estacionalidad semanal, y utiliza Prophet para descomponerla en su tendencia y componentes estacionales. Visualiza la descomposición.

#### Ejercicio 2:

Genera una serie de tiempo que tenga una tendencia no lineal y una estacionalidad diaria, y utiliza Prophet para descomponerla en su tendencia y componentes estacionales. Visualiza la descomposición.

In [None]:
#Ejercicio 1 
# Generamos una serie de tiempo con una tendencia lineal y una estacionalidad semanal
time = pd.date_range('2020-01-01', periods=365)
trend = np.linspace(0, 1, 365)
seasonality = np.sin(2 * np.pi * np.arange(365) / 7)
series = pd.Series(trend + seasonality + np.random.randn(365) * 0.1, index=time)
df = pd.DataFrame({'ds': series.index, 'y': series.values})

# Ajustamos el modelo Prophet
model = Prophet(weekly_seasonality=True)
model.fit(df)

# Hacemos una predicción para el mismo período de tiempo
future = model.make_future_dataframe(periods=0)
forecast = model.predict(future)

# Visualizamos la descomposición de la serie de tiempo
model.plot_components(forecast)

In [None]:
#Ejercicio 2
# Importamos la biblioteca Prophet
from fbprophet import Prophet

# Generamos una serie de tiempo con una tendencia no lineal y una estacionalidad diaria
time = pd.date_range('2020-01-01', periods=365)
trend = np.sin(2 * np.pi * np.arange(365) / 365)
seasonality = np.sin(2 * np.pi * np.arange(365) / 24)
series = pd.Series(trend + seasonality + np.random.randn(365) * 0.1, index=time)
df = pd.DataFrame({'ds': series.index, 'y': series.values})

# Ajustamos el modelo Prophet
model = Prophet(daily_seasonality=True)
model.fit(df)

# Hacemos una predicción para el mismo período de tiempo
future = model.make_future_dataframe(periods=0)
forecast = model.predict(future)

# Visualizamos la descomposición de la serie de tiempo
model.plot_components(forecast)