#Librería prophet de Meta (Facebook)

Prophet es una biblioteca de código abierto para Python (y R) desarrollada por el equipo de ciencia de datos de Facebook (Meta) para la predicción de series temporales.

Se caracteriza por su facilidad de uso, lo que permite a los analistas de datos y desarrolladores generar pronósticos de alta calidad con un esfuerzo mínimo, incluso sin tener conocimientos profundos sobre modelos estadísticos complejos.



**Características clave de Prophet**.

+ Modelo aditivo: Prophet utiliza un modelo aditivo que descompone una serie temporal en componentes de tendencia, estacionalidad (semanal, anual) y días festivos.
+ Entrada de datos sencilla: El modelo requiere un DataFrame con solo dos columnas: ds (la marca de tiempo) y y (el valor numérico que se va a predecir).
Robustez: Es robusto ante datos faltantes, valores atípicos y cambios en la tendencia.
* Manejo de estacionalidad y festivos: Puede modelar múltiples periodos de estacionalidad (como patrones diarios, semanales o anuales) y permite incluir fácilmente información sobre días festivos y eventos especiales.
* Pronóstico automático: El modelo puede generar pronósticos completamente automáticos que pueden ser ajustados manualmente por usuarios más avanzados.
* Interfaz similar a scikit-learn: Sigue una API familiar para los usuarios de Python, con métodos fit() y predict() que simplifican el proceso.

La entrada a Prophet es siempre un marco de datos con dos columnas: ds e y.

+ La columna ds (datestamp) debe tener el formato esperado por Pandas, idealmente YYYY-MM-DD para una fecha o YYYY-MM-DD HH:MM:SS para una marca de tiempo.
+ La columna y debe ser numérica, y representa la medida que deseamos pronosticar.


Documentación oficial: [Prophet - Meta (Facebook)](https://facebook.github.io/prophet/docs/quick_start.html#python-api)

## Librerías

In [None]:
import pandas as pd
from prophet import Prophet
import matplotlib.pyplot as plt

## Datos



In [None]:
df = pd.read_csv('./BeerWineLiquor.csv')

In [None]:
df.head()

In [None]:
df.info()

In [None]:
df['beer'].plot(figsize=(20,5), title = "BeerWineLiquor")
plt.show() #

### Formateamos los datos

In [None]:
df.columns = ['ds','y']

In [None]:
df['ds'] = pd.to_datetime(df['ds'])

In [None]:
df.head()

In [None]:
df.tail()

Observamos que los datos acaban en 2018-12-01

In [None]:
df.info()

## Create and Fit Model

In [None]:
#m = Prophet(weekly_seasonality=True, daily_seasonality=True)
m = Prophet()
m.fit(df)

## Pronósticos del futuro

### Paso 1: Crear el dataframe donde colocaremos los resultados



In [None]:
future = m.make_future_dataframe(periods=24,freq = 'MS')

In [None]:
future.head()

In [None]:
future.tail()

Observamos ahora que el dataframe creado para guardar las predicciones acaba en 2020-12-01, es decir, 24 periodos más de los que tenemos en los datos originales, tal como hemos especificado con el parámetro `'periods'` al crear el dataframe de resultados


### Paso 2: Calcular los pronósticos y guardarlos en forecast

In [None]:
forecast = m.predict(future)

En forecast tenemos el ajuste realizado sobre los datos proporcionados al invocar el modelo **más** el pronóstico de los periodos especificados

In [None]:
forecast.head()

In [None]:
forecast.tail()

In [None]:
forecast.columns

In [None]:
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail(12)

### Graficando los pronósticos


In [None]:
m.plot(forecast);

In [None]:
pd.plotting.register_matplotlib_converters()

In [None]:
import matplotlib.pyplot as plt
m.plot(forecast)
plt.xlim('2014-01-01','2022-01-01')

In [None]:
forecast.plot(x='ds',y='yhat')

In [None]:
m.plot_components(forecast);


## Métricas para comparar

In [None]:
from sklearn.metrics import mean_squared_error
from sklearn.metrics import root_mean_squared_error
from sklearn.metrics import r2_score # Removed R2 as variables were undefined

# Filter the forecast DataFrame to include only the dates present in the original df
forecast_filtered = forecast[forecast['ds'].isin(df['ds'])]

# Calculate RMSE
error = root_mean_squared_error(df['y'], forecast_filtered['yhat'])
print(f'Error RMSE: {error:11.10}')

R2=r2_score(df['y'], forecast_filtered['yhat'])
print(f'Ajuste R2: {R2:11.2}') # Removed R2 as variables were undefined

#EOF