# Prophet - Predecir el valor de Bitcoin


Prophet es una de las librerías más avanzadas para predecir series temporales desarrollada por Facebook. Te enseñaremos a como entrenar un modelo con Prophet, a optimizarlo y a utilizarlo para realizar predicciones futuras. En este ejercicio vamos a practicar a predecir el valor de Bitcoin, una criptomoneda. Es la criptomoneda que le ha marcado el camino a todas las demás que llegaron después utilizando su tecnología.  

<hr/>
<div class="alert alert-success alertsuccess" style="margin-top: 20px">
[Tip]: Para ejecutar el código de Python en la celda de código a continuación, haz clic en la celda para seleccionarla y presiona <kbd>Shift</kbd> + <kbd>Enter</kbd>.
</div>
<hr/>


In [None]:
#Dependencias de Prophet
!pip install pystan==2.19.1.1 --quiet
!pip install cmdstanpy --quiet
# Instalamos el modelo predictivo Prophet
!pip install fbprophet --quiet
# De aquí vamos a descargar los datos
!pip install yfinance --quiet

In [None]:
#Importamos las dependencias
import pandas as pd
import yfinance as yf
from datetime import datetime
from datetime import timedelta
import plotly.graph_objects as go
#from fbprophet import Prophet
#from fbprophet.plot import plot_plotly, plot_components_plotly
from prophet import Prophet
import warnings

warnings.filterwarnings('ignore')

pd.options.display.float_format = '${:,.2f}'.format

<h3 id="version">Cargar histórico de datos</h3>


<p>
    Para descargarnos la serie temporal de BTC lo vamos a hacer desde Yahoo Finance. En concreto vamos a descargar el histórico desde 2016 hasta la actualidad.
</p>



In [None]:
# Fecha de inicio es un string 2016-01-01 y fecha de fin (hoy) en formato texto '%Y-%m-%d'
today ="2023-05-03" 
start_date = '2016-01-01'
# Descargar el dataframe
btc_df = yf.download('BTC-USD',start_date, today).reset_index()

btc_df.tail()

[*********************100%***********************]  1 of 1 completed


Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
2674,2023-04-28,"$29,481.01","$29,572.79","$28,929.61","$29,340.26","$29,340.26",17544464887
2675,2023-04-29,"$29,336.57","$29,452.46","$29,088.04","$29,248.49","$29,248.49",10662634333
2676,2023-04-30,"$29,245.52","$29,952.03","$29,114.02","$29,268.81","$29,268.81",14652199272
2677,2023-05-01,"$29,227.10","$29,329.94","$27,680.79","$28,091.57","$28,091.57",18655599976
2678,2023-05-02,"$28,087.18","$28,881.30","$27,924.12","$28,680.54","$28,680.54",16432924527


In [None]:
# Validamos que no hay datos vacíos
 
btc_df.isnull

<bound method DataFrame.isnull of            Date       Open       High  ...      Close  Adj Close       Volume
0    2016-01-01    $430.72    $436.25  ...    $434.33    $434.33     36278900
1    2016-01-02    $434.62    $436.06  ...    $433.44    $433.44     30096600
2    2016-01-03    $433.58    $433.74  ...    $430.01    $430.01     39633800
3    2016-01-04    $430.06    $434.52  ...    $433.09    $433.09     38477500
4    2016-01-05    $433.07    $434.18  ...    $431.96    $431.96     34522600
...         ...        ...        ...  ...        ...        ...          ...
2674 2023-04-28 $29,481.01 $29,572.79  ... $29,340.26 $29,340.26  17544464887
2675 2023-04-29 $29,336.57 $29,452.46  ... $29,248.49 $29,248.49  10662634333
2676 2023-04-30 $29,245.52 $29,952.03  ... $29,268.81 $29,268.81  14652199272
2677 2023-05-01 $29,227.10 $29,329.94  ... $28,091.57 $28,091.57  18655599976
2678 2023-05-02 $28,087.18 $28,881.30  ... $28,680.54 $28,680.54  16432924527

[2679 rows x 7 columns]>

In [None]:
# TAREA: Filtramos el dataframe para quedarnos solo las columnas "Date" y "Open"
# Date será la fecha del valor y Open el valor del BTC en ese momento
df = btc_df[['Date', 'Open']]

# Valores que espera el prophet
# Eje X: Indíce llamado ds
# Eje Y: Serie a predecir llamada y
# TAREA HECHA: Crear un diccionario con clave "Date" y valor "ds"
# Y otra clave "Open" y valor "y"
new_names = {
    "Date": "ds", 
    "Open": "y",
}

# TAREA: Utiliza el diccionario para renombrar las columnas de df
df = df.rename(columns=new_names)

In [None]:
#Ejecuta la siguiente línea, si lo has hecho bien hasta aquí no dará error
df['ds'] = df['ds'].dt.tz_localize(None)

In [None]:
df.tail()

Unnamed: 0,ds,y
2674,2023-04-28,"$29,481.01"
2675,2023-04-29,"$29,336.57"
2676,2023-04-30,"$29,245.52"
2677,2023-05-01,"$29,227.10"
2678,2023-05-02,"$28,087.18"


In [None]:
# Crear la gráfica del precio de apertura
#Asigna a la variable x la columna ds
x = df["ds"]
#Asigna a la variable y la columna y
y = df["y"]

fig = go.Figure()

fig.add_trace(go.Scatter(x=x, y=y))

# Le ponemos el título a la gráfica
titulo = ""
fig.update_layout(
    title_text=titulo,
)

fig.update_layout(
    xaxis=dict(
        rangeselector=dict(
            buttons=list(
                [
                    dict(count=1, label="1m", step="month", stepmode="backward"),
                    dict(count=6, label="6m", step="month", stepmode="backward"),
                    dict(count=1, label="YTD", step="year", stepmode="todate"),
                    dict(count=1, label="1a", step="year", stepmode="backward"),
                    dict(step="all"),
                ]
            )
        ),
        rangeslider=dict(visible=True),
        type="date",
    )
)

<h3 id="version">Entrenar y predecir el modelo</h3>


<p>
    Ahora que has visto en la gráfica de que datos partimos. Inicializamos el Prophet y lo entramos pasandole el dataframe
</p>



In [None]:
#TAREA: Inicializa Prophet en la variable m con seasonality_mode en modo "multiplicative"


m = Prophet(seasonality_mode='multiplicative')


INFO:prophet:Disabling daily seasonality. Run prophet with daily_seasonality=True to override this.
DEBUG:cmdstanpy:input tempfile: /tmp/tmp_17z_he0/ufg6by1d.json
DEBUG:cmdstanpy:input tempfile: /tmp/tmp_17z_he0/j9vyijtj.json
DEBUG:cmdstanpy:idx 0
DEBUG:cmdstanpy:running CmdStan, num_threads: None
DEBUG:cmdstanpy:CmdStan args: ['/usr/local/lib/python3.10/dist-packages/prophet/stan_model/prophet_model.bin', 'random', 'seed=9223', 'data', 'file=/tmp/tmp_17z_he0/ufg6by1d.json', 'init=/tmp/tmp_17z_he0/j9vyijtj.json', 'output', 'file=/tmp/tmp_17z_he0/prophet_model0shf96a3/prophet_model-20230504095712.csv', 'method=optimize', 'algorithm=lbfgs', 'iter=10000']
09:57:12 - cmdstanpy - INFO - Chain [1] start processing
INFO:cmdstanpy:Chain [1] start processing
09:57:13 - cmdstanpy - INFO - Chain [1] done processing
INFO:cmdstanpy:Chain [1] done processing


In [None]:
#TAREA: Entrena el modelo m con el dataframe de datos df
m.fit(df)

INFO:prophet:Disabling daily seasonality. Run prophet with daily_seasonality=True to override this.
DEBUG:cmdstanpy:input tempfile: /tmp/tmp_17z_he0/2asys8l_.json
DEBUG:cmdstanpy:input tempfile: /tmp/tmp_17z_he0/xixgv8vt.json
DEBUG:cmdstanpy:idx 0
DEBUG:cmdstanpy:running CmdStan, num_threads: None
DEBUG:cmdstanpy:CmdStan args: ['/usr/local/lib/python3.10/dist-packages/prophet/stan_model/prophet_model.bin', 'random', 'seed=72922', 'data', 'file=/tmp/tmp_17z_he0/2asys8l_.json', 'init=/tmp/tmp_17z_he0/xixgv8vt.json', 'output', 'file=/tmp/tmp_17z_he0/prophet_model4dvwl74z/prophet_model-20230504095836.csv', 'method=optimize', 'algorithm=lbfgs', 'iter=10000']
09:58:36 - cmdstanpy - INFO - Chain [1] start processing
INFO:cmdstanpy:Chain [1] start processing
09:58:37 - cmdstanpy - INFO - Chain [1] done processing
INFO:cmdstanpy:Chain [1] done processing


<prophet.forecaster.Prophet at 0x7fb94d3683d0>

<p>
    Le decimos al modelo m los días en futuro que queremos predecir, en este caso el próximo año.
</p>



In [None]:
# TAREA: generar un dataframe con los días que tenemos y los 365 días siguientes a hoy para predecirlo
# PISTA: puedes usar la función del prophet make_future_dataframe()
future = m.make_future_dataframe(365)
future.tail()

Unnamed: 0,ds
3039,2024-04-27
3040,2024-04-28
3041,2024-04-29
3042,2024-04-30
3043,2024-05-01


In [None]:
# En el caso que hayas elegido un valor o fondo tradicional, es decir, que no opere los fines
# de semana, descomenta la siguiente línea:

# future = future[ future['ds'].dt.dayofweek < 5 ] # Nos elimina los fines de semana de 'ds' para no predecirlos
future

<p>
    Al modelo entrenado le pasamos el dataframe a predecir.
</p>



In [None]:
#Utiliza el modelo m para predecir el dataframe future
forecast = m.predict(future )

In [None]:
# actualizacion de lobreria

from prophet.plot import plot_plotly, plot_components_plotly


In [None]:
forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()

Unnamed: 0,ds,yhat,yhat_lower,yhat_upper
3039,2024-04-27,"$-10,625.91","$-27,773.60","$7,995.72"
3040,2024-04-28,"$-10,643.75","$-26,792.36","$9,019.58"
3041,2024-04-29,"$-10,654.03","$-26,876.45","$8,137.63"
3042,2024-04-30,"$-10,649.78","$-27,148.72","$8,234.08"
3043,2024-05-01,"$-10,614.79","$-26,922.37","$8,391.62"


<p>
    Gráfica con el modelo entrenado y los valores de un año en futuro predecidos.
</p>



In [None]:
next_day = (datetime.today() + timedelta(days=1)).strftime('%Y-%m-%d')
forecast[forecast['ds'] == next_day]['yhat'].item()
plot_plotly(m, forecast)

In [None]:
plot_components_plotly(m, forecast)