In [23]:
import pandas as pd
import numpy as np
import math

In [37]:
def simple_backtest(df_1, df_2):
    """
    Faz um backtest simples baseado nos sinais.
    Baseado no df_1, cria uma nova coluna chamada signals que diz qual é o sinal correto.
    Depois, compara signals com predicted_signals e cria uma coluna comparison que diz se o sinal previsto foi igual ao correto.

    Parâmetros
    - df_1: dataframe
        - coluna Date como index no formato YYYY/MM/DD
        - coluna {nome-do-ticker} com o valor da ação
    - df_2: dataframe
        - coluna Date como index no formato YYYY/MM/DD
        - coluna predicted_signals contendo o sinal para aquela data.
        - sinal deve ser 1 (comprado), 0 (neutro), -1 (vendido)
    """
    df_1["diff"] = df_1.iloc[:, 0].diff()
    df_1 = df_1.sort_index(ascending=True)
    df_1["signals"] = df_1["diff"].apply(
        lambda x: x / x if x > 0 else (-x / x if x < 0 else x)
    )
    df_1["signals"] = df_1["signals"].shift(periods=-1)

    df_2 = df_2.sort_index(ascending=True)

    final_df = df_1.merge(df_2, right_index=True, left_index=True)
    final_df["comparison"] = final_df["signals"] == final_df["predicted_signals"]

    return final_df

In [25]:
df_1 = pd.read_excel("ambev_data.xlsx", index_col=0)

In [32]:
df_2 = pd.DataFrame(
    {"predicted_signals": np.random.choice([0, 1, -1], size=6221)},
    index=df_1.index,
)

Unnamed: 0_level_0,predicted_signals
Date,Unnamed: 1_level_1
2000-01-05,1
2000-01-06,-1
2000-01-07,-1
2000-01-10,1
2000-01-11,1


In [39]:
# testando com valores aleatórios para os sinais
simple_backtest(df_1=df_1, df_2=df_2)

comparison
False    4183
True     2038
Name: count, dtype: int64