In [None]:
from datetime import datetime, timedelta
from pathlib import Path # noqa: F401
from plotly.subplots import make_subplots
import funcoes_br as f_br 
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
import polars as pl
import yfinance as yf

# **ETFs e BDRs**

In [None]:
# Arquivo cotações históricas
df_cotacoes_historicas_polars = pl.read_parquet(Path('C://B3//historico-arquivos//cotacoes-historicas-b3//cotahist-parquet//cotahist_comp_2017_2025.parquet'))
df_cotacoes_historicas_polars.tail()

In [None]:
# ETFs
filt_etf = (
    (pl.col('tipo_mercado') == 10) &
    (pl.col('codneg').str.ends_with('11'))
)

df_etfs = df_cotacoes_historicas_polars.filter(filt_etf)

# Calculando o volume
df_etfs_volume = df_etfs.group_by('codneg').agg(
    pl.col('totneg').sum().alias('volume')
).sort('volume', descending=True)

##############################################################################
# Lista das UNITs e fundos setoriais
lst_unit = [
    # UNITs - https://www.b3.com.br/pt_br/market-data-e-indices/servicos-de-dados/market-data/consultas/mercado-a-vista/units/
    'ALUP11',	
    'BRBI11',	
    'BPAC11',	
    'ENGI11',	
    'IGTI11',	
    'KLBN11',	
    'PPLA11',	
    'RBNS11',	
    'SAPR11',	
    'SANB11',
    'TAEE11',	

    # UNITs, debêntures e bônus de subscrição que não existem mais
    'AMAR11',
    'AMER11',
    'APER11',
    'AVLL11',
    'AZEV11',
    'AZTE11',
    'AZUL11',
    'BEEF11',
    'BPHA11',
    'BIDI11',
    'BIOM11',
    'BMGB11',
    'CALI11',
    'CGAS11',
    'COCE11',
    'CPLE11',
    'CVCB11',
    'DASA11',
    'DMMO11',
    'ELET11',
    'FCCQ11',
    'FJTA11',
    'GFSA11',
    'GETT11',
    'GOLL11',
    'GPIV11',
    'INEP11',
    'JBDU11',
    'KEPL11',
    'LIGT11',
    'LUPA11',
    'MBLY11',
    'MMXM11',
    'MODL11',
    'MYPK11',
    'PDGR11',
    'PGMN11',
    'PINE11',
    'PSVM11',
    'RNEW11',
    'SEQL11',
    'SLED11',
    'SULA11',
    'TIET11',
    'VLID11',
    'VVAR11',
]

##############################################################################
# Lista dos FIIs da B3
df_fiis = pd.read_csv(
    r'C://B3//historico-arquivos//fundos-b3//fundos_listados//fiis_listados.csv',
    sep=';',
    engine='python',
    encoding='latin-1',
    index_col=False
)

# Adicionando a string '11' na coluna 'Código'
df_fiis['Código'] = df_fiis['Código'] + '11'

# Lista dos FIIs
lst_fiis = df_fiis['Código'].to_list()

# Lista de FIIs que não existem mais
lst_fiis_deslistados = [
    'AATH11',
    'AEFI11',
    'AFCR11',
    'AFOF11',
    'AGCX11',
    'ALZM11',
    'ALZT11',
    'AQLL11',
    'ARCT11',
    'ASMT11',

    'BAHI11', 
    'BARI11', 
    'BBPO11', 
    'BBTG11', 
    'BBVH11', 
    'BBVJ11', 
    'BCFF11', 
    'BICR11', 
    'BKOI11', 
    'BLCP11', 
    'BLMC11', 
    'BLMR11', 
    'BLUR11', 
    'BPRP11', 
    'BREV11', 
    'BRGE11', 
    'BRHY11', 
    'BRIX11', 
    'BRLA11', 
    'BTCR11', 
    'BZLI11',

    'CCRF11', 
    'COPP11', 
    'CORM11', 
    'CPFF11', 
    'CVBI11',

    'DMAC11',
    'DOMC11',
    'DRIT11',

    'EQIN11',
    'EQIA11',
    'EVBI11',

    'FEXC11', 
    'FFCI11', 
    'FLFL11', 
    'FOFT11', 
    'FRBR11', 
    'FSPM11', 
    'FVBI11',

    'GALG11', 
    'GCFF11', 
    'GRLV11', 
    'GTLG11', 
    'GURB11', 
    'GWIR11',

    'HBRH11', 
    'HBTT11', 
    'HGJH11', 
    'HMOC11',

    'IBFF11', 
    'IDFI11', 
    'IDGR11', 
    'IFCM11', 
    'IFID11', 
    'IFIE11',

    'JBFO11',
    'JRDM11',
    'JSLG11',

    'KINP11',

    'LFTT11', 
    'LGCP11', 
    'LSPA11', 
    'LUGG11',

    'MALL11', 
    'MATV11', 
    'MBRF11', 
    'MCHF11', 
    'MCHY11', 
    'MFAI11', 
    'MFCR11', 
    'MGCR11', 
    'MGFF11', 
    'MGIM11', 
    'MGLG11', 
    'MINT11', 
    'MORC11', 
    'MORE11',

    'NCHB11',
    'NPAR11',

    'OGHY11', 
    'ONEF11', 
    'ORPD11', 
    'OUCY11', 
    'OUFF11', 
    'OURE11',

    'PLCR11',
    'PLOG11',
    'PURB11',

    'QAMI11',
    'QIFF11',
    'QIRI11',
    'QMFF11',

    'RBBV11', 
    'RBCB11', 
    'RBCO11', 
    'RBED11', 
    'RBGS11', 
    'RBIV11', 
    'RBRM11', 
    'RBVO11', 
    'RDES11', 
    'RDPD11', 
    'RECX11', 
    'RNDP11', 
    'RVBI11', 
    'RZDM11',

    'SAAG11', 
    'SAET11', 
    'SDIL11', 
    'SDIP11', 
    'SIGR11', 
    'SINC11', 
    'SMRT11', 
    'SNCR11', 
    'SRVD11',

    'TBOF11',
    'TFOF11', 
    'THRA11', 
    'TOUR11', 
    'TRXL11',

    'UBSR11',

    'VLOL11',
    'VSEC11',
    'VVPR11',
    
    'XPGA11', 
    'XPHT11', 
    'XPOM11', 
    'XPPR11', 
    'XTED11',

    'YCHY11',
]

# Adiciona todos os elementos na lista
lst_fiis.extend(lst_fiis_deslistados)

##############################################################################
# Lista dos FIAGROs da B3
df_fiagros = pd.read_csv(
    r'C://B3//historico-arquivos//fundos-b3//fundos_listados//fiagros_listados.csv',
    sep=';',
    engine='python',
    encoding='latin-1',
    index_col=False
)

# Adicionando a string '11' na coluna 'Código'
df_fiagros['Código'] = df_fiagros['Código'] + '11'

# Lista dos FIAGROs
lst_fiagros = df_fiagros['Código'].to_list()

# Lista de FIAGROs que não existem mais
lst_fiagros_deslistados = [
    'AGRX11',
    'BRFT11',
    'LAFI11',
    'IAAG11'
    'NCRA11',
    'QAGR11',
]

# Adiciona todos os elementos na lista
lst_fiagros.extend(lst_fiagros_deslistados)

##############################################################################
# Lista dos FIPs da B3
df_fips = pd.read_csv(
    r'C://B3//historico-arquivos//fundos-b3//fundos_listados//fips_listados.csv',
    sep=';',
    engine='python',
    encoding='latin-1',
    index_col=False
)

# Adicionando a string '11' na coluna 'Código'
df_fips['Código'] = df_fips['Código'] + '11'

# Lista dos FIAGROs
lst_fips = df_fips['Código'].to_list()

##############################################################################
# Lista dos fundos setoriais da B3
df_fisets = pd.read_csv(
    r'C://B3//historico-arquivos//fundos-b3//fundos_listados//fiset_listados.csv',
    sep=';',
    engine='python',
    encoding='latin-1',
    index_col=False
)

# Adicionando a string '11' na coluna 'Código'
df_fisets['Código'] = df_fisets['Código'] + '11'

# Lista dos FIAGROs
lst_fisets = df_fisets['Código'].to_list()

##############################################################################
# Lista dos fundos de infra da B3
df_finfra = pd.read_csv(
    r'C://B3//historico-arquivos//fundos-b3//fundos_listados//fiinfra_listados.csv',
    sep=';',
    engine='python',
    encoding='latin-1',
    index_col=False
)

# Adicionando a string '11' na coluna 'Código'
df_finfra['Código'] = df_finfra['Código'] + '11'

# Lista dos FIAGROs
lst_finfra = df_finfra['Código'].to_list()

##############################################################################
# Conjunto dos tickers que vão ser excluídos
set_exclusoes = set(lst_unit) | set(lst_fiis) | set(lst_fiagros) | set(lst_fips) | set(lst_fisets) | set(lst_finfra)
lst_exclusoes = list(set_exclusoes)

# Realiza a filtragem final de uma só vez
df_etfs_volume_final = df_etfs_volume.filter(
    ~pl.col('codneg').is_in(lst_exclusoes)
)

print('='*40)
print(f'Total de ETFs disponíveis: {len(df_etfs_volume_final)}')
print('='*40)

df_etfs_volume_final[0:10]

In [None]:
# BDRs
filt = (
    (pl.col('tipo_mercado') == 10) &            
    (pl.col('codneg').str.contains('34'))                       
)

df_bdrs = df_cotacoes_historicas_polars.filter(filt)

# Calculando o volume
df_bdrs_volume = df_bdrs.group_by('codneg').agg(
    pl.col('totneg').sum().alias('volume')
).sort('volume', descending=True)

print('='*40)
print(f'Total de BDRs disponíveis: {len(df_bdrs_volume)}')
print('='*40)

df_bdrs_volume[0:10]

In [None]:
# BDRs de ETFs
filt = (
    (pl.col('tipo_mercado') == 10) &            
    (pl.col('codneg').str.contains('39'))                       
)

df_bdrs_etfs = df_cotacoes_historicas_polars.filter(filt)

# Calculando o volume
df_bdrs_etfs_volume = df_bdrs_etfs.group_by('codneg').agg(
    pl.col('totneg').sum().alias('volume')
).sort('volume', descending=True)

print('='*40)
print(f'Total de BDRs de ETFs disponíveis: {len(df_bdrs_etfs_volume)}')
print('='*40)

df_bdrs_etfs_volume[0:10]

# **Análise dos Anos Eleitorais e de Crises**

## Anos Eleitorais - BRASIL

### IBOV

In [None]:
# Download dos dados do papel em específico
ticker = '^BVSP'
ativo = yf.download(ticker, start='1995-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Resetando o index do df
ativo = ativo.reset_index()  

# Renomeando as colunas para remover o MultiIndex
ativo.columns = ['Date', 'Close']  

# Transformando a coluna 'Date' no index do df
ativo = ativo.set_index('Date')

# Fazendo uma copia do df ativo
df = ativo.copy()

# Cria uma coluna para o ano de cada dia
df['ano'] = df.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df['dia_do_ano'] = df.index.dayofyear 

# Criando a tabela pivot
tabela = df.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
tabela_final = tabela.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
tabela_final = (tabela_final / tabela_final.iloc[0]) - 1

tabela_final

In [None]:
# Plotando o gráfico dos anos eleitorais
anos_eleitorais = [
    1998, 2002, 2006, 2010, 
    2014, 2018, 2022
]

fig = px.line(tabela_final[anos_eleitorais], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance IBOVESPA em anos eleitorais',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Criando duas linhas verticais no início e fim de Outubro
fig.add_vline(x=pd.to_datetime('2022-10-01').dayofyear)
fig.add_vline(x=pd.to_datetime('2022-10-31').dayofyear)

# Criando uma linha horizontal
fig.add_hline(y=0, line=dict(color='red', width=1))

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

fig

In [None]:
# Calculando o retorno mensal de Outubro dos anos eleitorais
lista_ret_out = [round((((df.loc[f'{ano}-10', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

# Calculando o retorno mensal de Outubro até o final do ano eleitoral
lista_ret_out_dez = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1 )*100, 2) for ano in anos_eleitorais]

# Calculando o retorno anual dos anos eleitorais
lista_ret_ano = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-01', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

df_ret_eleicao = pd.DataFrame(list(zip(lista_ret_out, lista_ret_out_dez, lista_ret_ano)), 
                              columns=['retorno_out', 'retorno_out_dez', 'retorno_anual'], 
                              index=anos_eleitorais
)
df_ret_eleicao

In [None]:
df_ibov = yf.download('^BVSP', start='1998-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Plotando o 1º e 2º dos anos eleitorais
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_ibov.index,
    y=df_ibov
))

# Adicionando linhas verticais nas datas do 1º e 2º turno das eleições
fig.add_vline(x='1998-10-04', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (FHC x Lula x Ciro Gomes - turno único)

fig.add_vline(x='2002-10-06', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Serra)
fig.add_vline(x='2002-10-27', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2006-10-01', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Alckmin)
fig.add_vline(x='2006-10-29', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2010-10-03', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Dilma x Serra)
fig.add_vline(x='2010-10-31', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Dilma ganhadora)

fig.add_vline(x='2014-10-05', line_width=1, line_dash='dash', line_color='black') # 1º turno 2014 (Dilma x Aécio)
fig.add_vline(x='2014-10-26', line_width=1, line_dash='dash', line_color='red') # 2º turno 2014 (Dilma ganhadora)

fig.add_vline(x='2018-10-07', line_width=1, line_dash='dash', line_color='black') # 1º turno 2018 (Haddad x Bolsonaro)
fig.add_vline(x='2018-10-28', line_width=1, line_dash='dash', line_color='red') # 2º turno 2018 (Bolsonaro ganhador)

fig.add_vline(x='2022-10-02', line_width=1, line_dash='dash', line_color='black') # 1º turno 2022 (Lula x Bolsonaro)
fig.add_vline(x='2022-10-30', line_width=1, line_dash='dash', line_color='red') # 2º turno 2022 (Lula ganhador)

fig.update_layout(
    title='IBOVESPA - 1º e 2º turno das eleições',
    template='seaborn'
)

fig.show()

In [None]:
# Datas dos 1º e 2º turnos das eleições
lst_datas_turnos = [
    ('2002-10-06', '2002-10-27'),
    ('2006-10-01', '2006-10-29'),
    ('2010-10-03', '2010-10-31'),
    ('2014-10-05', '2014-10-26'),
    ('2018-10-07', '2018-10-28'),
    ('2022-10-02', '2022-10-30')
]

# Lista das segundas-feiras pós cada turno
lst_segunda_feira_pos_1_turno = []
lst_segunda_feira_pos_2_turno = []

for primeiro_turno, segundo_turno in lst_datas_turnos:
    # Calculando a segunda-feira após o 1º turno
    data_1_turno = datetime.strptime(primeiro_turno, '%Y-%m-%d')
    segunda_feira_pos_1_turno = (data_1_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_1_turno.append(segunda_feira_pos_1_turno)

    # Calculando a segunda-feira após o 2º turno
    data_2_turno = datetime.strptime(segundo_turno, '%Y-%m-%d')
    segunda_feira_pos_2_turno = (data_2_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_2_turno.append(segunda_feira_pos_2_turno)

# Variação percentual entre o 1º e 2º turno
anos_eleicoes = [2002, 2006, 2010, 2014, 2018, 2022]

dict_pct_changes_turnos = {}

for data_1, data_2, ano in zip(lst_segunda_feira_pos_1_turno, lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_turno = round(((df_ibov.loc[data_2] / df_ibov.loc[data_1]) - 1) * 100, 2)
    dict_pct_changes_turnos[ano] = pct_change_turno

# Transforando em um df
df_pct_changes_turnos = pd.DataFrame.from_dict(dict_pct_changes_turnos, orient='index', columns=['pct_change_turnos'])
df_pct_changes_turnos

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 1º turno (segunda-feira pós 1º turno)
dict_meses_1_turno = {}

for primeiro_turno, ano in zip(lst_segunda_feira_pos_1_turno, anos_eleicoes):
    pct_change_jan_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_1_turno = round(((df_ibov.loc[primeiro_turno] / df_ibov[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_1_turno[ano] = {
        'Jan': pct_change_jan_1_turno,
        'Feb': pct_change_feb_1_turno,
        'Mar': pct_change_mar_1_turno,
        'Apr': pct_change_apr_1_turno,
        'May': pct_change_may_1_turno,
        'Jun': pct_change_jun_1_turno,
        'Jul': pct_change_jul_1_turno,
        'Aug': pct_change_aug_1_turno,
        'Sep': pct_change_sep_1_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_1_turno = pd.DataFrame(dict_meses_1_turno).T
df_pct_change_meses_1_turno

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 2º turno (segunda-feira pós 2º turno)
dict_meses_2_turno = {}

for segundo_turno, ano in zip(lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_jan_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_2_turno = round(((df_ibov.loc[segundo_turno] / df_ibov[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_2_turno[ano] = {
        'Jan': pct_change_jan_2_turno,
        'Feb': pct_change_feb_2_turno,
        'Mar': pct_change_mar_2_turno,
        'Apr': pct_change_apr_2_turno,
        'May': pct_change_may_2_turno,
        'Jun': pct_change_jun_2_turno,
        'Jul': pct_change_jul_2_turno,
        'Aug': pct_change_aug_2_turno,
        'Sep': pct_change_sep_2_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_2_turno = pd.DataFrame(dict_meses_2_turno).T
df_pct_change_meses_2_turno

In [None]:
# Calculando o retorno diário
ret_diario = df_ibov.pct_change()

# Criando uma lista com os drawdowns de cada ano eleitoral
lista_drawdowns_eleitorais = [f_br.drawdown(ret_diario.loc[f'{ano}']) for ano in anos_eleitorais]

df_drawdowns_eleitorais= pd.DataFrame(lista_drawdowns_eleitorais, columns=['drawdown_ano_eleitoral'], index=anos_eleitorais)
df_drawdowns_eleitorais

In [None]:
# Calculando o retorno logarítmico
ret_log = np.log(df_ibov / df_ibov.shift(1))

# Calculando a volatilidade anualizada dos anos eleitorais
lista_vol_anual = [(ret_log.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_eleitorais]

df_vol_anual = pd.DataFrame(lista_vol_anual, columns=['vol_anual'], index=anos_eleitorais)
df_vol_anual

### PETR4

In [None]:
# Download dos dados do papel em específico
ticker = 'PETR4.SA'
petr = yf.download(ticker, start='1995-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Resetando o index do df
petr = petr.reset_index()  

# Renomeando as colunas para remover o MultiIndex
petr.columns = ['Date', 'Close']  

# Transformando a coluna 'Date' no index do df
petr = petr.set_index('Date')

# Fazendo uma copia do df ativo
df = petr.copy()

# Cria uma coluna para o ano de cada dia
df['ano'] = df.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df['dia_do_ano'] = df.index.dayofyear 

# Criando a tabela pivot
df_pivot = df.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
df_pivot_petr = df_pivot.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
df_pivot_petr = (df_pivot_petr / df_pivot_petr.iloc[0]) - 1

df_pivot_petr

In [None]:
# Plotando o gráfico dos anos eleitorais
anos_eleitorais = [2002, 2006, 2010, 2014, 2018, 2022]

fig = px.line(df_pivot_petr[anos_eleitorais], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance PETR4 em anos eleitorais',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Criando duas linhas verticais no início e fim de Outubro
fig.add_vline(x=pd.to_datetime('2022-10-01').dayofyear)
fig.add_vline(x=pd.to_datetime('2022-10-31').dayofyear)

# Criando uma linha horizontal
fig.add_hline(y=0, line=dict(color='red', width=1))

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

fig

In [None]:
# Calculando o retorno mensal de Outubro dos anos eleitorais
lista_ret_out = [round((((df.loc[f'{ano}-10', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

# Calculando o retorno mensal de Outubro até o final do ano eleitoral
lista_ret_out_dez = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1 )*100, 2) for ano in anos_eleitorais]

# Calculando o retorno anual dos anos eleitorais
lista_ret_ano = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-01', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

df_ret_eleicao_petr = pd.DataFrame(list(zip(lista_ret_out, lista_ret_out_dez, lista_ret_ano)), 
                              columns=['retorno_out', 'retorno_out_dez', 'retorno_anual'], 
                              index=anos_eleitorais
)
df_ret_eleicao_petr

In [None]:
df_petr = yf.download('PETR4.SA', start='2002-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Plotando o 1º e 2º dos anos eleitorais
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_petr.index,
    y=df_petr
))

# Adicionando linhas verticais nas datas do 1º e 2º turno das eleições
fig.add_vline(x='2002-10-06', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Serra)
fig.add_vline(x='2002-10-27', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2006-10-01', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Alckmin)
fig.add_vline(x='2006-10-29', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2010-10-03', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Dilma x Serra)
fig.add_vline(x='2010-10-31', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Dilma ganhadora)

fig.add_vline(x='2014-10-05', line_width=1, line_dash='dash', line_color='black') # 1º turno 2014 (Dilma x Aécio)
fig.add_vline(x='2014-10-26', line_width=1, line_dash='dash', line_color='red') # 2º turno 2014 (Dilma ganhadora)

fig.add_vline(x='2018-10-07', line_width=1, line_dash='dash', line_color='black') # 1º turno 2018 (Haddad x Bolsonaro)
fig.add_vline(x='2018-10-28', line_width=1, line_dash='dash', line_color='red') # 2º turno 2018 (Bolsonaro ganhador)

fig.add_vline(x='2022-10-02', line_width=1, line_dash='dash', line_color='black') # 1º turno 2022 (Lula x Bolsonaro)
fig.add_vline(x='2022-10-30', line_width=1, line_dash='dash', line_color='red') # 2º turno 2022 (Lula ganhador)

fig.update_layout(
    title='PETR4 - 1º e 2º turno das eleições',
    template='seaborn'
)

fig.show()

In [None]:
# Datas dos 1º e 2º turnos das eleições
lst_datas_turnos = [
    ('2002-10-06', '2002-10-27'),
    ('2006-10-01', '2006-10-29'),
    ('2010-10-03', '2010-10-31'),
    ('2014-10-05', '2014-10-26'),
    ('2018-10-07', '2018-10-28'),
    ('2022-10-02', '2022-10-30')
]

# Lista das segundas-feiras pós cada turno
lst_segunda_feira_pos_1_turno = []
lst_segunda_feira_pos_2_turno = []

for primeiro_turno, segundo_turno in lst_datas_turnos:
    # Calculando a segunda-feira após o 1º turno
    data_1_turno = datetime.strptime(primeiro_turno, '%Y-%m-%d')
    segunda_feira_pos_1_turno = (data_1_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_1_turno.append(segunda_feira_pos_1_turno)

    # Calculando a segunda-feira após o 2º turno
    data_2_turno = datetime.strptime(segundo_turno, '%Y-%m-%d')
    segunda_feira_pos_2_turno = (data_2_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_2_turno.append(segunda_feira_pos_2_turno)

# Variação percentual entre o 1º e 2º turno
anos_eleicoes = [2002, 2006, 2010, 2014, 2018, 2022]

dict_pct_changes_turnos = {}

for data_1, data_2, ano in zip(lst_segunda_feira_pos_1_turno, lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_turno = round(((df_petr.loc[data_2] / df_petr.loc[data_1]) - 1) * 100, 2)
    dict_pct_changes_turnos[ano] = pct_change_turno

# Transforando em um df
df_pct_changes_turnos_petr = pd.DataFrame.from_dict(dict_pct_changes_turnos, orient='index', columns=['pct_change_turnos'])
df_pct_changes_turnos_petr

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 1º turno (segunda-feira pós 1º turno)
dict_meses_1_turno = {}

for primeiro_turno, ano in zip(lst_segunda_feira_pos_1_turno, anos_eleicoes):
    pct_change_jan_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_1_turno = round(((df_petr.loc[primeiro_turno] / df_petr[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_1_turno[ano] = {
        'Jan': pct_change_jan_1_turno,
        'Feb': pct_change_feb_1_turno,
        'Mar': pct_change_mar_1_turno,
        'Apr': pct_change_apr_1_turno,
        'May': pct_change_may_1_turno,
        'Jun': pct_change_jun_1_turno,
        'Jul': pct_change_jul_1_turno,
        'Aug': pct_change_aug_1_turno,
        'Sep': pct_change_sep_1_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_1_turno_petr = pd.DataFrame(dict_meses_1_turno).T
df_pct_change_meses_1_turno_petr

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 2º turno (segunda-feira pós 2º turno)
dict_meses_2_turno = {}

for segundo_turno, ano in zip(lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_jan_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_2_turno = round(((df_petr.loc[segundo_turno] / df_petr[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_2_turno[ano] = {
        'Jan': pct_change_jan_2_turno,
        'Feb': pct_change_feb_2_turno,
        'Mar': pct_change_mar_2_turno,
        'Apr': pct_change_apr_2_turno,
        'May': pct_change_may_2_turno,
        'Jun': pct_change_jun_2_turno,
        'Jul': pct_change_jul_2_turno,
        'Aug': pct_change_aug_2_turno,
        'Sep': pct_change_sep_2_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_2_turno_petr = pd.DataFrame(dict_meses_2_turno).T
df_pct_change_meses_2_turno_petr

In [None]:
# Calculando o retorno diário
ret_diario_petr = df_petr.pct_change()

# Criando uma lista com os drawdowns de cada ano eleitoral
lista_drawdowns_eleitorais_petr = [f_br.drawdown(ret_diario_petr.loc[f'{ano}']) for ano in anos_eleitorais]

df_drawdowns_eleitorais_petr = pd.DataFrame(lista_drawdowns_eleitorais_petr, columns=['drawdown_ano_eleitoral'], index=anos_eleitorais)
df_drawdowns_eleitorais_petr

In [None]:
# Calculando o retorno logarítmico
ret_log_petr = np.log(df_petr / df_petr.shift(1))

# Calculando a volatilidade anualizada dos anos eleitorais
lista_vol_anual_petr = [(ret_log_petr.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_eleitorais]

df_vol_anual_petr = pd.DataFrame(lista_vol_anual_petr, columns=['vol_anual'], index=anos_eleitorais)
df_vol_anual_petr

### VALE3

In [None]:
# Download dos dados do papel em específico
ticker = 'VALE3.SA'
vale = yf.download(ticker, start='1995-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Resetando o index do df
vale = vale.reset_index()  

# Renomeando as colunas para remover o MultiIndex
vale.columns = ['Date', 'Close']  

# Transformando a coluna 'Date' no index do df
vale = vale.set_index('Date')

# Fazendo uma copia do df ativo
df = vale.copy()

# Cria uma coluna para o ano de cada dia
df['ano'] = df.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df['dia_do_ano'] = df.index.dayofyear 

# Criando a tabela pivot
df_pivot = df.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
df_pivot_vale = df_pivot.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
df_pivot_vale = (df_pivot_vale / df_pivot_vale.iloc[0]) - 1

df_pivot_vale

In [None]:
# Plotando o gráfico dos anos eleitorais
anos_eleitorais = [2002, 2006, 2010, 2014, 2018, 2022]

fig = px.line(df_pivot_vale[anos_eleitorais], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance VALE3 em anos eleitorais',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Criando duas linhas verticais no início e fim de Outubro
fig.add_vline(x=pd.to_datetime('2022-10-01').dayofyear)
fig.add_vline(x=pd.to_datetime('2022-10-31').dayofyear)

# Criando uma linha horizontal
fig.add_hline(y=0, line=dict(color='red', width=1))

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

fig

In [None]:
# Calculando o retorno mensal de Outubro dos anos eleitorais
lista_ret_out = [round((((df.loc[f'{ano}-10', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

# Calculando o retorno mensal de Outubro até o final do ano eleitoral
lista_ret_out_dez = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1 )*100, 2) for ano in anos_eleitorais]

# Calculando o retorno anual dos anos eleitorais
lista_ret_ano = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-01', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

df_ret_eleicao_vale = pd.DataFrame(list(zip(lista_ret_out, lista_ret_out_dez, lista_ret_ano)), 
                              columns=['retorno_out', 'retorno_out_dez', 'retorno_anual'], 
                              index=anos_eleitorais
)

df_ret_eleicao_vale

In [None]:
df_vale = yf.download('VALE3.SA', start='2002-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Plotando o 1º e 2º dos anos eleitorais
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vale.index,
    y=df_vale
))

# Adicionando linhas verticais nas datas do 1º e 2º turno das eleições
fig.add_vline(x='2002-10-06', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Serra)
fig.add_vline(x='2002-10-27', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2006-10-01', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Alckmin)
fig.add_vline(x='2006-10-29', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2010-10-03', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Dilma x Serra)
fig.add_vline(x='2010-10-31', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Dilma ganhadora)

fig.add_vline(x='2014-10-05', line_width=1, line_dash='dash', line_color='black') # 1º turno 2014 (Dilma x Aécio)
fig.add_vline(x='2014-10-26', line_width=1, line_dash='dash', line_color='red') # 2º turno 2014 (Dilma ganhadora)

fig.add_vline(x='2018-10-07', line_width=1, line_dash='dash', line_color='black') # 1º turno 2018 (Haddad x Bolsonaro)
fig.add_vline(x='2018-10-28', line_width=1, line_dash='dash', line_color='red') # 2º turno 2018 (Bolsonaro ganhador)

fig.add_vline(x='2022-10-02', line_width=1, line_dash='dash', line_color='black') # 1º turno 2022 (Lula x Bolsonaro)
fig.add_vline(x='2022-10-30', line_width=1, line_dash='dash', line_color='red') # 2º turno 2022 (Lula ganhador)

fig.update_layout(
    title='VALE3 - 1º e 2º turno das eleições',
    template='seaborn'
)

fig.show()

In [None]:
# Datas dos 1º e 2º turnos das eleições
lst_datas_turnos = [
    ('2002-10-06', '2002-10-27'),
    ('2006-10-01', '2006-10-29'),
    ('2010-10-03', '2010-10-31'),
    ('2014-10-05', '2014-10-26'),
    ('2018-10-07', '2018-10-28'),
    ('2022-10-02', '2022-10-30')
]

# Lista das segundas-feiras pós cada turno
lst_segunda_feira_pos_1_turno = []
lst_segunda_feira_pos_2_turno = []

for primeiro_turno, segundo_turno in lst_datas_turnos:
    # Calculando a segunda-feira após o 1º turno
    data_1_turno = datetime.strptime(primeiro_turno, '%Y-%m-%d')
    segunda_feira_pos_1_turno = (data_1_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_1_turno.append(segunda_feira_pos_1_turno)

    # Calculando a segunda-feira após o 2º turno
    data_2_turno = datetime.strptime(segundo_turno, '%Y-%m-%d')
    segunda_feira_pos_2_turno = (data_2_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_2_turno.append(segunda_feira_pos_2_turno)

# Variação percentual entre o 1º e 2º turno
anos_eleicoes = [2002, 2006, 2010, 2014, 2018, 2022]

dict_pct_changes_turnos = {}

for data_1, data_2, ano in zip(lst_segunda_feira_pos_1_turno, lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_turno = round(((df_vale.loc[data_2] / df_vale.loc[data_1]) - 1) * 100, 2)
    dict_pct_changes_turnos[ano] = pct_change_turno

# Transforando em um df
df_pct_changes_turnos_vale = pd.DataFrame.from_dict(dict_pct_changes_turnos, orient='index', columns=['pct_change_turnos'])
df_pct_changes_turnos_vale

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 1º turno (segunda-feira pós 1º turno)
dict_meses_1_turno = {}

for primeiro_turno, ano in zip(lst_segunda_feira_pos_1_turno, anos_eleicoes):
    pct_change_jan_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_1_turno = round(((df_vale.loc[primeiro_turno] / df_vale[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_1_turno[ano] = {
        'Jan': pct_change_jan_1_turno,
        'Feb': pct_change_feb_1_turno,
        'Mar': pct_change_mar_1_turno,
        'Apr': pct_change_apr_1_turno,
        'May': pct_change_may_1_turno,
        'Jun': pct_change_jun_1_turno,
        'Jul': pct_change_jul_1_turno,
        'Aug': pct_change_aug_1_turno,
        'Sep': pct_change_sep_1_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_1_turno_vale = pd.DataFrame(dict_meses_1_turno).T
df_pct_change_meses_1_turno_vale

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 2º turno (segunda-feira pós 2º turno)
dict_meses_2_turno = {}

for segundo_turno, ano in zip(lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_jan_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_2_turno = round(((df_vale.loc[segundo_turno] / df_vale[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_2_turno[ano] = {
        'Jan': pct_change_jan_2_turno,
        'Feb': pct_change_feb_2_turno,
        'Mar': pct_change_mar_2_turno,
        'Apr': pct_change_apr_2_turno,
        'May': pct_change_may_2_turno,
        'Jun': pct_change_jun_2_turno,
        'Jul': pct_change_jul_2_turno,
        'Aug': pct_change_aug_2_turno,
        'Sep': pct_change_sep_2_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_2_turno_vale = pd.DataFrame(dict_meses_2_turno).T
df_pct_change_meses_2_turno_vale

In [None]:
# Calculando o retorno diário
ret_diario_vale = df_vale.pct_change()

# Criando uma lista com os drawdowns de cada ano eleitoral
lista_drawdowns_eleitorais_vale = [f_br.drawdown(ret_diario_vale.loc[f'{ano}']) for ano in anos_eleitorais]

df_drawdowns_eleitorais_vale = pd.DataFrame(lista_drawdowns_eleitorais_vale, columns=['drawdown_ano_eleitoral'], index=anos_eleitorais)
df_drawdowns_eleitorais_vale

In [None]:
# Calculando o retorno logarítmico
ret_log_vale = np.log(df_vale / df_vale.shift(1))

# Calculando a volatilidade anualizada dos anos eleitorais
lista_vol_anual_vale = [(ret_log_vale.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_eleitorais]

df_vol_anual_vale = pd.DataFrame(lista_vol_anual_vale, columns=['vol_anual'], index=anos_eleitorais)
df_vol_anual_vale

### BBAS3

In [None]:
# Download dos dados do papel em específico
ticker = 'BBAS3.SA'
bbas = yf.download(ticker, start='1995-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Resetando o index do df
bbas = bbas.reset_index()  

# Renomeando as colunas para remover o MultiIndex
bbas.columns = ['Date', 'Close']  

# Transformando a coluna 'Date' no index do df
bbas = bbas.set_index('Date')

# Fazendo uma copia do df ativo
df = bbas.copy()

# Cria uma coluna para o ano de cada dia
df['ano'] = df.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df['dia_do_ano'] = df.index.dayofyear 

# Criando a tabela pivot
df_pivot = df.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
df_pivot_bbas = df_pivot.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
df_pivot_bbas = (df_pivot_bbas / df_pivot_bbas.iloc[0]) - 1

df_pivot_bbas

In [None]:
# Plotando o gráfico dos anos eleitorais
anos_eleitorais = [2002, 2006, 2010, 2014, 2018, 2022]

fig = px.line(df_pivot_bbas[anos_eleitorais], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance BBAS3 em anos eleitorais',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Criando duas linhas verticais no início e fim de Outubro
fig.add_vline(x=pd.to_datetime('2022-10-01').dayofyear)
fig.add_vline(x=pd.to_datetime('2022-10-31').dayofyear)

# Criando uma linha horizontal
fig.add_hline(y=0, line=dict(color='red', width=1))

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

fig

In [None]:
# Calculando o retorno mensal de Outubro dos anos eleitorais
lista_ret_out = [round((((df.loc[f'{ano}-10', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

# Calculando o retorno mensal de Outubro até o final do ano eleitoral
lista_ret_out_dez = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-10', 'Close'].iloc[0]))-1 )*100, 2) for ano in anos_eleitorais]

# Calculando o retorno anual dos anos eleitorais
lista_ret_ano = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-01', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_eleitorais]

df_ret_eleicao_bbas = pd.DataFrame(list(zip(lista_ret_out, lista_ret_out_dez, lista_ret_ano)), 
                              columns=['retorno_out', 'retorno_out_dez', 'retorno_anual'], 
                              index=anos_eleitorais
)

df_ret_eleicao_bbas

In [None]:
df_bbas = yf.download('BBAS3.SA', start='2002-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Plotando o 1º e 2º dos anos eleitorais
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_bbas.index,
    y=df_bbas
))

# Adicionando linhas verticais nas datas do 1º e 2º turno das eleições
fig.add_vline(x='2002-10-06', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Serra)
fig.add_vline(x='2002-10-27', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2006-10-01', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Lula x Alckmin)
fig.add_vline(x='2006-10-29', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Lula ganhador)

fig.add_vline(x='2010-10-03', line_width=1, line_dash='dash', line_color='black') # 1º turno 2010 (Dilma x Serra)
fig.add_vline(x='2010-10-31', line_width=1, line_dash='dash', line_color='red') # 2º turno 2010 (Dilma ganhadora)

fig.add_vline(x='2014-10-05', line_width=1, line_dash='dash', line_color='black') # 1º turno 2014 (Dilma x Aécio)
fig.add_vline(x='2014-10-26', line_width=1, line_dash='dash', line_color='red') # 2º turno 2014 (Dilma ganhadora)

fig.add_vline(x='2018-10-07', line_width=1, line_dash='dash', line_color='black') # 1º turno 2018 (Haddad x Bolsonaro)
fig.add_vline(x='2018-10-28', line_width=1, line_dash='dash', line_color='red') # 2º turno 2018 (Bolsonaro ganhador)

fig.add_vline(x='2022-10-02', line_width=1, line_dash='dash', line_color='black') # 1º turno 2022 (Lula x Bolsonaro)
fig.add_vline(x='2022-10-30', line_width=1, line_dash='dash', line_color='red') # 2º turno 2022 (Lula ganhador)

fig.update_layout(
    title='BBAS3 - 1º e 2º turno das eleições',
    template='seaborn'
)

fig.show()

In [None]:
# Datas dos 1º e 2º turnos das eleições
lst_datas_turnos = [
    ('2002-10-06', '2002-10-27'),
    ('2006-10-01', '2006-10-29'),
    ('2010-10-03', '2010-10-31'),
    ('2014-10-05', '2014-10-26'),
    ('2018-10-07', '2018-10-28'),
    ('2022-10-02', '2022-10-30')
]

# Lista das segundas-feiras pós cada turno
lst_segunda_feira_pos_1_turno = []
lst_segunda_feira_pos_2_turno = []

for primeiro_turno, segundo_turno in lst_datas_turnos:
    # Calculando a segunda-feira após o 1º turno
    data_1_turno = datetime.strptime(primeiro_turno, '%Y-%m-%d')
    segunda_feira_pos_1_turno = (data_1_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_1_turno.append(segunda_feira_pos_1_turno)

    # Calculando a segunda-feira após o 2º turno
    data_2_turno = datetime.strptime(segundo_turno, '%Y-%m-%d')
    segunda_feira_pos_2_turno = (data_2_turno + timedelta(days=1)).strftime('%Y-%m-%d')
    lst_segunda_feira_pos_2_turno.append(segunda_feira_pos_2_turno)

# Variação percentual entre o 1º e 2º turno
anos_eleicoes = [2002, 2006, 2010, 2014, 2018, 2022]

dict_pct_changes_turnos = {}

for data_1, data_2, ano in zip(lst_segunda_feira_pos_1_turno, lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_turno = round(((df_bbas.loc[data_2] / df_bbas.loc[data_1]) - 1) * 100, 2)
    dict_pct_changes_turnos[ano] = pct_change_turno

# Transforando em um df
df_pct_changes_turnos_bbas = pd.DataFrame.from_dict(dict_pct_changes_turnos, orient='index', columns=['pct_change_turnos'])
df_pct_changes_turnos_bbas

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 1º turno (segunda-feira pós 1º turno)
dict_meses_1_turno = {}

for primeiro_turno, ano in zip(lst_segunda_feira_pos_1_turno, anos_eleicoes):
    pct_change_jan_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_1_turno = round(((df_bbas.loc[primeiro_turno] / df_bbas[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_1_turno[ano] = {
        'Jan': pct_change_jan_1_turno,
        'Feb': pct_change_feb_1_turno,
        'Mar': pct_change_mar_1_turno,
        'Apr': pct_change_apr_1_turno,
        'May': pct_change_may_1_turno,
        'Jun': pct_change_jun_1_turno,
        'Jul': pct_change_jul_1_turno,
        'Aug': pct_change_aug_1_turno,
        'Sep': pct_change_sep_1_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_1_turno_bbas = pd.DataFrame(dict_meses_1_turno).T
df_pct_change_meses_1_turno_bbas

In [None]:
# Variação percentual entre o 1º dia dos meses de Janeiro a Setembro e o 2º turno (segunda-feira pós 2º turno)
dict_meses_2_turno = {}

for segundo_turno, ano in zip(lst_segunda_feira_pos_2_turno, anos_eleicoes):
    pct_change_jan_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-01'].iloc[0]) - 1) * 100, 2)
    pct_change_feb_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-02'].iloc[0]) - 1) * 100, 2)
    pct_change_mar_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-03'].iloc[0]) - 1) * 100, 2)
    pct_change_apr_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-04'].iloc[0]) - 1) * 100, 2)
    pct_change_may_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-05'].iloc[0]) - 1) * 100, 2)
    pct_change_jun_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-06'].iloc[0]) - 1) * 100, 2)
    pct_change_jul_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-07'].iloc[0]) - 1) * 100, 2)
    pct_change_aug_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-08'].iloc[0]) - 1) * 100, 2)
    pct_change_sep_2_turno = round(((df_bbas.loc[segundo_turno] / df_bbas[f'{ano}-09'].iloc[0]) - 1) * 100, 2)
    
    # Armazena um novo dicionário com chaves para cada mês
    dict_meses_2_turno[ano] = {
        'Jan': pct_change_jan_2_turno,
        'Feb': pct_change_feb_2_turno,
        'Mar': pct_change_mar_2_turno,
        'Apr': pct_change_apr_2_turno,
        'May': pct_change_may_2_turno,
        'Jun': pct_change_jun_2_turno,
        'Jul': pct_change_jul_2_turno,
        'Aug': pct_change_aug_2_turno,
        'Sep': pct_change_sep_2_turno
    }

# Transformando o dicionário em um df
df_pct_change_meses_2_turno_bbas = pd.DataFrame(dict_meses_2_turno).T
df_pct_change_meses_2_turno_bbas

In [None]:
# Calculando o retorno diário
ret_diario_bbas = df_vale.pct_change()

# Criando uma lista com os drawdowns de cada ano eleitoral
lista_drawdowns_eleitorais_bbas = [f_br.drawdown(ret_diario_bbas.loc[f'{ano}']) for ano in anos_eleitorais]

df_drawdowns_eleitorais_bbas = pd.DataFrame(lista_drawdowns_eleitorais_bbas, columns=['drawdown_ano_eleitoral'], index=anos_eleitorais)
df_drawdowns_eleitorais_bbas

In [None]:
# Calculando o retorno logarítmico
ret_log_bbas = np.log(df_bbas / df_bbas.shift(1))

# Calculando a volatilidade anualizada dos anos eleitorais
lista_vol_anual_bbas = [(ret_log_bbas.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_eleitorais]

df_vol_anual_bbas = pd.DataFrame(lista_vol_anual_bbas, columns=['vol_anual'], index=anos_eleitorais)
df_vol_anual_bbas

## Anos de Crises - BRASIL

In [None]:
# Download dos dados do papel em específico
ticker = '^BVSP'
ativo = yf.download(ticker, start='1995-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Resetando o index do df
ativo = ativo.reset_index()  

# Renomeando as colunas para remover o MultiIndex
ativo.columns = ['Date', 'Close']  

# Transformando a coluna 'Date' no index do df
ativo = ativo.set_index('Date')

# Fazendo uma copia do df ativo
df = ativo.copy()

# Cria uma coluna para o ano de cada dia
df['ano'] = df.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df['dia_do_ano'] = df.index.dayofyear 

# Criando a tabela pivot
tabela = df.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
tabela_final = tabela.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
tabela_final = (tabela_final / tabela_final.iloc[0]) - 1

# Plotando o gráfico de anos de crises
anos_crises = [1998, 2000, 2008, 2014, 2020]

fig = px.line(tabela_final[anos_crises], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance IBOVESPA em anos de crises',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

# Criando duas linhas verticais no início e fim de Outubro
fig.add_hline(y=0)

fig.show()

In [None]:
# Calculando o retorno anual dos anos de crises
lista_ret_ano = [round((((df.loc[f'{ano}-12', 'Close'].iloc[-1] / df.loc[f'{ano}-01', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_crises]

df_ret_crise = pd.DataFrame(lista_ret_ano, 
                            columns=['retorno_anual_crise'], 
                            index=anos_crises
)

df_ret_crise 

In [None]:
# Calculando o retorno diário
ret_diario = df_ibov.pct_change()

# Criando uma lista com os drawdowns de cada ano de crise
lista_drawdowns_crises = [f_br.drawdown(ret_diario.loc[f'{ano}']) for ano in anos_crises]

df_drawdowns_crises = pd.DataFrame(lista_drawdowns_crises, columns=['drawdown_anos_crises'], index=anos_crises)
df_drawdowns_crises

In [None]:
# Calculando o retorno logarítmico
ret_log = np.log(df_ibov / df_ibov.shift(1))

# Calculando a volatilidade anualizada dos anos crises
lista_vol_anual_crises = [(ret_log.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_crises]

df_vol_anual_crises = pd.DataFrame(lista_vol_anual_crises, columns=['vol_anual'], index=anos_crises)
df_vol_anual_crises

## Utilizando o retorno normal, a volatilidade anual fica parecida com a volatilidade anual do retorno logarítmico
# lista_vol_anual_crises = [(df['ret_diario'].loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_crises]

In [None]:
# Minimas (fundos) das crises
minimas_crises = [ativo.loc[f'{ano}', 'Close'].min() for ano in anos_crises]

# Indexes das minimas das crises
idx_minimas = [ativo.loc[f'{ano}', 'Close'].idxmin() for ano in anos_crises]

# Máximas (topos) prévias dos fundos das crises
maximas_previas = [ativo.loc[:idx_minimas[i], 'Close'].max() for i in range(len(anos_crises))]

# Criando dfs pós crise de cada ano p/ achar os indexes dos dias que o preço volta p/ o patamar das máximas anteriores as crises
df_pos_crise = {i: ativo.loc[idx_minimas[i]:, 'Close'] for i in range(len(anos_crises))}
# Lógica do dict comprehension
# df = {}
# for i in range(len(idx_minimas)):
#   df[i] = ativo.loc[idx_minimas[i]:, 'Close']

# Lista dos indexes dos dias que recupera o preço da máxima anterior da crise
idx_rec = [df_pos_crise[i].loc[ativo.loc[idx_minimas[i]:, 'Close'] >= maximas_previas[i]].index[0] for i in range(len(anos_crises))]
# Ficou confuso na list comprehension. A lógica dela é:
# lista_idx_rec = []
# for i in range(len(idx_minimas)):
#   filt = ativo.loc[idx_minimas[i]:, 'Close'] >= maximas_previas[i]  # Filtro que seleciona os dias em que alcança o preço da máxima anterior da crise.
#   idx_rec = df_pos_crise[i].loc[filt].index[0]                           # Seleciono o index do primeiro dia que se alcança o preço da máxima anterior da crise.
#   lista_idx_rec.append(idx_rec)

# Para eu saber a diferença entre as datas de minimas das crises e topos anteriores, eu vejo o tamanho do df a partir do slice idx_minimas[i]:idx_rec[i]
# Eu não preciso usar o np.busday_count, pq eu estou utilizando os dados do yahoo finance que contém apenas os dias em que a bolsa opera
lista_dias_rec = [len(ativo.loc[idx_minimas[i]:idx_rec[i], 'Close']) for i in range(len(anos_crises))]

## Convertendo de timestamp p/ datetime. Para ficar apenas as datas no df (se fica em timestamp aparece as horas -> 1998-09-10 00:00:00-03:00)
idx_rec2 = list(map(lambda x: x.date(), idx_rec))
idx_minimas2 = list(map(lambda x: x.date(), idx_minimas))

# Juntando todas as listas criadas em um df
df_crise_br = pd.DataFrame(list(zip(idx_minimas2, minimas_crises, maximas_previas, idx_rec2, lista_dias_rec)),
                        columns=['data_minimas','minimas_crises', 'maximas_previas', 'data_recuperacao', 'dias_recuperacao'], 
                        index=anos_crises)

df_crise_br



# Apenas p/ estudos, utilizando o np.busday_count (*** DÁ UM POUCO DE DIFERENÇA NOS DIAS DE RECUPERAÇÃO ***)

## Convertendo de timestamp p/ datetime. Deste modo, posso usar o np.busday_count()
# idx_rec2 = list(map(lambda x: x.date(), idx_rec))
# idx_minimas2 = list(map(lambda x: x.date(), idx_minimas))

## Lendo o arquivo da feriados_anbima.
# holidays_br = pd.read_excel('/content/drive/MyDrive/Séries Históricas/ANBIMA/feriados_anbima.xlsx')
# holidays_br['data'] = holidays_br.loc[:, 'data'].astype(str)
# holidays_br = list(holidays_br['data'])

## Quantos dias demorou p/ o mercado voltar ao topo prévio pós-crise, considerando apenas os dias úteis.
# lista_dias_rec = [np.busday_count(idx_minimas2[i], idx_rec2[i], holidays=holidays_br) for i in range(len(idx_minimas))]

## Criando o df das crises dos EUA.
# df_crise_br = pd.DataFrame(list(zip(minimas_crises, maximas_previas, lista_dias_rec)),
#                         columns=['minimas_crises', 'maximas_previas', 'dias_recuperacao'], 
#                         index=anos_crises)

# df_crise_br

## Anos Eleitorais - EUA

In [None]:
# Download dos dados do papel em específico
ticker = '^GSPC' # Os dados do S&P500 começam no ano de 1950
ativo_eua = yf.download(ticker, start='1995-01-01', auto_adjust=True, multi_level_index=False)

# Resetando o index do df
ativo_eua = ativo_eua.reset_index()  

# Renomeando as colunas para remover o MultiIndex
ativo_eua.columns = ['Date', 'Close', 'High', 'Low', 'Open', 'Volume']  

# Transformando a coluna 'Date' no index do df
ativo_eua = ativo_eua.set_index('Date')

# Fazendo uma copia do df ativo
df_eua = ativo_eua.copy()

# Cria uma coluna para o ano de cada dia
df_eua['ano'] = df_eua.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df_eua['dia_do_ano'] = df_eua.index.dayofyear 

# Criando a tabela pivot
tabela_eua = df_eua.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
tabela_eua_final = tabela_eua.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
tabela_eua_final = (tabela_eua_final / tabela_eua_final.iloc[0]) - 1

tabela_eua_final

In [None]:
# Plotando o gráfico dos anos eleitorais
anos_eleitorais = [
    1996, 2000, 2004, 2008, 
    2012, 2016, 2020, 2024
]

fig = px.line(tabela_eua_final[anos_eleitorais], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance S&P500 em anos eleitorais',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Criando duas linhas verticais no início de Novembro
fig.add_vline(x=pd.to_datetime('2022-11-01').dayofyear)

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

# Criando duas linhas verticais no início e fim de Outubro
fig.add_hline(y=0)

fig.show()

## Anos de Crises - EUA

In [None]:
# Download dos dados do papel em específico
ticker = '^GSPC' # Os dados do S&P500 começam no ano de 1950
ativo_eua = yf.download(ticker, start='1987-01-01', auto_adjust=True, multi_level_index=False)

# Resetando o index do df
ativo_eua = ativo_eua.reset_index()  

# Renomeando as colunas para remover o MultiIndex
ativo_eua.columns = ['Date', 'Close', 'High', 'Low', 'Open', 'Volume']  

# Transformando a coluna 'Date' no index do df
ativo_eua = ativo_eua.set_index('Date')

# Fazendo uma copia do df ativo
df_eua = ativo_eua.copy()

# Cria uma coluna para o ano de cada dia
df_eua['ano'] = df_eua.index.year 

# Cria uma coluna para o nº inteiro de cada dia -> 1 = primeiro dia do ano ... 365 = último dia do ano
df_eua['dia_do_ano'] = df_eua.index.dayofyear 

# Criando a tabela pivot
tabela_eua = df_eua.pivot(index='dia_do_ano', columns='ano', values='Close')

# Utilizo o método 'bfill' para completar os NaN
tabela_eua_final = tabela_eua.bfill()

# Tranformo a tabela dos preços de fechamento para a variação percentual do dia
tabela_eua_final = (tabela_eua_final / tabela_eua_final.iloc[0]) - 1

# Plotando o gráfico dos anos de crises
# https://www.investopedia.com/timeline-of-stock-market-crashes-5217820
anos_crises = [
    1987, # Black Monday
    2000, # Dot-com bubble
    2008, # Sub-prime bubble
    2010, # Flash crash
    2015, # Stock market selloff
    2020  # Covid crash
]

fig = px.line(tabela_eua_final[anos_crises], 
              height=600, 
              width=800, 
              template='plotly_dark',
              title='Performance S&P500 em anos de crises',
              labels={'value':'retorno'})

# Mudando a espessura da linha do gráfico
fig.update_traces(line=dict(width=1))

# Formatando o eixo y do gráfico para aparecer em %
fig.layout.yaxis.tickformat = '.0%'

# Criando duas linhas verticais no início e fim de Outubro
fig.add_hline(y=0)

fig.show()

In [None]:
# Calculando o retorno anual dos anos de crises
lista_ret_ano_eua = [round((((df_eua.loc[f'{ano}-12', 'Close'].iloc[-1] / df_eua.loc[f'{ano}-01', 'Close'].iloc[0]))-1)*100, 2) for ano in anos_crises]

df_ret_crise_eua = pd.DataFrame(lista_ret_ano_eua, 
                            columns=['retorno_anual_crise'], 
                            index=anos_crises
)

df_ret_crise_eua

In [None]:
# Calculando o retorno diário
ret_diario_eua = df_eua['Close'].pct_change()

# Criando uma lista com os drawdowns de cada ano de crise
lista_drawdowns_crises_eua = [f_br.drawdown(ret_diario_eua.loc[f'{ano}']) for ano in anos_crises]

df_drawdowns_crises_eua = pd.DataFrame(lista_drawdowns_crises_eua, columns=['drawdown_anos_crises'], index=anos_crises)
df_drawdowns_crises_eua

In [None]:
# Calculando a volatilidade anualizada dos anos crises
lista_vol_anual_crises_eua = [(ret_diario_eua.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_crises]

df_vol_anual_crises_eua = pd.DataFrame(lista_vol_anual_crises_eua, columns=['vol_anual'], index=anos_crises)
df_vol_anual_crises_eua

In [None]:
# Calculando o retorno logarítmico
ret_log_eua = np.log(df_eua['Close'] / df_eua['Close'].shift(1))

# Calculando a volatilidade anualizada dos anos eleitorais
lista_vol_anual_eua = [(ret_log_eua.loc[f'{anos}'].std() * np.sqrt(252) * 100) for anos in anos_eleitorais]

df_vol_anual_eua = pd.DataFrame(lista_vol_anual_eua, columns=['vol_anual'], index=anos_eleitorais)
df_vol_anual_eua

In [None]:
# Minimas (fundos) das crises
minimas_crises = [ativo_eua.loc[f'{ano}', 'Close'].min() for ano in anos_crises]

# Indexes das minimas das crises
idx_minimas = [ativo_eua.loc[f'{ano}', 'Close'].idxmin() for ano in anos_crises]

# Máximas (topos) prévias dos fundos das crises
maximas_previas = [ativo_eua.loc[:idx_minimas[i], 'Close'].max() for i in range(len(idx_minimas))]

# Criando dfs pós crise de cada ano p/ achar os indexes dos dias que o preço volta p/ o patamar das máximas anteriores as crises
df_pos_crise = {i: ativo_eua.loc[idx_minimas[i]:, 'Close'] for i in range(len(idx_minimas))}
# Lógica do dict comprehension
# df = {}
# for i in range(len(idx_minimas)):
#   df[i] = ativo2.loc[idx_minimas[i]:, 'Close']

# Lista dos indexes dos dias que recupera o preço da máxima anterior da crise
idx_rec = [df_pos_crise[i].loc[ativo_eua.loc[idx_minimas[i]:, 'Close'] >= maximas_previas[i]].index[0] for i in range(len(idx_minimas))]
# Ficou confuso na list comprehension. A lógica dela é:
# lista_idx_rec = []
# for i in range(len(idx_minimas)):
#   filt = ativo2.loc[idx_minimas[i]:, 'Close'] >= maximas_previas[i]  # Filtro que seleciona os dias em que alcança o preço da máxima anterior da crise.
#   idx_rec = df_pos_crise[i].loc[filt].index[0]                           # Seleciono o index do primeiro dia que se alcança o preço da máxima anterior da crise.
#   lista_idx_rec.append(idx_rec)

# Para eu saber a diferença entre as datas de minimas das crises e topos anteriores, eu vejo o tamanho do df a partir do slice idx_minimas[i]:idx_rec[i]
# Eu não preciso usar o np.busday_count, pq eu estou utilizando os dados do yahoo finance que contém apenas os dias em que a bolsa opera
lista_dias_rec = [len(ativo_eua.loc[idx_minimas[i]:idx_rec[i], 'Close']) for i in range(len(anos_crises))]

## Convertendo de timestamp p/ datetime. Para ficar apenas as datas no df (se fica em timestamp aparece as horas -> 1998-09-10 00:00:00-03:00)
idx_rec2 = list(map(lambda x: x.date(), idx_rec))
idx_minimas2 = list(map(lambda x: x.date(), idx_minimas))

# Juntando todas as listas criadas em um df
df_crise_eua = pd.DataFrame(list(zip(idx_minimas2, minimas_crises, maximas_previas, idx_rec2, lista_dias_rec)),
                        columns=['data_minimas','minimas_crises', 'maximas_previas','data_recuperacao', 'dias_recuperacao'], 
                        index=anos_crises)

df_crise_eua



## Convertendo de timestamp p/ datetime. Deste modo, posso usar o np.busday_count()
# idx_rec2 = list(map(lambda x: x.date(), idx_rec))
# idx_minimas2 = list(map(lambda x: x.date(), idx_minimas))

## Quantos dias demorou p/ o mercado voltar ao topo prévio pós-crise, considerando apenas os dias úteis.
# lista_dias_rec = [np.busday_count(idx_minimas2[i], idx_rec2[i]) for i in range(len(idx_minimas))]

## Criando o df das crises dos EUA.
# df_crise_eua = pd.DataFrame(list(zip(minimas_crises, maximas_previas, lista_dias_rec)),
#                         columns=['minimas_crises', 'maximas_previas', 'dias_recuperacao'], 
#                         index=anos_crises)

# df_crise_eua

## Bolha Dotcom vs AI

In [None]:
# Estudo comparativo do retorno acumulado do NASDAQ pós Netscape e pós ChatGPT (https://www.bespokepremium.com/interactive/posts/think-big-blog/ai-vs-the-web)
# Vídeo que mostra o estudo: https://www.youtube.com/watch?v=4a-TzdF8IMk

# Download dos dados da Nasdaq
ticker = '^IXIC' 

# Data pós Netscape de 01/12/1994 até 24/03/2000 (pico da bolha dot com)
nasdaq_post_netscape = yf.download(ticker, start='1994-12-01', end='2000-03-24', auto_adjust=True, multi_level_index=False)
nasdaq_post_netscape['pct_change'] = nasdaq_post_netscape['Close'].pct_change().dropna()

# Data pós Chatgpt de 30/11/2022 até o presente
nasdaq_post_chatgpt = yf.download(ticker, start='2022-11-30', auto_adjust=True, multi_level_index=False)
nasdaq_post_chatgpt['pct_change'] = nasdaq_post_chatgpt['Close'].pct_change().dropna()

# Calculando o retorno acumulado
ret_accum_nasdaq_post_netscape = (1 + nasdaq_post_netscape['pct_change']).cumprod()
ret_accum_nasdaq_post_chatgpt = (1 + nasdaq_post_chatgpt['pct_change']).cumprod()

# Normalizando o eixo x para a quantidade de dias desde o início de cada período
ret_accum_nasdaq_post_netscape_days = (ret_accum_nasdaq_post_netscape.index - ret_accum_nasdaq_post_netscape.index[0]).days
ret_accum_nasdaq_post_chatgpt_days = (ret_accum_nasdaq_post_chatgpt.index - ret_accum_nasdaq_post_chatgpt.index[0]).days

# Plot do retorno acumulado
fig = go.Figure()

fig.add_trace(go.Scatter( 
    x=ret_accum_nasdaq_post_netscape_days, # Usar os dias como eixo x
    y=ret_accum_nasdaq_post_netscape,
    mode='lines',
    name='Pós Netscape',
    line=dict(color='blue', width=2)
)) 

fig.add_trace(go.Scatter( 
    x=ret_accum_nasdaq_post_chatgpt_days, # Usar os dias como eixo x
    y=ret_accum_nasdaq_post_chatgpt,
    mode='lines',
    name='Pós ChatGPT',
    line=dict(color='red', width=2) 
)) 

fig.update_layout(
    title='Retorno Acumulado do NASDAQ pós Netscape e ChatGPT (Comparação de Dias)',
    xaxis_title='Dias desde o Início do Período', 
    yaxis_title='Retorno Acumulado', 
    template='plotly_white',
    hovermode="x unified" # Adicionado para melhor visualização ao passar o mouse
)

fig.show()

# **Maiores Sequências Alta/Baixa de um Ativo** 

In [None]:
df_streak = f_br.maior_streak(ticker='BOVA11.SA', start='2012-01-01')

# Df com a sequência de altas
print(df_streak[0])
print('-'*50)

# Df com a sequência de baixas
print(df_streak[1])

## Selecionar uma determinada sequência específica tanto de alta/baixa de um ativo

* Tutorial: https://blog.devgenius.io/streaks-in-pandas-time-series-c63fe62aa771


In [None]:
# Dados
ticker = 'ABEV3.SA'
start = '2012-01-01'

# Fazendo o dowload do ativo
df = yf.download(ticker, start, auto_adjust=True)['Close']

# Resetando o index do df
df = df.reset_index()

# Renomeando as colunas
df.columns = ['Date', 'Close']

# Transformando a coluna 'Date' no index do df
df = df.set_index('Date')

# Calculando as sequências de alta/baixa do ativo
df['returns'] = df['Close'].pct_change()
df['growing'] = df['Close'].gt(df['Close'].shift())
df['streak_start'] = (df['growing'].ne(df['growing'].shift()))
df['streak_no'] = df['streak_start'].cumsum()
df['streak_count'] = df.groupby('streak_no').cumcount().add(1)

# Mostrando a maior sequência do ativo
idx_max = df['streak_count'].idxmax()
max_streak_length = df.loc[idx_max, 'streak_count']
df_max_streak = df.loc[:idx_max, ['Close', 'streak_count']].tail(max_streak_length)

df_max_streak

In [None]:
# Filtrando o 'streak_count' para encontrar quais os outros dias de grandes sequências
filt_maiores_streaks = df['streak_count'] == 9
df.loc[filt_maiores_streaks]

In [None]:
# Para mostrar a sequência específica, basta colocar o index do dia da sequência
idx = '2024-05-29'
streak_length = df.loc[idx, 'streak_count']
df.loc[:idx, ['Close', 'streak_count']].tail(streak_length)

# **Monte Carlo Simulation**

## Monte Carlo Simulation of a Stock Portfolio

* Video da aula: https://www.youtube.com/watch?v=6-dhdMDiYWQ&list=PLqpCwow11-OqqfELduCMcRI6wcnoM3GAZ

In [None]:
stockList = ['PETR4.SA', 'VALE3.SA', 'TAEE11.SA', 'ITUB4.SA']
endDate = datetime.now()
startDate = endDate - timedelta(days=300)

meanReturns, covMatrix = f_br.get_data(stocks=stockList, start=startDate, end=endDate)

weights = np.random.random(len(meanReturns))
weights /= np.sum(weights)

# Monte Carlo Simulation
n_sims = 100 # número de simulações
t = 100 # timeframe in days

meanM = np.full(shape=(t, len(weights)), fill_value=meanReturns)  # Matriz com os retornos
meanM = meanM .T # Matriz transposta

portfolio_sims = np.full(shape=(t, n_sims), fill_value=0.0)  # Matriz de zeros 

initialPortfolio = 10_000 # quanto dinheiro começou com o portfolio

for m in range(0, n_sims):
    Z = np.random.normal(size=(t, len(weights)))
    L = np.linalg.cholesky(covMatrix)
    dailyReturns = meanM + np.inner(L, Z)
    portfolio_sims[:, m] = np.cumprod(np.inner(weights, dailyReturns.T) + 1) * initialPortfolio


# Plotando o gráfico
plt.figure(figsize=(10,6))
plt.plot(portfolio_sims)
plt.ylabel('Portfolio Value (R$)')
plt.xlabel('Days')
plt.title('Monte Carlo Simulation of a Stock Portfolio');

* Video da aula: https://www.youtube.com/watch?v=f9MAFvP5-pA&list=PLqpCwow11-OqqfELduCMcRI6wcnoM3GAZ&index=2

In [None]:
portfolioResults = pd.Series(portfolio_sims[-1, :])

VaR = initialPortfolio - f_br.mcVaR(portfolioResults, alpha=5)
CVaR = initialPortfolio - f_br.mcCVaR(portfolioResults, alpha=5)

print(f'VaR R${round(VaR, 2)}')
print(f'CVaR R${round(CVaR, 2)}')

## Monte Carlo Simulation of Drawdowns

* Vídeo da aula: https://www.youtube.com/watch?v=jJ6mZuI28kQ

In [None]:
ticker = '^BVSP'
start = '2010-01-01'
end = datetime.today().strftime('%Y-%m-%d')
df = yf.download(tickers=ticker, start=start, end=end, auto_adjust=True, multi_level_index=False)

# Calculando o retorno diário
df['returns'] = df['Close'].pct_change()
returns = df['Close'].pct_change().dropna().to_numpy().flatten()

# Vamos considerar 3 anos para frente e que 1 ano tenha 252 dias úteis
years = 3
num_days = years * 252
last_price = float(df['Close'].iloc[-1])

# Simulação de Monte Carlo do drawdown
num_sim = 100000 # nº de simulações

dd = np.array([]) # matriz vazia que vai guardar os drawdowns

for n in range(num_sim):
    # Etapas do cálculo do drawdown
    # Simula os retornos diários dos próximos 3 anos
    sim_ret = np.random.choice(returns, size=num_days, replace=True)

    # Calculando o valor da carteira com retornos compostos
    sim_val = last_price*(1+sim_ret).cumprod()

    # Calculando o valor máximo da carteira simulada
    max_val = np.maximum.accumulate(sim_val)

    # Encontrando o drawdown máximo
    max_dd = np.max((max_val - sim_val) / max_val)

    # Acrescentando os dd na metriz vazia
    dd = np.append(dd, max_dd)

# Plotando a distribuição dos drawdowns com MC
config = dict(histtype='stepfilled', alpha=0.7, density=False, bins=100)
plt.figure(figsize=(10,7))
plt.hist(dd, **config, label='Drawdown')
plt.xlabel('Retorno do drawdown')
plt.ylabel('Frequência')
plt.legend(loc='upper right',
           frameon=True,
           ncol=2,
           fancybox=True,
           framealpha=0.95,
           shadow=True,
           borderpad=1
)
plt.title(f'Distribuição dos drawdowns {ticker} com a simulação de MC')

# Estatísticas
print(f'Para o ativo {ticker}, segundo uma simulação de MC com {num_sim} simulações em {years} anos, podemos esperar:')
print('-'*70)
print(f'Drawdown médio de {round(np.mean(dd*100), 2)}%')
print()
print('Com: ')
print(f' 50% de probabilidade, o DD será maior do que {round(np.median(dd*100), 2)}%')
print(f' 25% de probabilidade, o DD será maior do que {round(np.percentile(dd*100, 75), 2)}%')
print(f' 5% de probabilidade, o DD será maior do que {round(np.percentile(dd*100, 95), 2)}%')
print('-'*70)
print(f'Período dos parâmetros para a simulação {start} a {end}.')

## pandas-montecarlo

* https://pypi.org/project/pandas-montecarlo/

In [None]:
import pandas_montecarlo # noqa: F401

In [None]:
# Carregando os dados do ativo
ticker = 'BOVA11.SA'
df = yf.download(ticker, start='2009-01-01', auto_adjust=True, multi_level_index=False)
df['return'] = df['Close'].pct_change().fillna(0)

# Simulação de Monte Carlo
mc = df['return'].montecarlo(sims=1000, bust=-1, goal=0)

# Plotando a simulação de Monte Carlos
mc.plot(title=f'{ticker} - Simulação de Monte Carlos', figsize=(30, 30))

In [None]:
# Mostrando os testes estatísticos
# 'maxdd': max drawdown
# 'bust': probability of going bust
# 'goal': probability of reaching 100% goal
mc.stats

In [None]:
#  Mostra as estatíticas do max drawdown 
mc.maxdd

In [None]:
# Mostras o raw df das simulações 
mc.data.head()

# **Entropia**

## Entropia Estrutural

* https://towardsdatascience.com/entropy-application-in-the-stock-market-b211914ed1f3

* https://github.com/cerlymarco/MEDIUM_NoteBook/blob/master/Structural_Entropy/Structural_Entropy.ipynb

* Eu fiz o download do paper "Structural Entropy Monitoring Correlation-Based Networks Over Time With Application to Financial Markets" que explica o conceito;
* Apliquei o código para os ativos brasileiros.

In [None]:
# Baixando os dados das ações brasileiras
lista_acoes = [
    'PETR4.SA', 
    'PRIO3.SA',
    'VALE3.SA', 
    'ITUB4.SA', 
    'BBDC3.SA',
    'BBAS3.SA', 
    'MGLU3.SA',
    'WEGE3.SA', 
    'EGIE3.SA', 
    'TAEE11.SA', 
    'ISAE4.SA',
    'CPLE3.SA', 
    'RANI3.SA', 
    'SUZB3.SA', 
    'ABEV3.SA', 
]

# Selecionando o 'Close'
df_carteira = yf.download(lista_acoes, start='2017-01-01', auto_adjust=True, multi_level_index=False)['Close']
df_carteira = df_carteira.loc[~df_carteira.isna().any(axis=1)].copy()
print(df_carteira.shape)
df_carteira.head()

In [None]:
# Calculando o retorno logaritmo
carteira_logret = (df_carteira .pct_change()).apply(np.log1p)
print(carteira_logret.shape)
carteira_logret.head()

In [None]:
# Plotando a correlação e a distribuição dos retornos logaritmos
plt.figure(figsize=(18,7))

plt.subplot(121)
plt.imshow(carteira_logret.corr())
plt.title('logret correlation')

plt.subplot(122)
carteira_logret.plot.hist(
    bins=100, 
    legend=False, 
    ax=plt.gca(), 
    title='logret distributions'
);

In [None]:
# Plotando o média e o desvio-padrão deslizantes do retorno logaritmo
sequence_length = 200

plt.figure(figsize=(18,6))

plt.subplot(121)
carteira_logret.rolling(sequence_length).mean().plot(
    legend=False, 
    color='blue', 
    alpha=0.3, 
    ax=plt.gca(), 
    title='logret sliding mean'
)

carteira_logret.rolling(sequence_length).mean().median(axis=1).plot(
    color='red', 
    linewidth=3, 
    ax=plt.gca()
)

plt.subplot(122)
carteira_logret.rolling(sequence_length).std().plot(
    legend=False, 
    color='blue', 
    alpha=0.3, 
    ax=plt.gca(), 
    title='logret sliding std'
)

carteira_logret.rolling(sequence_length).std().median(axis=1).plot(
    color='red', 
    linewidth=3, 
    ax=plt.gca()
);

In [None]:
# Calculando a entropia estrutural para a carteira_logret
sequence_length_carteira = 200
structural_entropy_05 = f_br.structural_entropy(carteira_logret, sequence_length_carteira, 0.5)
structural_entropy_06 = f_br.structural_entropy(carteira_logret, sequence_length_carteira, 0.6)
structural_entropy_07 = f_br.structural_entropy(carteira_logret, sequence_length_carteira, 0.7)
structural_entropy_08 = f_br.structural_entropy(carteira_logret, sequence_length_carteira, 0.8)

In [None]:
# Plotando a entropia estrutural
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=structural_entropy_05.index, 
    y=structural_entropy_05['structural_entropy'], 
    name='Structural Entropy - 0.5'
))

fig.add_trace(go.Scatter(
    x=structural_entropy_06.index, 
    y=structural_entropy_06['structural_entropy'], 
    name='Structural Entropy - 0.6'
))

fig.add_trace(go.Scatter(
    x=structural_entropy_07.index, 
    y=structural_entropy_07['structural_entropy'], 
    name='Structural Entropy - 0.7'
))

fig.add_trace(go.Scatter(
    x=structural_entropy_08.index, 
    y=structural_entropy_08['structural_entropy'], 
    name='Structural Entropy - 0.8'
))

fig.update_layout(title='Structural Entropy')
fig.show()

In [None]:
reference_entropy = structural_entropy_06.copy()

# Dia com a maior entropia estrutural
idx_max = reference_entropy['structural_entropy'].idxmax()
max_structural = reference_entropy['structural_entropy'].max()
print(f'O dia que teve a maior entropia estrutural foi de {max_structural:.4f} em {idx_max.date()}.')

# Dia com a menor entropia estrutural
idx_min = reference_entropy['structural_entropy'].idxmin()
min_structural = reference_entropy['structural_entropy'].min()
print(f'O dia que teve a menor entropia estrutural foi de {min_structural:.4f} em {idx_min.date()}.')

In [None]:
# Calculando a volatilidade
std_rolling = carteira_logret.rolling(sequence_length_carteira).std().median(axis=1) * 100  # Multipliquei por 100 para que o plot ficasse na mesma escala

# Plotando a comparação entre a entropia estrutural e a volatilidade
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=reference_entropy.index, 
    y=reference_entropy['structural_entropy'], 
    name='Structural Entropy'
))

fig.add_trace(go.Scatter(
    x=std_rolling.index, 
    y=std_rolling.values, 
    name='Volatility'
))

fig.update_layout(title='Structural Entropy vs Volatility')
fig.show()

# **Relação Sinal-Ruído (SNR)**

* Vídeo da aula: https://www.youtube.com/watch?v=uo5Bq_SFvgs

---

* A relação sinal-ruído (SNR) é uma métrica que compara o nível do sinal desejado ao nível do ruído no sinal;
* A SNR é geralmente expressa em decibéis (dB);
* Um SNR alto indica que o nível do sinal é significamente maior que o nível do ruído.

---

* No plot da função "plot_snr_vs_returns", espera-se que:
 * Quanto maior for o desvio-padrão (maior ruído - "noise"), menor será o valor do SNR;
 * Quanto menor for o desvio-padrão (menor ruído - "noise"), maior será o valor do SNR.

$$
\text{SNR} = 10\log_{10} \left(\frac{\text{Psignal}}{\text{Pnoise}}\right)
$$

In [None]:
# Dados 
ticker = 'BOVA11.SA'
df = yf.download(tickers=ticker, start='2018-01-01', auto_adjust=True, multi_level_index=False)['Close']
df = df.reset_index()
df.columns = ['Date', 'Close']
df = df.set_index('Date')
df['Returns'] = df['Close'].pct_change()
df['STD'] = df['Returns'].rolling(20).std()
# Selecionando o sinal (usaremos os preços de fechamento ajustados)
signal = df['Close'].values
dates = df.index

# Calculando o rolling SNR com uma janela de 20 dias
window = 20
snr_values = f_br.rolling_snr(signal=signal, window=window)

# Adicionando os valores do SNR no df
df['SNR'] = snr_values

# Plotando o rolling SNR e o STD
f_br.plot_snr_adj_close(
    ticker=ticker, 
    dates=dates, 
    close=df['Close'], 
    snr_values=df['SNR'],
    window=window
)

# Plotando o scatter plot entre SNR e STD
f_br.plot_snr_vs_returns(
    snr_values=df['SNR'],
    returns=df['STD']
)

# Sinais de trading com SNR
df_trading = f_br.create_trading_signals(df=df, window=window)

fig = make_subplots(
    rows=2,
    cols=1,
    shared_xaxes=True,
    vertical_spacing=0.05, 
    subplot_titles=('Close', 'SNR')
)

fig.add_trace(go.Scatter(
    x=df_trading.index,
    y=df_trading['Close'],
    mode='lines',
    name='Close',
    line=dict(color='blue')),
    row=1, col=1
)

fig.add_trace(go.Scatter(
    x=df_trading.index,
    y=df_trading['SNR'],
    mode='lines',
    name='SNR',
    line=dict(color='red')),
    row=2, col=1
)

# Adicionando os sinais de compra e venda no gráfico de preço
buy_signals = df[df['Signal'] == 1]
sell_signals = df[df['Signal'] == -1]

fig.add_trace(go.Scatter(
    x=buy_signals.index,
    y=buy_signals['Close'],
    mode='markers',
    name='Buy Signal',
    marker=dict(color='green', size=10, symbol='triangle-up')),
    row=1, col=1
    )

fig.add_trace(go.Scatter(
    x=sell_signals.index,
    y=sell_signals['Close'],
    mode='markers',
    name='Sell Signal',
    marker=dict(color='red', size=10, symbol='triangle-down')),
    row=1, col=1
    )

fig.update_layout(
    title=ticker + ' - Close e SNR com Sinais de Trading',
    height=1500,
    width=1200
)

fig.update_xaxes(title_text='Data', row=2, col=1)
fig.update_yaxes(title_text='Close', row=1, col=1)
fig.update_yaxes(title_text='SNR (dB)', row=1, col=2)

fig.show()

In [None]:
# Dados 
ticker = 'QQQ'
df = yf.download(tickers=ticker, start='2018-01-01', auto_adjust=True, multi_level_index=False)['Close']
df = df.reset_index()
df.columns = ['Date', 'Close']
df = df.set_index('Date')
df['Returns'] = df['Close'].pct_change()
df['STD'] = df['Returns'].rolling(20).std()
# Selecionando o sinal (usaremos os preços de fechamento ajustados)
signal = df['Close'].values
dates = df.index

# Calculando o rolling SNR com uma janela de 20 dias
window = 20
snr_values = f_br.rolling_snr(signal=signal, window=window)

# Adicionando os valores do SNR no df
df['SNR'] = snr_values

# Plotando o rolling SNR e o STD
f_br.plot_snr_adj_close(
    ticker=ticker, 
    dates=dates, 
    close=df['Close'], 
    snr_values=df['SNR'],
    window=window
)

# Plotando o scatter plot entre SNR e STD
f_br.plot_snr_vs_returns(
    snr_values=df['SNR'],
    returns=df['STD']
)

# Sinais de trading com SNR
df_trading = f_br.create_trading_signals(df=df, window=window)

fig = make_subplots(
    rows=2,
    cols=1,
    shared_xaxes=True,
    vertical_spacing=0.05, 
    subplot_titles=('Close', 'SNR')
)

fig.add_trace(go.Scatter(
    x=df_trading.index,
    y=df_trading['Close'],
    mode='lines',
    name='Close',
    line=dict(color='blue')),
    row=1, col=1
)

fig.add_trace(go.Scatter(
    x=df_trading.index,
    y=df_trading['SNR'],
    mode='lines',
    name='SNR',
    line=dict(color='red')),
    row=2, col=1
)

# Adicionando os sinais de compra e venda no gráfico de preço
buy_signals = df[df['Signal'] == 1]
sell_signals = df[df['Signal'] == -1]

fig.add_trace(go.Scatter(
    x=buy_signals.index,
    y=buy_signals['Close'],
    mode='markers',
    name='Buy Signal',
    marker=dict(color='green', size=10, symbol='triangle-up')),
    row=1, col=1
    )

fig.add_trace(go.Scatter(
    x=sell_signals.index,
    y=sell_signals['Close'],
    mode='markers',
    name='Sell Signal',
    marker=dict(color='red', size=10, symbol='triangle-down')),
    row=1, col=1
    )

fig.update_layout(
    title=ticker + ' - Close e SNR com Sinais de Trading',
    height=1500,
    width=1200
)

fig.update_xaxes(title_text='Data', row=2, col=1)
fig.update_yaxes(title_text='Close', row=1, col=1)
fig.update_yaxes(title_text='SNR (dB)', row=1, col=2)

fig.show()

In [None]:
# Dados 
ticker = 'NVDA'
df = yf.download(tickers=ticker, start='2018-01-01', auto_adjust=True, multi_level_index=False)['Close']
df = df.reset_index()
df.columns = ['Date', 'Close']
df = df.set_index('Date')
df['Returns'] = df['Close'].pct_change()
df['STD'] = df['Returns'].rolling(20).std()
# Selecionando o sinal (usaremos os preços de fechamento ajustados)
signal = df['Close'].values
dates = df.index

# Calculando o rolling SNR com uma janela de 20 dias
window = 20
snr_values = f_br.rolling_snr(signal=signal, window=window)

# Adicionando os valores do SNR no df
df['SNR'] = snr_values

# Plotando o rolling SNR e o STD
f_br.plot_snr_adj_close(
    ticker=ticker, 
    dates=dates, 
    close=df['Close'], 
    snr_values=df['SNR'],
    window=window
)

# Plotando o scatter plot entre SNR e STD
f_br.plot_snr_vs_returns(
    snr_values=df['SNR'],
    returns=df['STD']
)

# Sinais de trading com SNR
df_trading = f_br.create_trading_signals(df=df, window=window)

fig = make_subplots(
    rows=2,
    cols=1,
    shared_xaxes=True,
    vertical_spacing=0.05, 
    subplot_titles=('Close', 'SNR')
)

fig.add_trace(go.Scatter(
    x=df_trading.index,
    y=df_trading['Close'],
    mode='lines',
    name='Close',
    line=dict(color='blue')),
    row=1, col=1
)

fig.add_trace(go.Scatter(
    x=df_trading.index,
    y=df_trading['SNR'],
    mode='lines',
    name='SNR',
    line=dict(color='red')),
    row=2, col=1
)

# Adicionando os sinais de compra e venda no gráfico de preço
buy_signals = df[df['Signal'] == 1]
sell_signals = df[df['Signal'] == -1]

fig.add_trace(go.Scatter(
    x=buy_signals.index,
    y=buy_signals['Close'],
    mode='markers',
    name='Buy Signal',
    marker=dict(color='green', size=10, symbol='triangle-up')),
    row=1, col=1
    )

fig.add_trace(go.Scatter(
    x=sell_signals.index,
    y=sell_signals['Close'],
    mode='markers',
    name='Sell Signal',
    marker=dict(color='red', size=10, symbol='triangle-down')),
    row=1, col=1
    )

fig.update_layout(
    title=ticker + ' - Close e SNR com Sinais de Trading',
    height=1500,
    width=1200
)

fig.update_xaxes(title_text='Data', row=2, col=1)
fig.update_yaxes(title_text='Close', row=1, col=1)
fig.update_yaxes(title_text='SNR (dB)', row=1, col=2)

fig.show()

# **Divergência no Índice de Força Relativa (IFR ou RSI)** 

* Vídeo da aula: https://www.youtube.com/watch?v=ISWfUqXc5EI

In [None]:
symbol = '^BVSP'
start_date = '2020-01-01'
end_date = '2025-12-31'

df = yf.download(symbol, start=start_date, end=end_date, auto_adjust=True, multi_level_index=False)['Close']
df = df.reset_index()
df.columns = ['Date', 'Close']
df = df.set_index('Date')

# Calculando o RSI
df['RSI'] = f_br.calculate_rsi(df=df['Close'], window=14)

# Detectando as divergências
divergences = f_br.detect_rsi_divergence(df=df['Close'], rsi=df['RSI'], lookback=14)

# Exibindo as divergências encontradas
print('Divergências encontradas:')
print(divergences.tail())

# Plotando o gráfico
f_br.plot_rsi_divergence(df=df['Close'], rsi=df['RSI'], divergences=divergences, symbol=symbol)

In [None]:
symbol = 'QQQ'
start_date = '2020-01-01'
end_date = '2025-12-31'

df = yf.download(symbol, start=start_date, end=end_date, auto_adjust=True, multi_level_index=False)['Close']
df = df.reset_index()
df.columns = ['Date', 'Close']
df = df.set_index('Date')

# Calculando o RSI
df['RSI'] = f_br.calculate_rsi(df=df['Close'], window=14)

# Detectando as divergências
divergences = f_br.detect_rsi_divergence(df=df['Close'], rsi=df['RSI'], lookback=14)

# Exibindo as divergências encontradas
print('Divergências encontradas:')
print(divergences.tail())

# Plotando o gráfico
f_br.plot_rsi_divergence(df=df['Close'], rsi=df['RSI'], divergences=divergences, symbol=symbol)