In [None]:
from empiricaldist import Cdf
from matplotlib.patches import Patch
from plotly.subplots import make_subplots
import funcoes_br as f_br
import matplotlib.pyplot as plt # noqa: F401
import numpy as np
import pandas as pd
import plotly.express as px # noqa: F401
import plotly.graph_objects as go
import seaborn as sns # noqa: F401
import yfinance as yf

# Índices da B3 

IBOV: https://www.b3.com.br/pt_br/market-data-e-indices/indices/indices-amplos/indice-ibovespa-ibovespa-composicao-da-carteira.htm

SMLL: https://www.b3.com.br/pt_br/market-data-e-indices/indices/indices-de-segmentos-e-setoriais/indice-small-cap-smll-composicao-da-carteira.htm

## IBOV

In [None]:
# Criando o df do IBOV
df_ibov = f_br.filtro_etf('C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2026_JAN_ABR.csv')

# Selecionando as colunas do df
df_ibov = df_ibov.loc[:,['Código','Part. (%)']]

# Colocando em ordem as ações com maior participação da carteira teórica
df_ibov.sort_values(by=['Part. (%)'], ascending=False)

In [None]:
# Comparando a carteira teórica do IBOV anterior com a mais atual
ibov_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2026_JAN_ABR.csv')
ibov_anterior = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2025_SET_DEZ.csv')

# Transformando em listas
lista_ibov_atual = ibov_atual['Código'].tolist()
lista_ibov_anterior = ibov_anterior['Código'].tolist()

# Diferenças entre as carteiras
acoes_sairam_carteira_atual = sorted(set(lista_ibov_anterior) - set(lista_ibov_atual))
acoes_entraram_carteira_atual = sorted(set(lista_ibov_atual) - set(lista_ibov_anterior))

print(f'A carteira teórioca do IBOV atual é composta por {len(ibov_atual)} ações.')
print(f'A carteira teórioca do IBOV anterior é composta por {len(ibov_anterior)} ações.')
print('-'*50)
print(f'O número de ações semelhantes são de {len(set(lista_ibov_atual) & set(lista_ibov_anterior))}.')
print(f'Ações semelhantes entre as duas carteiras: {sorted(set(lista_ibov_atual) & set(lista_ibov_anterior))}.')
print('-'*50)
print(f'Número de ações diferentes entre as duas carteiras: {len(set(lista_ibov_anterior) - set(lista_ibov_atual))}.')
print(f'Ações que sairam da carteira atual: {acoes_sairam_carteira_atual}')
print(f'Ações que entraram na carteira atual: {acoes_entraram_carteira_atual}')

In [None]:
# IBOV
ibov_2022 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2022_SET_DEZ.csv')
ibov_2023 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2023_SET_DEZ.csv')
ibov_2024 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2024_SET_DEZ.csv')
ibov_2025 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2025_SET_DEZ.csv')

# Criando uma lista com os tickers das empresas que compõem o IBOV
lst_ibov_2022_sa = ibov_2022['Código'] + '.SA'
lst_ibov_2023_sa = ibov_2023['Código'] + '.SA'
lst_ibov_2024_sa = ibov_2024['Código'] + '.SA'
lst_ibov_2025_sa = ibov_2025['Código'] + '.SA'

# Tickers indisponíveis
lst_ticker_remove_2022 = [
    'ARZZ3.SA', 'BRFS3.SA', 'BRML3.SA', 
    'CCRO3.SA', 'CIEL3.SA', 'CPLE6.SA', 
    'CRFB3.SA', 'ELET3.SA', 'ELET6.SA',
    'EMBR3.SA', 'ENBR3.SA', 'GOLL4.SA', 
    'JBSS3.SA', 'MRFG3.SA', 'MULT3.SA', 
    'NTCO3.SA', 'RRRP3.SA', 'SOMA3.SA', 
    'SULA11.SA', 'VIIA3.SA'
]

lst_ticker_remove_2023 = [
    'ALSO3.SA', 'ARZZ3.SA', 'BRFS3.SA',
    'CCRO3.SA', 'CIEL3.SA', 'CPLE6.SA',
    'CRFB3.SA', 'ELET3.SA', 'ELET6.SA', 
    'EMBR3.SA', 'GOLL4.SA', 'JBSS3.SA', 
    'MRFG3.SA', 'MULT3.SA', 'NTCO3.SA', 
    'RRRP3.SA', 'SOMA3.SA', 'VIIA3.SA'
]

lst_ticker_remove_2024 = [
    'BRFS3.SA', 'CCRO3.SA', 'CPLE6.SA', 
    'CRFB3.SA', 'ELET3.SA', 'ELET6.SA',
    'EMBR3.SA', 'JBSS3.SA', 'MRFG3.SA', 
    'MULT3.SA', 'NTCO3.SA', 'RRRP3.SA', 
    'STBP3.SA', 'TRPL4.SA'
]

lst_ticker_remove_2025 = [
    'BRFS3.SA', 'CPLE6.SA', 'ELET3.SA', 
    'ELET6.SA', 'EMBR3.SA', 'MRFG3.SA',
    'STBP3.SA',
]

# Removendo os tickers indisponíveis
lst_ibov_2022_sa = [ticker for ticker in lst_ibov_2022_sa if ticker not in lst_ticker_remove_2022]
lst_ibov_2023_sa = [ticker for ticker in lst_ibov_2023_sa if ticker not in lst_ticker_remove_2023]
lst_ibov_2024_sa = [ticker for ticker in lst_ibov_2024_sa if ticker not in lst_ticker_remove_2024]
lst_ibov_2025_sa = [ticker for ticker in lst_ibov_2025_sa if ticker not in lst_ticker_remove_2025]

# Fazendo o download dos preços de fechamento de cada carteira teórica do IBOV
lst_df_ibov_2022_close = [yf.download(tickers=ticker, start='2022-01-01', end='2022-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_ibov_2022_sa]
lst_df_ibov_2023_close = [yf.download(tickers=ticker, start='2023-01-01', end='2023-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_ibov_2023_sa]
lst_df_ibov_2024_close = [yf.download(tickers=ticker, start='2024-01-01', end='2024-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_ibov_2024_sa]
lst_df_ibov_2025_close = [yf.download(tickers=ticker, start='2025-01-01', end='2025-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_ibov_2025_sa]

# Concatendos os dfs
df_ibov_2022_close = pd.concat(lst_df_ibov_2022_close, axis=1)
df_ibov_2023_close = pd.concat(lst_df_ibov_2023_close, axis=1)
df_ibov_2024_close = pd.concat(lst_df_ibov_2024_close, axis=1)
df_ibov_2025_close = pd.concat(lst_df_ibov_2025_close, axis=1)

# Calculando o retorno anual de cada ativo que compõem o IBOV
df_ibov_2022_ret_anual = ((df_ibov_2022_close.iloc[-1] / df_ibov_2022_close.iloc[0]) - 1) * 100
df_ibov_2023_ret_anual = ((df_ibov_2023_close.iloc[-1] / df_ibov_2023_close.iloc[0]) - 1) * 100
df_ibov_2024_ret_anual = ((df_ibov_2024_close.iloc[-1] / df_ibov_2024_close.iloc[0]) - 1) * 100
df_ibov_2025_ret_anual = ((df_ibov_2025_close.iloc[-1] / df_ibov_2025_close.iloc[0]) - 1) * 100

# Contando quantas empresas que compõem o IBOV tiveram um retorno anual positivo
num_2022_ret_anual_positivos = (df_ibov_2022_ret_anual > 0).sum()
num_2023_ret_anual_positivos = (df_ibov_2023_ret_anual > 0).sum()
num_2024_ret_anual_positivos = (df_ibov_2024_ret_anual > 0).sum()
num_2025_ret_anual_positivos = (df_ibov_2025_ret_anual > 0).sum()

# Contando quantas empresas que compõem o IBOV tiveram um retorno anual negativo
num_2022_ret_anual_negativos = (df_ibov_2022_ret_anual < 0).sum()
num_2023_ret_anual_negativos = (df_ibov_2023_ret_anual < 0).sum()
num_2024_ret_anual_negativos = (df_ibov_2024_ret_anual < 0).sum()
num_2025_ret_anual_negativos = (df_ibov_2025_ret_anual < 0).sum()

# Criando um dicionário 
dict_pos_neg = {
    'num_positivo': [
        num_2022_ret_anual_positivos, 
        num_2023_ret_anual_positivos, 
        num_2024_ret_anual_positivos, 
        num_2025_ret_anual_positivos
    ],

    'num_negativo': [
        num_2022_ret_anual_negativos, 
        num_2023_ret_anual_negativos, 
        num_2024_ret_anual_negativos, 
        num_2025_ret_anual_negativos
    ],
}

# Criando o df com os nº de empresas que tiveram retorno anual positivo/negativo
df_num_pos_neg = pd.DataFrame(dict_pos_neg, index=['2022', '2023', '2024', '2025'])
df_num_pos_neg 

In [None]:
# IBOV
ibov_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2026_JAN_ABR.csv')

# Criando uma lista com os tickers das empresas que compõem o IBOV
lst_ibov_atual_sa = ibov_atual['Código'] + '.SA'

# Removendo tickers que não estão mais disponíveis
lst_ibov_atual_sa = lst_ibov_atual_sa[
    (lst_ibov_atual_sa != 'BRFS3.SA') &
    (lst_ibov_atual_sa != 'CPLE6.SA') &
    (lst_ibov_atual_sa != 'ELET3.SA') &
    (lst_ibov_atual_sa != 'ELET6.SA') &
    (lst_ibov_atual_sa != 'EMBR3.SA') &
    (lst_ibov_atual_sa != 'MRFG3.SA') &
    (lst_ibov_atual_sa != 'STBP3.SA') 
]

# Lista dos resultados
lst_results = []

for ticker in lst_ibov_atual_sa:
    # Ticker
    company = yf.Ticker(ticker)

    # Dados históricos da empresa para o último ano (52 semanas)
    dados_historicos = company.history(period='1y')

    # Máxima das 52 semanas
    max_52w = dados_historicos['High'].max()

    # Preço atual da empresa
    try:
        preco_atual = company.info['currentPrice']
    except KeyError:
        print('Não foi possível obter o preço atual da empresa.')
        preco_atual = None

    if preco_atual:
        # Cálculo da diferença percentual entre o preço atual e a máxima
        diferenca_percentual = ((max_52w - preco_atual) / max_52w) * 100

    # Condição para verificar se o preço está 'perto' da máxima de 52w, considerando se a diferença for menor que 5%
    if diferenca_percentual <= 5:
        lst_results.append({
            'ticker': ticker,
            'preco_atual': preco_atual,
            'max_52w': max_52w,
            'diferenca_percentual': diferenca_percentual
        })

# Transformando em um df
df_near_52w_high = pd.DataFrame(lst_results)

# Arredondando a coluna 'diferenca_percentual'
df_near_52w_high['max_52w'] = round(df_near_52w_high['max_52w'], 2)
df_near_52w_high['diferenca_percentual'] = round(df_near_52w_high['diferenca_percentual'], 4)

print('='*60)
print(f'De {len(lst_ibov_atual_sa)} empresas do IBOV, {len(df_near_52w_high)} estão próximas da máxima de 52 semanas.')
print('='*60)   
print(df_near_52w_high)

In [None]:
# IBOV
ibov_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2026_JAN_ABR.csv')

# Criando uma lista com os tickers das empresas que compõem o IBOV
lst_ibov_atual_sa = ibov_atual['Código'] + '.SA'

# Removendo tickers que não estão mais disponíveis
lst_ibov_atual_sa = lst_ibov_atual_sa[
    (lst_ibov_atual_sa != 'BRFS3.SA') &
    (lst_ibov_atual_sa != 'CPLE6.SA') &
    (lst_ibov_atual_sa != 'ELET3.SA') &
    (lst_ibov_atual_sa != 'ELET6.SA') &
    (lst_ibov_atual_sa != 'EMBR3.SA') &
    (lst_ibov_atual_sa != 'MRFG3.SA') &
    (lst_ibov_atual_sa != 'STBP3.SA') 
]

lst_above_mm_50 = []
lst_below_mm_50 = []
lst_above_mm_200 = []
lst_below_mm_200 = []

for ticker in lst_ibov_atual_sa:
    # Dados da empresa
    company = yf.download(ticker, start='2017-01-01', auto_adjust=True, multi_level_index=False, progress=False)['Close']

    # Calculando a média móvel de 50 e 200
    mm_50 = company.rolling(window=50).mean()
    mm_200 = company.rolling(window=200).mean()

    # Verificando se o preço do ativo está acima das médias móveis 
    above_mm_50 = company > mm_50
    above_mm_200 = company > mm_200

    # Verificando se o preço do ativo está acima da média móvel no último dia disponível
    if company.iloc[-1] > mm_50.iloc[-1]:
        lst_above_mm_50.append(ticker)
    else:
        lst_below_mm_50.append(ticker)

    if company.iloc[-1] > mm_200.iloc[-1]:
        lst_above_mm_200.append(ticker)
    else:
        lst_below_mm_200.append(ticker)

print(f'De {len(lst_ibov_atual_sa)} empresas do IBOV, {len(lst_above_mm_50)} estão acima da média móvel de 50.')   
print('- Empresas acima da média móvel de 50:')
print(f'{lst_above_mm_50}')
print('-'*80)
print(f'De {len(lst_ibov_atual_sa)} empresas do IBOV, {len(lst_below_mm_50)} estão abaixo da média móvel de 50.')   
print('- Empresas abaixo da média móvel de 50:')
print(f'{lst_below_mm_50}')

print('='*80)

print(f'De {len(lst_ibov_atual_sa)} empresas do IBOV, {len(lst_above_mm_200)} estão acima da média móvel de 200.')  
print('- Empresas acima da média móvel de 200:')
print(f'{lst_above_mm_200}')
print('-'*80)
print(f'De {len(lst_ibov_atual_sa)} empresas do IBOV, {len(lst_below_mm_200)} estão abaixo da média móvel de 200.')   
print('- Empresas abaixo da média móvel de 200:')
print(f'{lst_below_mm_200}')

print('='*80)

print(f'De {len(lst_ibov_atual_sa)} empresas do IBOV, {len(set(lst_above_mm_50) & set(lst_above_mm_200))} estão acima da média móvel de 50 e 200.')  
print('- Empresas acima da média móvel de 50 e 200:')
print(f'{set(lst_above_mm_50) & set(lst_above_mm_200)}')

In [None]:
# IBOV
ibov_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2026_JAN_ABR.csv')

# Criando uma lista com os tickers das empresas que compõem o IBOV
lst_ibov_atual_sa = ibov_atual['Código'] + '.SA'

##############################################################
# Arquivo com nº de ações das empresas
df_capital_social = pd.read_csv(
    'C://B3//historico-arquivos//capital-social-b3//capital_social_3T2025.csv',
    sep=';'
)

# Formatando as colunas
df_capital_social['Capital R$'] = df_capital_social['Capital R$'].str.replace('.', '').str.replace(',', '.').astype('float')
df_capital_social['Aprovado Em'] = pd.to_datetime(df_capital_social['Aprovado Em'], format='%d/%m/%Y')
df_capital_social['Qtde Ações Ordinárias'] = df_capital_social['Qtde Ações Ordinárias'].str.replace('.', '').astype('int64')
df_capital_social['Qtde Ações Preferenciais'] = df_capital_social['Qtde Ações Preferenciais'].str.replace('.', '').astype('int64')
df_capital_social['Qtde Total De Ações'] = df_capital_social['Qtde Total De Ações'].str.replace('.', '').astype('int64')

# Selecionando as principais colunas
df_capital_social = df_capital_social[['Código', 'Qtde Ações Ordinárias', 'Qtde Ações Preferenciais', 'Qtde Total De Ações']]

##############################################################
# Criando um dicionário com tickers e preços
dict_precos = {}
for ticker in lst_ibov_atual_sa:
    dados = yf.download(tickers=ticker, auto_adjust=True, progress=False, multi_level_index=False)
    if not dados.empty:
        fechamento = dados['Close'].iloc[-1]
        dict_precos[ticker] = fechamento
    else:
        print(f'Aviso: Dados não encontrados para {ticker}. Pulando...')

# Transformando em um df
df_precos = pd.DataFrame(dict_precos.items(), columns=['Código', 'Close'])

# Ordenando o df pelo ticker
df_precos = df_precos.sort_values('Código')

# Arredondamento do preço de fechamento
df_precos['Close'] = round(df_precos['Close'], 2)

##############################################################
# Ações ordinárias
filt_on = (df_precos['Código'].str[4] == '3')
df_precos_on = df_precos.loc[filt_on].copy()

# Selecionando apenas as letras do ticker
df_precos_on['Código'] = df_precos_on['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_on = df_precos_on.sort_values('Código')

# Selecionando as ações ordinárias que fazem parte do IBOV
filt_ibov_on = df_capital_social['Código'].isin(df_precos_on['Código'])
df_capital_social_ibov_on = df_capital_social.loc[filt_ibov_on]

# Ordenando o df pelo ticker
df_capital_social_ibov_on = df_capital_social_ibov_on.sort_values('Código')

# Resetando o index
df_capital_social_ibov_on = df_capital_social_ibov_on.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_on = df_capital_social_ibov_on[['Código', 'Qtde Ações Ordinárias']]

# Juntandos os dfs
df_valor_mercado_on = pd.merge(df_precos_on, df_capital_social_ibov_on, on='Código')

# Calculando o valor de mercado
df_valor_mercado_on['valor_mercado'] = df_valor_mercado_on['Close'] * df_valor_mercado_on['Qtde Ações Ordinárias']

##############################################################
# Ações preferenciais
filt_pn = (df_precos['Código'].str[4] == '4')
df_precos_pn = df_precos.loc[filt_pn].copy()

# Selecionando apenas as letras do ticker
df_precos_pn['Código'] = df_precos_pn['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_pn = df_precos_pn.sort_values('Código')

# Selecionando as ações preferenciais que fazem parte do IBOV
filt_ibov_pn = df_capital_social['Código'].isin(df_precos_pn['Código'])
df_capital_social_ibov_pn = df_capital_social.loc[filt_ibov_pn]

# Ordenando o df pelo ticker
df_capital_social_ibov_pn = df_capital_social_ibov_pn.sort_values('Código')

# Resetando o index
df_capital_social_ibov_pn = df_capital_social_ibov_pn.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_pn = df_capital_social_ibov_pn[['Código', 'Qtde Ações Preferenciais']]

# Juntandos os dfs
df_valor_mercado_pn = pd.merge(df_precos_pn, df_capital_social_ibov_pn, on='Código')

# Calculando o valor de mercado
df_valor_mercado_pn['valor_mercado'] = df_valor_mercado_pn['Close'] * df_valor_mercado_pn['Qtde Ações Preferenciais']

##############################################################
# Selecionando as ações que estão em ambos dfs (on e pn)
df_valor_mercado_on_pn = pd.merge(df_valor_mercado_on, df_valor_mercado_pn, on='Código', how='inner', suffixes=('_on', '_pn'))

# Calculando o valor de mercado total
df_valor_mercado_on_pn['valor_mercado'] = df_valor_mercado_on_pn['valor_mercado_on'] + df_valor_mercado_on_pn['valor_mercado_pn']

# Selecionando as colunas principais
df_valor_mercado_on_pn = df_valor_mercado_on_pn[['Código', 'valor_mercado']]

##############################################################
# Retirando os tickers que estão tanto no df 'on' e 'pn' (usa o '~' no loc)
filt_on_both = df_valor_mercado_on['Código'].isin(df_valor_mercado_on_pn['Código'])
df_valor_mercado_on_final = df_valor_mercado_on.loc[~filt_on_both]

filt_pn_both = df_valor_mercado_pn['Código'].isin(df_valor_mercado_on_pn['Código'])
df_valor_mercado_pn_final = df_valor_mercado_pn.loc[~filt_pn_both]

# Selecionando as colunas principais
df_valor_mercado_on_final = df_valor_mercado_on_final[['Código', 'valor_mercado']]
df_valor_mercado_pn_final = df_valor_mercado_pn_final[['Código', 'valor_mercado']]

##############################################################
# Units
filt_unit = (df_precos['Código'].str[4] == '1')
df_precos_unit = df_precos.loc[filt_unit].copy()

# Função para gerar tickers ON e PN a partir da unit
def expand_unit(code):
    base = code.replace('11.SA', '')
    # Exceção (pn = 5)
    if base == 'BPAC':  
        return [base + '3.SA', base + '5.SA']
    else:
        return [base + '3.SA', base + '4.SA']

# Cria lista expandida
lst_expanded_unit = []
for _, row in df_precos_unit.iterrows():
    for novo in expand_unit(row['Código']):
        lst_expanded_unit.append(novo)

# Criando um dicionário com tickers e preços
dict_precos_expanded_unit = {}
for ticker in lst_expanded_unit:
    
    # Preço de fechamento mais recente
    fechamento = yf.download(tickers=ticker, period='5d', auto_adjust=True, progress=False, multi_level_index=False)['Close'].iloc[-1]
    dict_precos_expanded_unit[ticker] = fechamento

# Transformando em um df
df_precos_expanded_unit = pd.DataFrame(dict_precos_expanded_unit.items(), columns=['Código', 'Close'])

# Ordenando o df pelo ticker
df_precos_expanded_unit = df_precos_expanded_unit.sort_values('Código')

# Arredondamento do preço de fechamento
df_precos_expanded_unit['Close'] = round(df_precos_expanded_unit['Close'], 2)

##############################################################
# Ações ordinárias das units
filt_on_unit = (df_precos_expanded_unit['Código'].str[4] == '3')
df_precos_unit_on = df_precos_expanded_unit.loc[filt_on_unit].copy()

# Selecionando apenas as letras do ticker
df_precos_unit_on['Código'] = df_precos_unit_on['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_unit_on = df_precos_unit_on.sort_values('Código')

# Selecionando as ações ordinárias que fazem parte do IBOV
filt_ibov_unit_on = df_capital_social['Código'].isin(df_precos_unit_on['Código'])
df_capital_social_ibov_unit_on = df_capital_social.loc[filt_ibov_unit_on]

# Ordenando o df pelo ticker
df_capital_social_ibov_unit_on = df_capital_social_ibov_unit_on.sort_values('Código')

# Resetando o index
df_capital_social_ibov_unit_on = df_capital_social_ibov_unit_on.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_unit_on = df_capital_social_ibov_unit_on[['Código', 'Qtde Ações Ordinárias']]

# Juntandos os dfs
df_valor_mercado_unit_on = pd.merge(df_precos_unit_on, df_capital_social_ibov_unit_on, on='Código')

# Calculando o valor de mercado
df_valor_mercado_unit_on['valor_mercado'] = df_valor_mercado_unit_on['Close'] * df_valor_mercado_unit_on['Qtde Ações Ordinárias']

##############################################################
# Ações preferenciais das units
filt_pn_unit = (df_precos_expanded_unit['Código'].str[4] == '4') | (df_precos_expanded_unit['Código'].str[4] == '5')
df_precos_unit_pn = df_precos_expanded_unit.loc[filt_pn_unit].copy()

# Selecionando apenas as letras do ticker
df_precos_unit_pn['Código'] = df_precos_unit_pn['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_unit_pn = df_precos_unit_pn.sort_values('Código')

# Selecionando as ações preferenciais que fazem parte do IBOV
filt_ibov_unit_pn = df_capital_social['Código'].isin(df_precos_unit_pn['Código'])
df_capital_social_ibov_unit_pn = df_capital_social.loc[filt_ibov_unit_pn]

# Ordenando o df pelo ticker
df_capital_social_ibov_unit_pn = df_capital_social_ibov_unit_pn.sort_values('Código')

# Resetando o index
df_capital_social_ibov_unit_pn = df_capital_social_ibov_unit_pn.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_unit_pn = df_capital_social_ibov_unit_pn[['Código', 'Qtde Ações Preferenciais']]

# Juntandos os dfs
df_valor_mercado_unit_pn = pd.merge(df_precos_unit_pn, df_capital_social_ibov_unit_pn, on='Código')

# Calculando o valor de mercado
df_valor_mercado_unit_pn['valor_mercado'] = df_valor_mercado_unit_pn['Close'] * df_valor_mercado_unit_pn['Qtde Ações Preferenciais']

##############################################################
# Selecionando as ações que estão em ambos dfs (on e pn)
df_valor_mercado_unit_on_pn = pd.merge(df_valor_mercado_unit_on, df_valor_mercado_unit_pn, on='Código', how='inner', suffixes=('_on', '_pn'))

# Calculando o valor de mercado total
df_valor_mercado_unit_on_pn['valor_mercado'] = df_valor_mercado_unit_on_pn['valor_mercado_on'] + df_valor_mercado_unit_on_pn['valor_mercado_pn']

# Selecionando as colunas principais
df_valor_mercado_unit_on_pn = df_valor_mercado_unit_on_pn[['Código', 'valor_mercado']]

##############################################################
# Concatenando todos os dfs de valor de mercado
df_valor_mercado_ibov = pd.concat([
    df_valor_mercado_on_final, 
    df_valor_mercado_pn_final,
    df_valor_mercado_on_pn,
    df_valor_mercado_unit_on_pn
])

# Ordenando pelo valor de mercado
df_valor_mercado_ibov = df_valor_mercado_ibov.sort_values(by='valor_mercado', ascending=False).reset_index(drop=True)

df_valor_mercado_ibov

## SMLL

In [None]:
# Criando o df do SMLL
df_smll = f_br.filtro_etf('C://B3//historico-arquivos//indices-b3//smll//SMLL_2026_JAN_ABR.csv')

# Selecionando as colunas do df
df_smll = df_smll.loc[:,['Código','Part. (%)']]

# Colocando em ordem as ações com maior participação da carteira teórica
df_smll.sort_values(by=['Part. (%)'], ascending=False)

In [None]:
# Comparando a carteira teórica do SMLL anterior com a mais atual
smll_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2026_JAN_ABR.csv')
smll_anterior = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2025_SET_DEZ.csv')

# Transformando em listas
lista_smll_atual = smll_atual['Código'].tolist()
lista_smll_anterior = smll_anterior['Código'].tolist()

# Diferenças entre as carteiras
acoes_sairam_carteira_atual_smll = sorted(set(lista_smll_anterior) - set(lista_smll_atual))
acoes_entraram_carteira_atual_smll = sorted(set(lista_smll_atual) - set(lista_smll_anterior))

print(f'A carteira teórioca do smll atual é composta por {len(smll_atual)} ações.')
print(f'A carteira teórioca do smll anterior é composta por {len(smll_anterior)} ações.')
print('-'*30)
print(f'O número de ações semelhantes são de {len(set(lista_smll_atual) & set(lista_smll_anterior))}.')
print(f'Ações semelhantes entre as duas carteiras: {sorted(set(lista_smll_atual) & set(lista_smll_anterior))}.')
print('-'*30)
print(f'Número de ações diferentes entre as duas carteiras: {len(set(lista_smll_anterior) - set(lista_smll_atual))}.')
print(f'Ações que sairam da carteira atual: {acoes_sairam_carteira_atual_smll}')
print(f'Ações que entraram na carteira atual: {acoes_entraram_carteira_atual_smll}')

In [None]:
# IBOV
smll_2022 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2022_SET_DEZ.csv')
smll_2023 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2023_SET_DEZ.csv')
smll_2024 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2024_SET_DEZ.csv')
smll_2025 = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2025_SET_DEZ.csv')

# Criando uma lista com os tickers das empresas que compõem o IBOV
lst_smll_2022_sa = smll_2022['Código'] + '.SA'
lst_smll_2023_sa = smll_2023['Código'] + '.SA'
lst_smll_2024_sa = smll_2024['Código'] + '.SA'
lst_smll_2025_sa = smll_2025['Código'] + '.SA'

# Tickers indisponíveis
lst_ticker_remove_2022 = [
    'AESB3.SA', 'ALSO3.SA', 'ARZZ3.SA',
    'BKBR3.SA', 'BOAS3.SA', 'BRML3.SA',
    'CLSA3.SA', 'DMMO3.SA', 'ECOR3.SA', 
    'EMBR3.SA', 'ENAT3.SA', 'ENBR3.SA', 
    'GETT11.SA', 'GOLL4.SA', 'MEGA3.SA', 
    'MODL11.SA', 'MRFG3.SA', 'PARD3.SA',
    'RRRP3.SA', 'SEER3.SA', 'SOMA3.SA',
    'STBP3.SA', 'SQIA3.SA', 'SULA11.SA', 
    'VIIA3.SA', 'WIZS3.SA'
]

lst_ticker_remove_2023 = [
    'AESB3.SA', 'ALSO3.SA', 'ARZZ3.SA',
    'CIEL3.SA', 'CLSA3.SA', 'EMBR3.SA',
    'ENAT3.SA', 'GOLL4.SA', 'MBLY3.SA', 
    'MEGA3.SA', 'MRFG3.SA', 'RRRP3.SA', 
    'SOMA3.SA', 'STBP3.SA', 'SQIA3.SA', 
    'VIIA3.SA', 'ZAMP3.SA'
]

lst_ticker_remove_2024 = [
    'AESB3.SA', 'CLSA3.SA', 'MRFG3.SA', 
    'PORT3.SA', 'QUAL3.SA', 'SRNA3.SA', 
    'STBP3.SA', 'RRRP3.SA', 'ZAMP3.SA'
]

lst_ticker_remove_2025 = [ 
    'PORT3.SA', 'SRNA3.SA', 'STBP3.SA',
]

# Removendo os tickers indisponíveis
lst_smll_2022_sa = [ticker for ticker in lst_smll_2022_sa if ticker not in lst_ticker_remove_2022]
lst_smll_2023_sa = [ticker for ticker in lst_smll_2023_sa if ticker not in lst_ticker_remove_2023]
lst_smll_2024_sa = [ticker for ticker in lst_smll_2024_sa if ticker not in lst_ticker_remove_2024]
lst_smll_2025_sa = [ticker for ticker in lst_smll_2025_sa if ticker not in lst_ticker_remove_2025]

# Fazendo o download dos preços de fechamento de cada carteira teórica do IBOV
lst_df_smll_2022_close = [yf.download(tickers=ticker, start='2022-01-01', end='2022-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_smll_2022_sa]
lst_df_smll_2023_close = [yf.download(tickers=ticker, start='2023-01-01', end='2023-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_smll_2023_sa]
lst_df_smll_2024_close = [yf.download(tickers=ticker, start='2024-01-01', end='2024-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_smll_2024_sa]
lst_df_smll_2025_close = [yf.download(tickers=ticker, start='2025-01-01', end='2025-12-31', auto_adjust=True, progress=False, multi_level_index=False)['Close'] for ticker in lst_smll_2025_sa]

# Concatendos os dfs
df_smll_2022_close = pd.concat(lst_df_smll_2022_close, axis=1)
df_smll_2023_close = pd.concat(lst_df_smll_2023_close, axis=1)
df_smll_2024_close = pd.concat(lst_df_smll_2024_close, axis=1)
df_smll_2025_close = pd.concat(lst_df_smll_2025_close, axis=1)

# Calculando o retorno anual de cada ativo que compõem o IBOV
df_smll_2022_ret_anual = ((df_smll_2022_close.iloc[-1] / df_smll_2022_close.iloc[0]) - 1) * 100
df_smll_2023_ret_anual = ((df_smll_2023_close.iloc[-1] / df_smll_2023_close.iloc[0]) - 1) * 100
df_smll_2024_ret_anual = ((df_smll_2024_close.iloc[-1] / df_smll_2024_close.iloc[0]) - 1) * 100
df_smll_2025_ret_anual = ((df_smll_2025_close.iloc[-1] / df_smll_2025_close.iloc[0]) - 1) * 100

# Contando quantas empresas que compõem o IBOV tiveram um retorno anual positivo
num_2022_ret_anual_positivos = (df_smll_2022_ret_anual > 0).sum()
num_2023_ret_anual_positivos = (df_smll_2023_ret_anual > 0).sum()
num_2024_ret_anual_positivos = (df_smll_2024_ret_anual > 0).sum()
num_2025_ret_anual_positivos = (df_smll_2025_ret_anual > 0).sum()

# Contando quantas empresas que compõem o IBOV tiveram um retorno anual negativo
num_2022_ret_anual_negativos = (df_smll_2022_ret_anual < 0).sum()
num_2023_ret_anual_negativos = (df_smll_2023_ret_anual < 0).sum()
num_2024_ret_anual_negativos = (df_smll_2024_ret_anual < 0).sum()
num_2025_ret_anual_negativos = (df_smll_2025_ret_anual < 0).sum()

# Criando um dicionário 
dict_pos_neg = {
    'num_positivo': [
        num_2022_ret_anual_positivos, 
        num_2023_ret_anual_positivos, 
        num_2024_ret_anual_positivos, 
        num_2025_ret_anual_positivos
    ],

    'num_negativo': [
        num_2022_ret_anual_negativos, 
        num_2023_ret_anual_negativos, 
        num_2024_ret_anual_negativos, 
        num_2025_ret_anual_negativos
    ],
}

# Criando o df com os nº de empresas que tiveram retorno anual positivo/negativo
df_num_pos_neg = pd.DataFrame(dict_pos_neg, index=['2022', '2023', '2024', '2025'])
df_num_pos_neg 

In [None]:
# SMLL
smll_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2026_JAN_ABR.csv')

# Criando uma lista com os tickers das empresas que compõem o SMLL
lst_smll_atual_sa = smll_atual['Código'] + '.SA'

# Lista dos resultados
lst_results = []

for ticker in lst_smll_atual_sa:
    # Ticker
    company = yf.Ticker(ticker)

    # Dados históricos da empresa para o último ano (52 semanas)
    dados_historicos = company.history(period='1y')

    # Máxima das 52 semanas
    max_52w = dados_historicos['High'].max()

    # Preço atual da empresa
    try:
        preco_atual = company.info['currentPrice']
    except KeyError:
        print('Não foi possível obter o preço atual da empresa.')
        preco_atual = None

    if preco_atual:
        # Cálculo da diferença percentual entre o preço atual e a máxima
        diferenca_percentual = ((max_52w - preco_atual) / max_52w) * 100

    # Condição para verificar se o preço está 'perto' da máxima de 52w, considerando se a diferença for menor que 5%
    if diferenca_percentual <= 5:
        lst_results.append({
            'ticker': ticker,
            'preco_atual': preco_atual,
            'max_52w': max_52w,
            'diferenca_percentual': diferenca_percentual
        })

# Transformando em um df
df_near_52w_high = pd.DataFrame(lst_results)

# Arredondando a coluna 'diferenca_percentual'
df_near_52w_high['max_52w'] = round(df_near_52w_high['max_52w'], 2)
df_near_52w_high['diferenca_percentual'] = round(df_near_52w_high['diferenca_percentual'], 4)

print('='*60)
print(f'De {len(lst_smll_atual_sa)} empresas do SMLL, {len(df_near_52w_high)} estão próximas da máxima de 52 semanas.')
print('='*60)   
print(df_near_52w_high)

In [None]:
# SMLL
smll_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2026_JAN_ABR.csv')

# Criando uma lista com os tickers das empresas que compõem o SMLL
lst_smll_atual_sa = smll_atual['Código'] + '.SA'

lst_above_mm_50 = []
lst_below_mm_50 = []
lst_above_mm_200 = []
lst_below_mm_200 = []

for ticker in lst_smll_atual_sa:
    # Dados da empresa
    company = yf.download(ticker, start='2017-01-01', auto_adjust=True, multi_level_index=False, progress=False)['Close']

    # Calculando a média móvel de 50 e 200
    mm_50 = company.rolling(window=50).mean()
    mm_200 = company.rolling(window=200).mean()

    # Verificando se o preço do ativo está acima das médias móveis 
    above_mm_50 = company > mm_50
    above_mm_200 = company > mm_200

    # Verificando se o preço do ativo está acima da média móvel no último dia disponível
    if company.iloc[-1] > mm_50.iloc[-1]:
        lst_above_mm_50.append(ticker)
    else:
        lst_below_mm_50.append(ticker)

    if company.iloc[-1] > mm_200.iloc[-1]:
        lst_above_mm_200.append(ticker)
    else:
        lst_below_mm_200.append(ticker)

print(f'De {len(lst_smll_atual_sa)} empresas do SMLL, {len(lst_above_mm_50)} estão acima da média móvel de 50.')   
print('- Empresas acima da média móvel de 50:')
print(f'{lst_above_mm_50}')
print('-'*80)
print(f'De {len(lst_smll_atual_sa)} empresas do SMLL, {len(lst_below_mm_50)} estão abaixo da média móvel de 50.')   
print('- Empresas abaixo da média móvel de 50:')
print(f'{lst_below_mm_50}')

print('='*80)

print(f'De {len(lst_smll_atual_sa)} empresas do SMLL, {len(lst_above_mm_200)} estão acima da média móvel de 200.')  
print('- Empresas acima da média móvel de 200:')
print(f'{lst_above_mm_200}')
print('-'*80)
print(f'De {len(lst_smll_atual_sa)} empresas do SMLL, {len(lst_below_mm_200)} estão abaixo da média móvel de 200.')   
print('- Empresas abaixo da média móvel de 200:')
print(f'{lst_below_mm_200}')

print('='*80)

print(f'De {len(lst_smll_atual_sa)} empresas do SMLL, {len(set(lst_above_mm_50) & set(lst_above_mm_200))} estão acima da média móvel de 50 e 200.')  
print('- Empresas acima da média móvel de 50 e 200:')
print(f'{set(lst_above_mm_50) & set(lst_above_mm_200)}')

In [None]:
# SMLL
smll_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//smll//SMLL_2026_JAN_ABR.csv')

# Criando uma lista com os tickers das empresas que compõem o IBOV
lst_smll_atual_sa = smll_atual['Código'] + '.SA'

##############################################################
# Arquivo com nº de ações das empresas
df_capital_social = pd.read_csv(
    'C://B3//historico-arquivos//capital-social-b3//capital_social_3T2025.csv',
    sep=';'
)

# Formatando as colunas
df_capital_social['Capital R$'] = df_capital_social['Capital R$'].str.replace('.', '').str.replace(',', '.').astype('float')
df_capital_social['Aprovado Em'] = pd.to_datetime(df_capital_social['Aprovado Em'], format='%d/%m/%Y')
df_capital_social['Qtde Ações Ordinárias'] = df_capital_social['Qtde Ações Ordinárias'].str.replace('.', '').astype('int64')
df_capital_social['Qtde Ações Preferenciais'] = df_capital_social['Qtde Ações Preferenciais'].str.replace('.', '').astype('int64')
df_capital_social['Qtde Total De Ações'] = df_capital_social['Qtde Total De Ações'].str.replace('.', '').astype('int64')

# Selecionando as principais colunas
df_capital_social = df_capital_social[['Código', 'Qtde Ações Ordinárias', 'Qtde Ações Preferenciais', 'Qtde Total De Ações']]

##############################################################
# Criando um dicionário com tickers e preços
dict_precos = {}
for ticker in lst_smll_atual_sa:
    dados = yf.download(tickers=ticker, auto_adjust=True, progress=False, multi_level_index=False)
    if not dados.empty:
        fechamento = dados['Close'].iloc[-1]
        dict_precos[ticker] = fechamento
    else:
        print(f'Aviso: Dados não encontrados para {ticker}. Pulando...')

# Transformando em um df
df_precos = pd.DataFrame(dict_precos.items(), columns=['Código', 'Close'])

# Ordenando o df pelo ticker
df_precos = df_precos.sort_values('Código')

# Arredondamento do preço de fechamento
df_precos['Close'] = round(df_precos['Close'], 2)

##############################################################
# Ações ordinárias
filt_on = (df_precos['Código'].str[4] == '3')
df_precos_on = df_precos.loc[filt_on].copy()

# Selecionando apenas as letras do ticker
df_precos_on['Código'] = df_precos_on['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_on = df_precos_on.sort_values('Código')

# Selecionando as ações ordinárias que fazem parte do IBOV
filt_ibov_on = df_capital_social['Código'].isin(df_precos_on['Código'])
df_capital_social_ibov_on = df_capital_social.loc[filt_ibov_on]

# Ordenando o df pelo ticker
df_capital_social_ibov_on = df_capital_social_ibov_on.sort_values('Código')

# Resetando o index
df_capital_social_ibov_on = df_capital_social_ibov_on.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_on = df_capital_social_ibov_on[['Código', 'Qtde Ações Ordinárias']]

# Juntandos os dfs
df_valor_mercado_on = pd.merge(df_precos_on, df_capital_social_ibov_on, on='Código')

# Calculando o valor de mercado
df_valor_mercado_on['valor_mercado'] = df_valor_mercado_on['Close'] * df_valor_mercado_on['Qtde Ações Ordinárias']

##############################################################
# Ações preferenciais
filt_pn = (df_precos['Código'].str[4] == '4')
df_precos_pn = df_precos.loc[filt_pn].copy()

# Selecionando apenas as letras do ticker
df_precos_pn['Código'] = df_precos_pn['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_pn = df_precos_pn.sort_values('Código')

# Selecionando as ações preferenciais que fazem parte do IBOV
filt_ibov_pn = df_capital_social['Código'].isin(df_precos_pn['Código'])
df_capital_social_ibov_pn = df_capital_social.loc[filt_ibov_pn]

# Ordenando o df pelo ticker
df_capital_social_ibov_pn = df_capital_social_ibov_pn.sort_values('Código')

# Resetando o index
df_capital_social_ibov_pn = df_capital_social_ibov_pn.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_pn = df_capital_social_ibov_pn[['Código', 'Qtde Ações Preferenciais']]

# Juntandos os dfs
df_valor_mercado_pn = pd.merge(df_precos_pn, df_capital_social_ibov_pn, on='Código')

# Calculando o valor de mercado
df_valor_mercado_pn['valor_mercado'] = df_valor_mercado_pn['Close'] * df_valor_mercado_pn['Qtde Ações Preferenciais']

##############################################################
# Selecionando as ações que estão em ambos dfs (on e pn)
df_valor_mercado_on_pn = pd.merge(df_valor_mercado_on, df_valor_mercado_pn, on='Código', how='inner', suffixes=('_on', '_pn'))

# Calculando o valor de mercado total
df_valor_mercado_on_pn['valor_mercado'] = df_valor_mercado_on_pn['valor_mercado_on'] + df_valor_mercado_on_pn['valor_mercado_pn']

# Selecionando as colunas principais
df_valor_mercado_on_pn = df_valor_mercado_on_pn[['Código', 'valor_mercado']]

##############################################################
# Retirando os tickers que estão tanto no df 'on' e 'pn' (usa o '~' no loc)
filt_on_both = df_valor_mercado_on['Código'].isin(df_valor_mercado_on_pn['Código'])
df_valor_mercado_on_final = df_valor_mercado_on.loc[~filt_on_both]

filt_pn_both = df_valor_mercado_pn['Código'].isin(df_valor_mercado_on_pn['Código'])
df_valor_mercado_pn_final = df_valor_mercado_pn.loc[~filt_pn_both]

# Selecionando as colunas principais
df_valor_mercado_on_final = df_valor_mercado_on_final[['Código', 'valor_mercado']]
df_valor_mercado_pn_final = df_valor_mercado_pn_final[['Código', 'valor_mercado']]

##############################################################
# Units
filt_unit = (df_precos['Código'].str[4] == '1')
df_precos_unit = df_precos.loc[filt_unit].copy()

# A 'BRBI11' não tem cotação da ON e PN 
df_precos_unit_2 = df_precos_unit[df_precos_unit['Código'] != 'BRBI11.SA']  # df sem a 'BRBI11'
df_precos_unit_brbi = df_precos_unit.loc[df_precos_unit['Código'] == 'BRBI11.SA'].copy() # df somente com a 'BRBI11'

# Função para gerar tickers ON e PN a partir da unit
def expand_unit_smll(code):
    base = code.replace('11.SA', '')
    # Sem exceção 
    return [base + '3.SA', base + '4.SA']

# Cria lista expandida
lst_expanded_unit = []
for _, row in df_precos_unit_2.iterrows():
    for novo in expand_unit_smll(row['Código']):
        lst_expanded_unit.append(novo)

# Criando um dicionário com tickers e preços
dict_precos_expanded_unit = {}
for ticker in lst_expanded_unit:
    
    # Preço de fechamento mais recente
    fechamento = yf.download(tickers=ticker, period='5d', auto_adjust=True, progress=False, multi_level_index=False)['Close'].iloc[-1]
    dict_precos_expanded_unit[ticker] = fechamento

# Transformando em um df
df_precos_expanded_unit = pd.DataFrame(dict_precos_expanded_unit.items(), columns=['Código', 'Close'])

# Ordenando o df pelo ticker
df_precos_expanded_unit = df_precos_expanded_unit.sort_values('Código')

# Arredondamento do preço de fechamento
df_precos_expanded_unit['Close'] = round(df_precos_expanded_unit['Close'], 2)

##############################################################
# Ações ordinárias das units
filt_on_unit = (df_precos_expanded_unit['Código'].str[4] == '3')
df_precos_unit_on = df_precos_expanded_unit.loc[filt_on_unit].copy()

# Selecionando apenas as letras do ticker
df_precos_unit_on['Código'] = df_precos_unit_on['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_unit_on = df_precos_unit_on.sort_values('Código')

# Selecionando as ações ordinárias que fazem parte do IBOV
filt_ibov_unit_on = df_capital_social['Código'].isin(df_precos_unit_on['Código'])
df_capital_social_ibov_unit_on = df_capital_social.loc[filt_ibov_unit_on]

# Ordenando o df pelo ticker
df_capital_social_ibov_unit_on = df_capital_social_ibov_unit_on.sort_values('Código')

# Resetando o index
df_capital_social_ibov_unit_on = df_capital_social_ibov_unit_on.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_unit_on = df_capital_social_ibov_unit_on[['Código', 'Qtde Ações Ordinárias']]

# Juntandos os dfs
df_valor_mercado_unit_on = pd.merge(df_precos_unit_on, df_capital_social_ibov_unit_on, on='Código')

# Calculando o valor de mercado
df_valor_mercado_unit_on['valor_mercado'] = df_valor_mercado_unit_on['Close'] * df_valor_mercado_unit_on['Qtde Ações Ordinárias']

##############################################################
# Ações preferenciais das units
filt_pn_unit = (df_precos_expanded_unit['Código'].str[4] == '4') | (df_precos_expanded_unit['Código'].str[4] == '5')
df_precos_unit_pn = df_precos_expanded_unit.loc[filt_pn_unit].copy()

# Selecionando apenas as letras do ticker
df_precos_unit_pn['Código'] = df_precos_unit_pn['Código'].str[0:4]

# Ordenando o df pelo ticker
df_precos_unit_pn = df_precos_unit_pn.sort_values('Código')

# Selecionando as ações preferenciais que fazem parte do IBOV
filt_ibov_unit_pn = df_capital_social['Código'].isin(df_precos_unit_pn['Código'])
df_capital_social_ibov_unit_pn = df_capital_social.loc[filt_ibov_unit_pn]

# Ordenando o df pelo ticker
df_capital_social_ibov_unit_pn = df_capital_social_ibov_unit_pn.sort_values('Código')

# Resetando o index
df_capital_social_ibov_unit_pn = df_capital_social_ibov_unit_pn.reset_index(drop=True)

# Selecionando as principais colunas
df_capital_social_ibov_unit_pn = df_capital_social_ibov_unit_pn[['Código', 'Qtde Ações Preferenciais']]

# Juntandos os dfs
df_valor_mercado_unit_pn = pd.merge(df_precos_unit_pn, df_capital_social_ibov_unit_pn, on='Código')

# Calculando o valor de mercado
df_valor_mercado_unit_pn['valor_mercado'] = df_valor_mercado_unit_pn['Close'] * df_valor_mercado_unit_pn['Qtde Ações Preferenciais']

##############################################################
# Selecionando as ações que estão em ambos dfs (on e pn)
df_valor_mercado_unit_on_pn = pd.merge(df_valor_mercado_unit_on, df_valor_mercado_unit_pn, on='Código', how='inner', suffixes=('_on', '_pn'))

# Calculando o valor de mercado total
df_valor_mercado_unit_on_pn['valor_mercado'] = df_valor_mercado_unit_on_pn['valor_mercado_on'] + df_valor_mercado_unit_on_pn['valor_mercado_pn']

# Selecionando as colunas principais
df_valor_mercado_unit_on_pn = df_valor_mercado_unit_on_pn[['Código', 'valor_mercado']]

# ##############################################################
# Selecionando apenas as letras do ticker
df_precos_unit_brbi['Código'] = df_precos_unit_brbi['Código'].str[0:4]

# Selecionando a ação 'BRBI11'
filt_ibov_unit_brbi = df_capital_social['Código'].isin(df_precos_unit_brbi['Código'])
df_capital_social_brbi = df_capital_social.loc[filt_ibov_unit_brbi]

# Selecionando as principais colunas
df_capital_social_brbi = df_capital_social_brbi[['Código', 'Qtde Total De Ações']]

# Juntandos os dfs
df_valor_mercado_brbi = pd.merge(df_precos_unit_brbi, df_capital_social_brbi, on='Código')

# Calculando o valor de mercado
df_valor_mercado_brbi['valor_mercado'] = df_valor_mercado_brbi['Close'] * df_valor_mercado_brbi['Qtde Total De Ações']

# Selecionando as principais colunas
df_valor_mercado_brbi = df_valor_mercado_brbi[['Código', 'valor_mercado']]

# ##############################################################
# Concatenando todos os dfs de valor de mercado
df_valor_mercado_smll = pd.concat([
    df_valor_mercado_on_final, 
    df_valor_mercado_pn_final,
    df_valor_mercado_on_pn,
    df_valor_mercado_unit_on_pn,
    df_valor_mercado_brbi
])

# Ordenando pelo valor de mercado
df_valor_mercado_smll = df_valor_mercado_smll.sort_values(by='valor_mercado', ascending=False).reset_index(drop=True)

df_valor_mercado_smll

## Comparação entre IBOV e SMLL

**Growth vs Value**
*   No Brasil, a comparação entre BOVA11 e SMAL11 não é exatamente uma comparação entre valor e crescimento, porque o BOVA11 não é composto exclusivamente de ações de valor.

In [None]:
# Df do ibov e smll
df_ibov = f_br.filtro_etf('C://B3//historico-arquivos//indices-b3//ibovespa//IBOVESPA_2026_JAN_ABR.csv')
df_smll = f_br.filtro_etf('C://B3//historico-arquivos//indices-b3//smll//SMLL_2026_JAN_ABR.csv')

# Comparação entre IBOV e SMLL
lista_ibov = df_ibov['Código'].tolist()
lista_smll = df_smll['Código'].tolist()

print(f'A carteira teórioca do IBOV é composta por {len(df_ibov)} ações.')
print(f'A carteira teórioca do SMLL é composta por {len(df_smll)} ações.')
print('-'*50)
print(f'O número de ações semelhantes são de {len(set(lista_ibov) & set(lista_smll))}.')
print(f'Ações semelhantes entre as duas carteiras: {sorted(set(lista_ibov) & set(lista_smll))}')
print('-'*50)
print(f'Número de ações do IBOV diferentes do SMLL: {len(set(lista_ibov) - set(lista_smll))}.')
print(f'Ações que estão apenas no IBOV: {sorted(set(lista_ibov) - set(lista_smll))}')
print('-'*50)
print(f'Número de ações do SMLL diferentes do IBOV: {len(set(lista_smll) - set(lista_ibov))}.')
print(f'Ações que estão apenas no SMLL: {sorted(set(lista_smll) - set(lista_ibov))}')

In [None]:
# Blog do Allen Downey - https://www.allendowney.com/blog/2024/09/04/rip-off-etf/
# Dados dos ETFs
bova_preco = yf.download('BOVA11.SA', start='2008-01-01', auto_adjust=True, multi_level_index=False, progress=False)['Close']
smal_preco = yf.download('SMAL11.SA', start='2008-01-01', auto_adjust=True, multi_level_index=False, progress=False)['Close']

# Calculando o retorno diário
bova_ret = bova_preco.pct_change().dropna()
smal_ret = smal_preco.pct_change().dropna()

# Calculando o retorno acumulado
bova_ret_acum = (1 + bova_ret).cumprod()
smal_ret_acum = (1 + smal_ret).cumprod()

# Selecionando o último preço de cada ano
bova_preco_anual = bova_preco.groupby(bova_preco.index.year).last()
smal_preco_anual = smal_preco.groupby(smal_preco.index.year).last()

# Calculando o retorno anual
bova_ret_anual = round(((bova_preco_anual / bova_preco_anual.shift(1)) - 1) * 100, 2)
smal_ret_anual = round(((smal_preco_anual / smal_preco_anual.shift(1)) - 1) * 100, 2)

# Removendo os NaN
bova_ret_anual = bova_ret_anual.dropna()
smal_ret_anual = smal_ret_anual.dropna()

# CDF dos ETFs (cumulative distribution function)
cdf_return_bova = Cdf.from_seq(bova_ret_anual)
cdf_return_smal = Cdf.from_seq(smal_ret_anual)

# Plotando os gráficos
fig = make_subplots(
    rows=3, 
    cols=1, 
    subplot_titles=('Preços', 'Retorno Acumulado', 'CDF'),
    vertical_spacing=0.1
)

# Gráfico de preço
fig.add_trace(go.Scatter(
    x=bova_preco.index,
    y=bova_preco.values, 
    name='BOVA11'),
    row=1, col=1
)

fig.add_trace(go.Scatter(
    x=smal_preco.index,
    y=smal_preco.values, 
    name='SMAL11'),
    row=1, col=1
)

fig.update_xaxes(title_text='Anos', row=1, col=1)
fig.update_yaxes(title_text='Preço', row=1, col=1)

# Gráfico do retorno acumulado
fig.add_trace(go.Scatter(
    x=bova_ret_acum.index,
    y=bova_ret_acum.values, 
    name='bova_acum'),
    row=2, col=1
)

fig.add_trace(go.Scatter(
    x=smal_ret_acum.index,
    y=smal_ret_acum.values, 
    name='smal_acum'),
    row=2, col=1
)

fig.update_xaxes(title_text='Anos', row=2, col=1)
fig.update_yaxes(title_text='Preço', row=2, col=1)

# Gráfico de CDF
fig.add_trace(go.Scatter(
    x=cdf_return_bova.index,
    y=cdf_return_bova,
    mode='lines+markers', 
    name='bova_cdf'),
    row=3, col=1
)

fig.add_trace(go.Scatter(
    x=cdf_return_smal.index,
    y=cdf_return_smal, 
    mode='lines+markers',
    name='smal_cdf'),
    row=3, col=1
)

fig.update_xaxes(title_text='Retorno anual (%)', row=3, col=1)
fig.update_yaxes(title_text='CDF', row=3, col=1)

fig.update_layout(
    title='BOVA11 e SMAL11',
    height=1200,
    template='seaborn'
)

fig.show()

In [None]:
# Menor retorno anual
# quantities -> (qs)
menor_ret_bova = cdf_return_bova.qs[0]
menor_ret_smal = cdf_return_smal.qs[0]

# Probabilidade acumulado do menor retorno anual 
# probabilities -> (ps)
menor_ret_bova_prob_acum = cdf_return_bova.ps[0] * 100
menor_ret_smal_prob_acum = cdf_return_smal.ps[0] * 100

print(f'No BOVA11, há {menor_ret_bova_prob_acum:.2f}% de chance de o retorno anual da ação ser menor ou igual a {menor_ret_bova}%.')
print(f'No SMAL11, há {menor_ret_smal_prob_acum:.2f}% de chance de o retorno anual da ação ser menor ou igual a {menor_ret_smal}%.')

# Arquivo Statusinvest - Indicadores Fundamentalista (Múltiplos)

In [None]:
# Histórico dos dfs do Status Invest 
df_4T2021 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2021//statusinvest_dados_4T2021.csv')
df_1T2022 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2022//statusinvest_dados_1T2022.csv')
df_2T2022 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2022//statusinvest_dados_2T2022.csv')
df_3T2022 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2022//statusinvest_dados_3T2022.csv')
df_4T2022 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2022//statusinvest_dados_4T2022.csv')
df_1T2023 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2023//statusinvest_dados_1T2023.csv')
df_2T2023 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2023//statusinvest_dados_2T2023.csv')
df_3T2023 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2023//statusinvest_dados_3T2023.csv')
df_4T2023 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2023//statusinvest_dados_4T2023.csv')
df_1T2024 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2024//statusinvest_dados_1T2024.csv')
df_2T2024 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2024//statusinvest_dados_2T2024.csv')
df_3T2024 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2024//statusinvest_dados_3T2024.csv')
df_4T2024 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2024//statusinvest_dados_4T2024.csv')
df_1T2025 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2025//statusinvest_dados_1T2025.csv')
df_2T2025 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2025//statusinvest_dados_2T2025.csv')
df_3T2025 = f_br.filtro_planilha_statusinvest('C://B3//historico-arquivos//statusinvest//2025//statusinvest_dados_3T2025.csv')
df_3T2025

In [None]:
# Dicionário com os DataFrames de cada período
dict_dfs = {
    '4T2021': df_4T2021,
    '1T2022': df_1T2022,
    '2T2022': df_2T2022,
    '3T2022': df_3T2022,
    '4T2022': df_4T2022,
    '1T2023': df_1T2023,
    '2T2023': df_2T2023,
    '3T2023': df_3T2023,
    '4T2023': df_4T2023,
    '1T2024': df_1T2024,
    '2T2024': df_2T2024,
    '3T2024': df_3T2024,
    '4T2024': df_4T2024,
    '1T2025': df_1T2025,
    '2T2025': df_2T2025,
    '3T2025': df_3T2025,
}

In [None]:
# Verificando se alguma empresa está sem segmento
filt = (df_3T2025['SEGMENTO'] == 'NA')
df_3T2025[filt]

In [None]:
# Rank EY do df da planilha Statusinvest
f_br.df_rank_ey(df_3T2025)

### Calculando o PL médio do IBOVESPA

Site que faz uma conta parecida com essa, mas utiliza todos os tickers da bolsa:
https://www.oceans14.com.br/acoes/historico-pl-bovespa

In [None]:
pl_4T2021 = f_br.pl_ibov(df=df_4T2021, df_ibovespa=df_ibov)
pl_1T2022 = f_br.pl_ibov(df=df_1T2022, df_ibovespa=df_ibov)
pl_2T2022 = f_br.pl_ibov(df=df_2T2022, df_ibovespa=df_ibov)
pl_3T2022 = f_br.pl_ibov(df=df_3T2022, df_ibovespa=df_ibov)
pl_4T2022 = f_br.pl_ibov(df=df_4T2022, df_ibovespa=df_ibov)
pl_1T2023 = f_br.pl_ibov(df=df_1T2023, df_ibovespa=df_ibov)
pl_2T2023 = f_br.pl_ibov(df=df_2T2023, df_ibovespa=df_ibov)
pl_3T2023 = f_br.pl_ibov(df=df_3T2023, df_ibovespa=df_ibov)
pl_4T2023 = f_br.pl_ibov(df=df_4T2023, df_ibovespa=df_ibov)
pl_1T2024 = f_br.pl_ibov(df=df_1T2024, df_ibovespa=df_ibov)
pl_2T2024 = f_br.pl_ibov(df=df_2T2024, df_ibovespa=df_ibov)
pl_3T2024 = f_br.pl_ibov(df=df_3T2024, df_ibovespa=df_ibov)
pl_4T2024 = f_br.pl_ibov(df=df_4T2024, df_ibovespa=df_ibov)
pl_1T2025 = f_br.pl_ibov(df=df_1T2025, df_ibovespa=df_ibov)
pl_2T2025 = f_br.pl_ibov(df=df_2T2025, df_ibovespa=df_ibov)
pl_3T2025 = f_br.pl_ibov(df=df_3T2025, df_ibovespa=df_ibov)

# Criando um dicionário p/ transformar em um df
dict_pl_medio = {
    # 2021
    '4T2021':pl_4T2021, 
    # 2022
    '1T2022':pl_1T2022, 
    '2T2022':pl_2T2022, 
    '3T2022':pl_3T2022, 
    '4T2022':pl_4T2022,
    # 2023
    '1T2023':pl_1T2023, 
    '2T2023':pl_2T2023,
    '3T2023':pl_3T2023, 
    '4T2023':pl_4T2023,
    # 2024
    '1T2024':pl_1T2024,
    '2T2024':pl_2T2024,
    '3T2024':pl_3T2024,
    '4T2024':pl_4T2024,
    # 2025
    '1T2025':pl_1T2025,
    '2T2025':pl_2T2025,
    '3T2025':pl_3T2025,
}

# Transformando em um df
df_pl_medio_hist =  pd.DataFrame.from_dict(dict_pl_medio, orient='index', columns=['valor'])

# Plotando o P/L Médio do Ibovespa
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_pl_medio_hist.index,
    y=df_pl_medio_hist['valor'],
    mode='lines',
    name='P/L Médio do Ibovespa'
))

# Adicionando os pontos na linha do gráfico
fig.update_traces(mode="markers+lines")

# Atualizando o gráfico
fig.update_layout(
    title='P/L Médio do Ibovespa',
    xaxis_title='Ano',
    yaxis_title='P/L',
    template='seaborn'
)

fig.show()

### Calculando o PL médio de um Índice de Commodities

Selecionei 13 empresas produtoras de commodities com histórico longo de capital aberto e diversificadas entre industrias. Essa análise foi feita na carta do 1º Semestre de 2022 da Squadra. 

In [None]:
# Lista das empresas de commodities escolhidas
lista_commodities = [
    # Químicos
    'BRKM5', 
    # Carnes
    'BRFS3', 
    'JBSS3',
    # Siderurgia
    'CSNA3', 
    'GGBR4', 
    'USIM5',
    # Celulose
    'KLBN11', 
    'SUZB3',
    # Agronegócio
    'SLCE3', 
    # Petróleo
    'PETR4', 
    # Mineração
    'VALE3'
]

# Criando um novo df que só tem as ações que compõem o Índice de Commodities
df_commod_4T2021 = df_4T2021[df_4T2021['TICKER'].isin(lista_commodities)]
df_commod_1T2022 = df_1T2022[df_1T2022['TICKER'].isin(lista_commodities)]
df_commod_2T2022 = df_2T2022[df_2T2022['TICKER'].isin(lista_commodities)]
df_commod_3T2022 = df_3T2022[df_3T2022['TICKER'].isin(lista_commodities)]
df_commod_4T2022 = df_4T2022[df_4T2022['TICKER'].isin(lista_commodities)]
df_commod_1T2023 = df_1T2023[df_1T2023['TICKER'].isin(lista_commodities)]
df_commod_2T2023 = df_2T2023[df_2T2023['TICKER'].isin(lista_commodities)]
df_commod_3T2023 = df_3T2023[df_3T2023['TICKER'].isin(lista_commodities)]
df_commod_4T2023 = df_4T2023[df_4T2023['TICKER'].isin(lista_commodities)]
df_commod_1T2024 = df_1T2024[df_1T2024['TICKER'].isin(lista_commodities)]
df_commod_2T2024 = df_2T2024[df_2T2024['TICKER'].isin(lista_commodities)]
df_commod_3T2024 = df_3T2024[df_3T2024['TICKER'].isin(lista_commodities)]
df_commod_4T2024 = df_4T2024[df_4T2024['TICKER'].isin(lista_commodities)]
df_commod_1T2025 = df_1T2025[df_1T2025['TICKER'].isin(lista_commodities)]
df_commod_2T2025 = df_2T2025[df_2T2025['TICKER'].isin(lista_commodities)]
df_commod_3T2025 = df_3T2025[df_3T2025['TICKER'].isin(lista_commodities)]

# Selecionando as colunas 'TICKER' e 'P/L'
df_commod_4T2021 = df_commod_4T2021.loc[:, ['TICKER', 'P/L']]
df_commod_1T2022 = df_commod_1T2022.loc[:, ['TICKER', 'P/L']]
df_commod_2T2022 = df_commod_2T2022.loc[:, ['TICKER', 'P/L']]
df_commod_3T2022 = df_commod_3T2022.loc[:, ['TICKER', 'P/L']]
df_commod_4T2022 = df_commod_4T2022.loc[:, ['TICKER', 'P/L']]
df_commod_1T2023 = df_commod_1T2023.loc[:, ['TICKER', 'P/L']]
df_commod_2T2023 = df_commod_2T2023.loc[:, ['TICKER', 'P/L']]
df_commod_3T2023 = df_commod_3T2023.loc[:, ['TICKER', 'P/L']]
df_commod_4T2023 = df_commod_4T2023.loc[:, ['TICKER', 'P/L']]
df_commod_1T2024 = df_commod_1T2024.loc[:, ['TICKER', 'P/L']]
df_commod_2T2024 = df_commod_2T2024.loc[:, ['TICKER', 'P/L']]
df_commod_3T2024 = df_commod_3T2024.loc[:, ['TICKER', 'P/L']]
df_commod_4T2024 = df_commod_4T2024.loc[:, ['TICKER', 'P/L']]
df_commod_1T2025 = df_commod_1T2025.loc[:, ['TICKER', 'P/L']]
df_commod_2T2025 = df_commod_2T2025.loc[:, ['TICKER', 'P/L']]
df_commod_3T2025 = df_commod_3T2025.loc[:, ['TICKER', 'P/L']]

# Criando uma nova coluna de pesos. Eu vou dar pesos diferentes para este Índice de Commodities, não vou usar o peso deles do IBOV
# Petro e Vale tem peso 4 e as demais empresas peso 1
df_commod_4T2021['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_1T2022['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_2T2022['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_3T2022['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_4T2022['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_1T2023['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_2T2023['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_3T2023['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_4T2023['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_1T2024['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_2T2024['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_3T2024['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_4T2024['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_1T2025['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_2T2025['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]
df_commod_3T2025['Novo Part. (%)'] =  [0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.0222, 0.4, 0.4]

# Calculando o PL médio
pl_commod_4T2021 = round(np.average(df_commod_4T2021['P/L'], weights=df_commod_4T2021['Novo Part. (%)']), 2)
pl_commod_1T2022 = round(np.average(df_commod_1T2022['P/L'], weights=df_commod_1T2022['Novo Part. (%)']), 2)
pl_commod_2T2022 = round(np.average(df_commod_2T2022['P/L'], weights=df_commod_2T2022['Novo Part. (%)']), 2)
pl_commod_3T2022 = round(np.average(df_commod_3T2022['P/L'], weights=df_commod_3T2022['Novo Part. (%)']), 2)
pl_commod_4T2022 = round(np.average(df_commod_4T2022['P/L'], weights=df_commod_4T2022['Novo Part. (%)']), 2)
pl_commod_1T2023 = round(np.average(df_commod_1T2023['P/L'], weights=df_commod_1T2023['Novo Part. (%)']), 2)
pl_commod_2T2023 = round(np.average(df_commod_2T2023['P/L'], weights=df_commod_2T2023['Novo Part. (%)']), 2)
pl_commod_3T2023 = round(np.average(df_commod_3T2023['P/L'], weights=df_commod_3T2023['Novo Part. (%)']), 2)
pl_commod_4T2023 = round(np.average(df_commod_4T2023['P/L'], weights=df_commod_4T2023['Novo Part. (%)']), 2)
pl_commod_1T2024 = round(np.average(df_commod_1T2024['P/L'], weights=df_commod_1T2024['Novo Part. (%)']), 2)
pl_commod_2T2024 = round(np.average(df_commod_2T2024['P/L'], weights=df_commod_2T2024['Novo Part. (%)']), 2)
pl_commod_3T2024 = round(np.average(df_commod_3T2024['P/L'], weights=df_commod_3T2024['Novo Part. (%)']), 2)
pl_commod_4T2024 = round(np.average(df_commod_4T2024['P/L'], weights=df_commod_4T2024['Novo Part. (%)']), 2)
pl_commod_1T2025 = round(np.average(df_commod_1T2025['P/L'], weights=df_commod_1T2025['Novo Part. (%)']), 2)
pl_commod_2T2025 = round(np.average(df_commod_2T2025['P/L'], weights=df_commod_2T2025['Novo Part. (%)']), 2)
pl_commod_3T2025 = round(np.average(df_commod_3T2025['P/L'], weights=df_commod_3T2025['Novo Part. (%)']), 2)

# Criando um dicionário p/ transformar em um df
dict_commod = {
    '4T2021':pl_commod_4T2021,
    '1T2022':pl_commod_1T2022,
    '2T2022':pl_commod_2T2022,
    '3T2022':pl_commod_3T2022,
    '4T2022':pl_commod_4T2022,
    '1T2023':pl_commod_1T2023,
    '2T2023':pl_commod_2T2023,
    '3T2023':pl_commod_3T2023,
    '4T2023':pl_commod_4T2023,
    '1T2024':pl_commod_1T2024,
    '2T2024':pl_commod_2T2024,
    '3T2024':pl_commod_3T2024,
    '4T2024':pl_commod_4T2024,
    '1T2025':pl_commod_1T2025,
    '2T2025':pl_commod_2T2025,
    '3T2025':pl_commod_3T2025,
}

# Transformando em um df
df_commod_pl_medio =  pd.DataFrame.from_dict(dict_commod, orient='index', columns=['valor'])

# Plotando o P/L Médio do Ibovespa
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_commod_pl_medio.index,
    y=df_commod_pl_medio['valor'],
    mode='lines',
    name='P/L Médio do Índice Commodities'
))

# Adicionando os pontos na linha do gráfico
fig.update_traces(mode="markers+lines")

# Atualizando o gráfico
fig.update_layout(
    title='P/L Médio do Índice Commodities',
    xaxis_title='Ano',
    yaxis_title='P/L',
    template='seaborn'
)

fig.show()

### Setor de energia elétrica

In [None]:
# Criando o df do IEE
df_iee = f_br.filtro_etf('C://B3//historico-arquivos//indices-b3//iee//IEE_2026_JAN_ABR.csv')

# Selecionando as colunas do df
df_iee = df_iee.loc[:,['Código','Part. (%)']]

# Colocando em ordem as ações com maior participação da carteira teórica
df_iee.sort_values(by=['Part. (%)'], ascending=False)

In [None]:
# Comparando a carteira teórica do IEE anterior com a mais atual
iee_atual = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//iee//IEE_2026_JAN_ABR.csv')
iee_anterior = f_br.filtro_etf(path='C://B3//historico-arquivos//indices-b3//iee//IEE_2025_SET_DEZ.csv')

# Transformando em listas
lista_iee_atual = iee_atual['Código'].tolist()
lista_iee_anterior = iee_anterior['Código'].tolist()

# Diferenças entre as carteiras
acoes_sairam_carteira_atual = sorted(set(lista_iee_anterior) - set(lista_iee_atual))
acoes_entraram_carteira_atual = sorted(set(lista_iee_atual) - set(lista_iee_anterior))

print(f'A carteira teórioca do IEE atual é composta por {len(iee_atual)} ações.')
print(f'A carteira teórioca do IEE anterior é composta por {len(iee_anterior)} ações.')
print('-'*50)
print(f'O número de ações semelhantes são de {len(set(lista_iee_atual) & set(lista_iee_anterior))}.')
print(f'Ações semelhantes entre as duas carteiras: {sorted(set(lista_iee_atual) & set(lista_iee_anterior))}.')
print('-'*50)
print(f'Número de ações diferentes entre as duas carteiras: {len(set(lista_iee_anterior) - set(lista_iee_atual))}.')
print(f'Ações que sairam da carteira atual: {acoes_sairam_carteira_atual}')
print(f'Ações que entraram na carteira atual: {acoes_entraram_carteira_atual}')

In [None]:
# Selecionado o setor
df_energia = df_3T2025.query('(SEGMENTO == "ENERGIA ELETRICA")')

# Retirando os tickers com menos liquidez
df_energia = df_energia[
    (df_energia['TICKER'] != 'AESB3') & 
    (df_energia['TICKER'] != 'ALUP3') & 
    (df_energia['TICKER'] != 'ALUP4') &
    (df_energia['TICKER'] != 'CEBR3') & 
    (df_energia['TICKER'] != 'CEBR5') &
    (df_energia['TICKER'] != 'CEEB5') &
    (df_energia['TICKER'] != 'CEED3') &
    (df_energia['TICKER'] != 'CEPE5') &
    (df_energia['TICKER'] != 'CEPE6') &
    (df_energia['TICKER'] != 'CESP3') &
    (df_energia['TICKER'] != 'CESP5') &
    (df_energia['TICKER'] != 'CLSC3') &
    (df_energia['TICKER'] != 'CMIG3') &
    (df_energia['TICKER'] != 'COCE3') &
    (df_energia['TICKER'] != 'CPLE11') &
    (df_energia['TICKER'] != 'CPLE5') &
    (df_energia['TICKER'] != 'CPLE6') &
    (df_energia['TICKER'] != 'CSRN3') &
    (df_energia['TICKER'] != 'CSRN5') &
    (df_energia['TICKER'] != 'CSRN6') &
    (df_energia['TICKER'] != 'EEEL4') &
    (df_energia['TICKER'] != 'EKTR3') &
    (df_energia['TICKER'] != 'ELET5') &
    (df_energia['TICKER'] != 'ELET6') &
    (df_energia['TICKER'] != 'ENBR3') &
    (df_energia['TICKER'] != 'ENGI3') &
    (df_energia['TICKER'] != 'ENGI4') &
    (df_energia['TICKER'] != 'ENMT4') &
    (df_energia['TICKER'] != 'EQPA5') &
    (df_energia['TICKER'] != 'EQPA7') &
    (df_energia['TICKER'] != 'GEPA3') &
    (df_energia['TICKER'] != 'RNEW11') &
    (df_energia['TICKER'] != 'RNEW3') &
    (df_energia['TICKER'] != 'TAEE3') &
    (df_energia['TICKER'] != 'TAEE4') &
    (df_energia['TICKER'] != 'TRPL3') &                 
    (df_energia['TICKER'] != 'TRPL4') &               
    (df_energia['TICKER'] != 'LIPR3') &
    (df_energia['TICKER'] != 'AXIA5') &
    (df_energia['TICKER'] != 'SRNA3') 
]

# Criando uma lista dos tickers do setor de energia elétrica
lista_energia = df_energia['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_energia_sa = list(map(lambda x: x + ".SA" , lista_energia))

# Download dos preços de fechamento de cada papel
df_energia2 = yf.download(lista_energia_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_energia_copy = df_energia2.copy()

# Listas das empresas por segmento
lst_transmissoras = ['ALUP11', 'TAEE11', 'ISAE4']
lst_geradoras = ['AXIA3', 'EGIE3', 'ENEV3', 'AURE3']
lst_distribuidoras = ['CMIG4', 'CPLE3', 'EQTL3', 'NEOE3']

# Atualizando os tickers das empresas
for periodo, df in dict_dfs.items():
    if (df['TICKER'] == 'TRPL4').any():
        df.loc[df['TICKER'] == 'TRPL4', 'TICKER'] = 'ISAE4'
    if (df['TICKER'] == 'ELET3').any():
        df.loc[df['TICKER'] == 'ELET3', 'TICKER'] = 'AXIA3'

In [None]:
# Selecionando as principais empresas
df_energia_copy = df_energia_copy[[
    'ALUP11.SA',
    'TAEE11.SA',
    'AXIA3.SA',
    'EGIE3.SA',
    'ENEV3.SA',
    'EQTL3.SA',
    'NEOE3.SA',
    'CPLE3.SA',
    'CMIG4.SA',
    'ISAE4.SA'    
]]

# Retirando o NaN
df_energia_copy = df_energia_copy.dropna()

# Momentum de um ano   
momentum = df_energia_copy - df_energia_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(y=0, line=dict(color='red', width=1))

fig.update_layout(
    title_text='Setor de Enegia Elétrica - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_energia = f_br.vol_anual(df_setor=df_energia2, ticker=lista_energia_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_energia.index,
    y=df_vol_anual_energia['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Energia Elétrica',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_energia2.loc['2021':'2025', lista_energia_sa] / df_energia2.loc['2021':'2025', lista_energia_sa].shift(1))  #usar o dropna() se o gráfico ficar com "buracos" entre os anos.

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Selecionando apenas as empresas de transmissão
volatility_transmissao = volatility[['ALUP11.SA', 'TAEE11.SA', 'ISAE4.SA']]

# Selecionando apenas as empresas de geração
volatility_geracao = volatility[['AURE3.SA', 'EGIE3.SA', 'AXIA3.SA', 'ENEV3.SA']]

# Selecionando apenas as empresas de distribuição
volatility_distribuicao = volatility[['CMIG4.SA', 'CPLE3.SA', 'EQTL3.SA', 'NEOE3.SA']]

# Criando os subplots
fig = make_subplots(
    rows=4, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('Transmissão', 'Geração', 'Distribuição', 'Todas as empresas'),
    vertical_spacing=0.05
)

# Transmissão
for col in volatility_transmissao.columns:
    fig.add_trace(go.Scatter(
        x=volatility_transmissao.index, 
        y=volatility_transmissao[col], 
        mode='lines', 
        name=col), 
        row=1, col=1)

# Geração
for col in volatility_geracao.columns:
    fig.add_trace(go.Scatter(
        x=volatility_geracao.index, 
        y=volatility_geracao[col], 
        mode='lines', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in volatility_distribuicao.columns:
    fig.add_trace(go.Scatter(
        x=volatility_distribuicao.index, 
        y=volatility_distribuicao[col], 
        mode='lines', 
        name=col), 
        row=3, col=1)

# Todas as empresas
for col in volatility.columns:
    fig.add_trace(go.Scatter(
        x=volatility.index, 
        y=volatility[col], 
        mode='lines', 
        name=col), 
        row=4, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução da Volatilidade - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_energia = []

for _ in lst_anos:
    vol_media_energia = np.mean(f_br.vol_anual(df_setor=df_energia2, ticker=lista_energia_sa, ano=_)) * 100
    lst_vol_media_energia.append(vol_media_energia)

df_vol_media_energia = pd.DataFrame(lst_vol_media_energia, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_energia.index,
    y=df_vol_media_energia['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Energia', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'

# Transmissão
df_vm_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_vm_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_vm_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('Valor de Mercado - Transmissão', 'Valor de Mercado - Geração', 'Valor de Mercado - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_vm_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_transmissoras.index, 
        y=df_vm_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_vm_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_geradoras.index, 
        y=df_vm_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_vm_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_distribuidoras.index, 
        y=df_vm_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do Valor de Mercado - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'

# Transmissão
df_pl_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_pl_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_pl_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('P/L - Transmissão', 'P/L - Geração', 'P/L - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_pl_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_transmissoras.index, 
        y=df_pl_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_pl_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_geradoras.index, 
        y=df_pl_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_pl_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_distribuidoras.index, 
        y=df_pl_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do P/L - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_energia['P/L']) == len(df_energia.loc[df_energia['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_energia = np.mean(df_energia['P/L'])
    print(f'O P/L médio do setor de energia elétrica é de: {pl_medio_energia:.2f}.')
    print(f"O número total de empresas no setor de energia elétrica é de {len(df_energia['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_energia = np.mean(df_energia['P/L'])
    print(f'O P/L médio do setor de energia elétrica é de: {pl_medio_energia:.2f}.')
    print(f"O número total de empresas no setor de energia elétrica é de {len(df_energia['P/L'])}.")

    print('='*100)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_energia = np.mean(df_energia.loc[df_energia['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de energia elétrica com P/L positivo é de: {pl_medio_energia:.2f}.')
    print(f"O número total de empresas no setor de energia elétrica com P/L positivo é de {len(df_energia.loc[df_energia['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_energia.loc[df_energia['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativo são {list(df_energia.loc[df_energia['P/L'] < 0, 'TICKER'])}.")

    print('='*100)

In [None]:
# Df com o histórico do indicador 'P/VP'

# Transmissão
df_p_vp_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_p_vp_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_p_vp_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('P/VP - Transmissão', 'P/VP - Geração', 'P/VP - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_p_vp_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_transmissoras.index, 
        y=df_p_vp_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_p_vp_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_geradoras.index, 
        y=df_p_vp_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_p_vp_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_distribuidoras.index, 
        y=df_p_vp_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do P/VP - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'

# Transmissão
df_ev_ebit_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_ev_ebit_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_ev_ebit_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('EV/EBIT - Transmissão', 'EV/EBIT - Geração', 'EV/EBIT - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_ev_ebit_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_transmissoras.index, 
        y=df_ev_ebit_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_ev_ebit_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_geradoras.index, 
        y=df_ev_ebit_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_ev_ebit_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_distribuidoras.index, 
        y=df_ev_ebit_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do EV/EBIT - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'

# Transmissão
df_roe_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_roe_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_roe_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('ROE - Transmissão', 'ROE - Geração', 'ROE - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_roe_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_transmissoras.index, 
        y=df_roe_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_roe_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_geradoras.index, 
        y=df_roe_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_roe_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_distribuidoras.index, 
        y=df_roe_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do ROE - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'

# Transmissão
df_roic_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_roic_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_roic_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('ROIC - Transmissão', 'ROIC - Geração', 'ROIC - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_roic_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_transmissoras.index, 
        y=df_roic_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_roic_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_geradoras.index, 
        y=df_roic_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_roic_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_distribuidoras.index, 
        y=df_roic_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do ROIC - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DL/EBIT'

# Transmissão
df_dl_ebit_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_dl_ebit_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_dl_ebit_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('DL/EBIT - Transmissão', 'DL/EBIT - Geração', 'DL/EBIT - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_dl_ebit_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_transmissoras.index, 
        y=df_dl_ebit_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_dl_ebit_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_geradoras.index, 
        y=df_dl_ebit_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_dl_ebit_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_distribuidoras.index, 
        y=df_dl_ebit_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do DL/EBIT - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DL/PL'

# Transmissão
df_dl_pl_transmissoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lst_transmissoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_transmissoras
).T

# Geração
df_dl_pl_geradoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lst_geradoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_geradoras
).T

# Distribuição
df_dl_pl_distribuidoras = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lst_distribuidoras]
        for periodo, df in dict_dfs.items()
    },
    index=lst_distribuidoras
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('DL/PL - Transmissão', 'DL/PL - Geração', 'DL/PL - Distribuição'),
    vertical_spacing=0.05
)

# Transmissão
for col in df_dl_pl_transmissoras.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_transmissoras.index, 
        y=df_dl_pl_transmissoras[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Geração
for col in df_dl_pl_geradoras.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_geradoras.index, 
        y=df_dl_pl_geradoras[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Distribuição
for col in df_dl_pl_distribuidoras.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_distribuidoras.index, 
        y=df_dl_pl_distribuidoras[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do DL/PL - Setor Energia Elétrica', 
    template='seaborn'
)

fig.show()

In [None]:
# Heatmap das correlações entre os preços
plt.figure(figsize=(30,25))
sns.heatmap(df_energia2.corr(), annot=True, cmap='coolwarm');

In [None]:
# Transformando a correlação em uma métrica
eletricas_metrica = df_energia2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
eletricas_metrica = eletricas_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
plt.figure(figsize=(30,25))
sns.heatmap(f_br.cluster_corr(eletricas_metrica), annot=True, cmap='coolwarm');

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_eletrico = df_energia2.pct_change().dropna()

# Drawdown
max_drawdown_eletrica = f_br.drawdown(df_returns=ret_eletrico)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_eletrica.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Energia Elétrica - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno diário das empresas de energia elétrica
ret_eletrico_transmissao = df_energia2[[
    'TAEE11.SA', 
    'ISAE4.SA', 
    'ALUP11.SA'
]].pct_change().dropna()

ret_eletrico_geracao = df_energia2[[
    'AXIA3.SA', 
    'EGIE3.SA', 
    'ENEV3.SA', 
    'AURE3.SA'
]].pct_change().dropna()

ret_eletrico_distribuicao = df_energia2[[
    'CPLE3.SA', 
    'CMIG4.SA', 
    'NEOE3.SA', 
    'EQTL3.SA'
]].pct_change().dropna()

# Calculando o retorno acumulado
ret_accum_transmissao = (1 + ret_eletrico_transmissao).cumprod()
ret_accum_geracao = (1 + ret_eletrico_geracao).cumprod()
ret_accum_distribuicao = (1 + ret_eletrico_distribuicao).cumprod()

# Primeiro dia começa em 1
ret_accum_transmissao.iloc[0] = 1
ret_accum_geracao.iloc[0] = 1
ret_accum_distribuicao.iloc[0] = 1

# Plotando o retorno acumulado
fig = make_subplots(
    rows=3, 
    cols=1,
    subplot_titles=['Empresas de Transmissão',
                    'Empresas de Geração',
                    'Empresas de Distribuição'],
    vertical_spacing=0.08
)

for empresa in ret_accum_transmissao:
    fig.add_trace(go.Scatter(
        x=ret_accum_transmissao.index,
        y=ret_accum_transmissao[empresa],
        name=empresa
    ), row=1, col=1)

for empresa in ret_accum_geracao:
    fig.add_trace(go.Scatter(
        x=ret_accum_geracao.index,
        y=ret_accum_geracao[empresa],
        name=empresa
    ), row=2, col=1)

for empresa in ret_accum_distribuicao:
    fig.add_trace(go.Scatter(
        x=ret_accum_distribuicao.index,
        y=ret_accum_distribuicao[empresa],
        name=empresa
    ), row=3, col=1)

for _ in [1,2,3]:
    fig.update_yaxes(
        title_text='Porcentagem (%)',
        row=_,
        col=1
    )

fig.update_layout(
    height=1500,
    title_text='Retorno Acumulado das Empresas do Setor de Energia Elétrica',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_energia_anual = df_energia2.groupby(df_energia2.index.year).last().drop(df_energia2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_energia = ((df_energia_anual / df_energia_anual.shift(1)) - 1) * 100

# Selecionando as principais empresas
df_ret_anual_energia_principais = df_ret_anual_energia[[
    # Transmissão
    'ALUP11.SA', 
    'ISAE4.SA', 
    'TAEE11.SA', 
    # Geração
    'AXIA3.SA',
    'EGIE3.SA', 
    'ENEV3.SA',  
    # Distribuição
    'EQTL3.SA', 
    'NEOE3.SA', 
    'CPLE3.SA', 
    'CMIG4.SA'
]]

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_energia_principais, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Energia Elétrica')
plt.show()

In [None]:
# Número de anos
num_years = len(df_energia_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
alup_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'ALUP11.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'ALUP11.SA'].iloc[-1], num_periods=num_years) * 100, 2)
taee_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'TAEE11.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'TAEE11.SA'].iloc[-1], num_periods=num_years) * 100, 2)
elet_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'AXIA3.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'AXIA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
egie_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'EGIE3.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'EGIE3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
enev_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'ENEV3.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'ENEV3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
eqtl_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'EQTL3.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'EQTL3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
neoe_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'NEOE3.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'NEOE3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
cple_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'CPLE3.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'CPLE3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
cmig_cagr = round(f_br.cagr(start_value=df_energia_copy.loc[:, 'CMIG4.SA'].iloc[0], end_value=df_energia_copy.loc[:, 'CMIG4.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'ALUP11.SA':alup_cagr,
    'TAEE11.SA':taee_cagr,
    'AXIA3.SA':elet_cagr,
    'EGIE3.SA':egie_cagr,
    'ENEV3.SA':enev_cagr,
    'EQTL3.SA':eqtl_cagr,
    'NEOE3.SA':neoe_cagr,
    'CPLE6.SA':cple_cagr,
    'CMIG4.SA':cmig_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Energia Elétrica',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_alup, model_alup = f_br.calculate_beta(index='^BVSP', stock='ALUP11.SA', period='3y', interval='1wk')
beta_taee, model_taee = f_br.calculate_beta(index='^BVSP', stock='TAEE11.SA', period='3y', interval='1wk')
beta_elet, model_elet = f_br.calculate_beta(index='^BVSP', stock='AXIA3.SA', period='3y', interval='1wk')
beta_egie, model_egie = f_br.calculate_beta(index='^BVSP', stock='EGIE3.SA', period='3y', interval='1wk')
beta_enev, model_enev = f_br.calculate_beta(index='^BVSP', stock='ENEV3.SA', period='3y', interval='1wk')
beta_eqtl, model_eqtl = f_br.calculate_beta(index='^BVSP', stock='EQTL3.SA', period='3y', interval='1wk')
beta_neoe, model_neoe = f_br.calculate_beta(index='^BVSP', stock='NEOE3.SA', period='3y', interval='1wk')
beta_cple, model_cple = f_br.calculate_beta(index='^BVSP', stock='CPLE3.SA', period='3y', interval='1wk')
beta_cmig, model_cmig = f_br.calculate_beta(index='^BVSP', stock='CMIG4.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'ALUP11.SA':beta_alup, 
    'TAEE11.SA':beta_taee, 
    'AXIA3.SA':beta_elet, 
    'EGIE3.SA':beta_egie,
    'ENEV3.SA':beta_enev,
    'EQTL3.SA':beta_eqtl,
    'NEOE3.SA':beta_neoe,
    'CPLE3.SA':beta_cple,
    'CMIG4.SA':beta_cmig
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange',
    'dimgrey',
    'cyan',
    'gold',
    'magenta',
    'dodgerblue'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5)  

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Energia Elétrica', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de bancos

In [None]:
# Selecionado o setor
df_bancos = df_3T2025.query('(SEGMENTO == "BANCOS")')

# Retirando os tickers com menos liquidez
df_bancos = df_bancos[
    (df_bancos['TICKER'] != 'BAZA3') &
    (df_bancos['TICKER'] != 'BBDC4') &
    (df_bancos['TICKER'] != 'BEES4') &
    (df_bancos['TICKER'] != 'BGIP3') &
    (df_bancos['TICKER'] != 'BIDI3') &
    (df_bancos['TICKER'] != 'BIDI4') &
    (df_bancos['TICKER'] != 'BMEB3') &
    (df_bancos['TICKER'] != 'BMIN3') &
    (df_bancos['TICKER'] != 'BPAC3') &
    (df_bancos['TICKER'] != 'BPAC4') &
    (df_bancos['TICKER'] != 'BPAC5') &
    (df_bancos['TICKER'] != 'BPAN4') &
    (df_bancos['TICKER'] != 'BRIV3') &
    (df_bancos['TICKER'] != 'BRIV4') &
    (df_bancos['TICKER'] != 'BRSR3') &
    (df_bancos['TICKER'] != 'BRSR5') &
    (df_bancos['TICKER'] != 'BSLI3') &
    (df_bancos['TICKER'] != 'ITSA3') &
    (df_bancos['TICKER'] != 'ITUB3') &
    (df_bancos['TICKER'] != 'MODL3') &
    (df_bancos['TICKER'] != 'MODL4') &
    (df_bancos['TICKER'] != 'MODL11') &
    (df_bancos['TICKER'] != 'RPAD3') &
    (df_bancos['TICKER'] != 'RPAD6') &
    (df_bancos['TICKER'] != 'SANB3') &
    (df_bancos['TICKER'] != 'SANB4') 
]

# Criando uma lista dos tickers do setor de bancos
lista_bancos = df_bancos['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_bancos_sa = list(map(lambda x: x + ".SA" , lista_bancos))

# Download dos preços de fechamento de cada papel
df_bancos2 = yf.download(lista_bancos_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_bancos_copy = df_bancos2.copy()

# Listas das empresas por segmento
lst_principais_bancos = ['BBAS3', 'BBDC3', 'BPAC11', 'ITUB4', 'ITSA4', 'SANB11']

In [None]:
# Selecionando as principais empresas
df_bancos_copy = df_bancos_copy[[
    'BBAS3.SA',
    'BBDC3.SA',
    'BPAC11.SA',
    'ITUB4.SA',
    'ITSA4.SA',
    'SANB11.SA'
]]

# Retirando o NaN
df_bancos_copy = df_bancos_copy.dropna()

# Momentum de um ano   
momentum = df_bancos_copy - df_bancos_copy.shift(252)

# Retirando o NaN   
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Bancos - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_bancos = f_br.vol_anual(df_setor=df_bancos2, ticker=lista_bancos_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_bancos.index,
    y=df_vol_anual_bancos['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Bancos',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_bancos2.loc['2021':'2025', lista_bancos_sa] / df_bancos2.loc['2021':'2025', lista_bancos_sa].shift(1))  

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Selecionando apenas as empresas de transmissão
volatility_principais = volatility[['BBAS3.SA', 'BBDC3.SA', 'BPAC11.SA', 'ITUB4.SA', 'SANB11.SA']]

# Criando os subplots
fig = make_subplots(
    rows=2, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('Principais Bancos', 'Todas as empresas'),
    vertical_spacing=0.08
)

# Principais bancos
for col in volatility_principais.columns:
    fig.add_trace(go.Scatter(
        x=volatility_principais.index, 
        y=volatility_principais[col], 
        mode='lines', 
        name=col), 
        row=1, col=1)

# Todas as empresas
for col in volatility.columns:
    fig.add_trace(go.Scatter(
        x=volatility.index, 
        y=volatility[col], 
        mode='lines', 
        name=col), 
        row=2, col=1)

# Atualizar layout
fig.update_layout(
    height=900, 
    width=1200, 
    title_text='Evolução da Volatilidade - Setor Bancário', 
    template='seaborn'
)

# Mostrar gráfico
fig.show()

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_bancos = []

for _ in lst_anos:
    vol_media_bancos = np.mean(f_br.vol_anual(df_setor=df_bancos2, ticker=lista_bancos_sa, ano=_)) * 100
    lst_vol_media_bancos.append(vol_media_bancos)

df_vol_media_bancos = pd.DataFrame(lst_vol_media_bancos, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_bancos.index,
    y=df_vol_media_bancos['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor Bancário', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_bancos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_principais_bancos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_principais_bancos
).T

# Plot
fig = go.Figure()

for col in df_vm_bancos.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_bancos.index, 
        y=df_vm_bancos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor Bancário', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_bancos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_principais_bancos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_principais_bancos
).T

# Plot
fig = go.Figure()

for col in df_pl_bancos.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_bancos.index, 
        y=df_pl_bancos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor Bancário', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_bancos['P/L']) == len(df_bancos.loc[df_bancos['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_bancos = np.mean(df_bancos['P/L'])
    print(f'O P/L médio do setor bancário é de: {pl_medio_bancos:.2f}.')
    print(f"O número total de empresas no setor bancário é de {len(df_bancos['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_bancos = np.mean(df_bancos['P/L'])
    print(f'O P/L médio do setor bancário é de: {pl_medio_bancos:.2f}.')
    print(f"O número total de empresas no setor bancário é de {len(df_bancos['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_bancos = np.mean(df_bancos.loc[df_bancos['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor bancário é de: {pl_medio_bancos:.2f}.')
    print(f"O número total de empresas no setor bancário com P/L positivo é de {len(df_bancos.loc[df_bancos['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_bancos.loc[df_bancos['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativo são {list(df_bancos.loc[df_bancos['P/L'] < 0, 'TICKER'])}.")
    
    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_bancos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_principais_bancos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_principais_bancos
).T

# Plot
fig = go.Figure()

for col in df_p_vp_bancos.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_bancos.index, 
        y=df_p_vp_bancos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor Bancário', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_bancos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_principais_bancos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_principais_bancos
).T

# Plot
fig = go.Figure()

for col in df_roe_bancos.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_bancos.index, 
        y=df_roe_bancos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor Bancário', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(30, 15))

# Correlação das empresas de bancos
sns.heatmap(df_bancos2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Bancos', fontsize=12)

# Transformando a correlação em uma métrica
bancos_metrica = df_bancos2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
bancos_metrica = bancos_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(bancos_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Bancos')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_bancos = df_bancos2.pct_change().dropna()

# Drawdown
max_drawdown_bancos = f_br.drawdown(df_returns=ret_bancos)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_bancos.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor Bancário - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno diário das empresas de energia elétrica
ret_bancos_principais = df_bancos2[[
    'BBAS3.SA', 
    'BBDC3.SA', 
    'ITUB4.SA', 
    'SANB11.SA',
    'BPAC11.SA'
]].pct_change().dropna()

# Calculando o retorno acumulado
ret_accum = (1 + ret_bancos_principais).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Bancos',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_bancos_anual = df_bancos2.groupby(df_bancos2.index.year).last().drop(df_bancos2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_bancos = ((df_bancos_anual / df_bancos_anual.shift(1)) - 1) * 100

# Selecionando as principais empresas
df_ret_anual_bancos_principais = df_ret_anual_bancos[[
    'BBAS3.SA', 
    'BBDC3.SA', 
    'ITUB4.SA', 
    'SANB11.SA',
    'BPAC11.SA'
]]

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_bancos_principais, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Bancos')
plt.show()

In [None]:
# Número de anos
num_years = len(df_bancos_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
bbas_cagr = round(f_br.cagr(start_value=df_bancos_copy.loc[:, 'BBAS3.SA'].iloc[0], end_value=df_bancos_copy.loc[:, 'BBAS3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
bbdc_cagr = round(f_br.cagr(start_value=df_bancos_copy.loc[:, 'BBDC3.SA'].iloc[0], end_value=df_bancos_copy.loc[:, 'BBDC3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
bpac_cagr = round(f_br.cagr(start_value=df_bancos_copy.loc[:, 'BPAC11.SA'].iloc[0], end_value=df_bancos_copy.loc[:, 'BPAC11.SA'].iloc[-1], num_periods=num_years) * 100, 2)
itub_cagr = round(f_br.cagr(start_value=df_bancos_copy.loc[:, 'ITUB4.SA'].iloc[0], end_value=df_bancos_copy.loc[:, 'ITUB4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
itsa_cagr = round(f_br.cagr(start_value=df_bancos_copy.loc[:, 'ITSA4.SA'].iloc[0], end_value=df_bancos_copy.loc[:, 'ITSA4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
sanb_cagr = round(f_br.cagr(start_value=df_bancos_copy.loc[:, 'SANB11.SA'].iloc[0], end_value=df_bancos_copy.loc[:, 'SANB11.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'BBAS3.SA':bbas_cagr,
    'BBDC3.SA':bbdc_cagr,
    'BPAC11.SA':bpac_cagr,
    'ITUB4.SA':itub_cagr,
    'ITSA4.SA':itsa_cagr,
    'SANB11.SA':sanb_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Bancos',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_bbas, model_bbas = f_br.calculate_beta(index='^BVSP', stock='BBAS3.SA', period='3y', interval='1wk')
beta_bbdc, model_bbdc = f_br.calculate_beta(index='^BVSP', stock='BBDC3.SA', period='3y', interval='1wk')
beta_bpac, model_bpac = f_br.calculate_beta(index='^BVSP', stock='BPAC11.SA', period='3y', interval='1wk')
beta_itub, model_itub = f_br.calculate_beta(index='^BVSP', stock='ITUB4.SA', period='3y', interval='1wk')
beta_itsa, model_itsa = f_br.calculate_beta(index='^BVSP', stock='ITSA4.SA', period='3y', interval='1wk')
beta_sanb, model_sanb = f_br.calculate_beta(index='^BVSP', stock='SANB11.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'BBAS3.SA':beta_bbas, 
    'BBDC3.SA':beta_bbdc, 
    'BPAC11.SA':beta_bpac, 
    'ITUB4.SA':beta_itub, 
    'ITSA4.SA':beta_itsa,
    'SANB11.SA':beta_sanb
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange',
    'dimgrey'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5)  

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Bancos', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de varejo

In [None]:
# Selecionado o setor
df_varejo = df_3T2025.query('(SEGMENTO == "VAREJO")')

# Retirando os tickers com menos liquidez
df_varejo = df_varejo[
    (df_varejo['TICKER'] != 'ALPA3') &
    (df_varejo['TICKER'] != 'ARZZ3') &
    (df_varejo['TICKER'] != 'CGRA3') &
    (df_varejo['TICKER'] != 'SLED3') &
    (df_varejo['TICKER'] != 'SOMA3') &
    (df_varejo['TICKER'] != 'WHRL3') &  
    (df_varejo['TICKER'] != 'VSTE3') &  # é a antiga LLIS3. O yfinance ainda não tem as cotações da empresa
    (df_varejo['TICKER'] != 'TOKY3') 
]

# Criando uma lista dos tickers do setor de varejo
lista_varejo = df_varejo['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_varejo_sa = list(map(lambda x: x + ".SA" , lista_varejo))

# Download dos preços de fechamento de cada papel
df_varejo2 = yf.download(lista_varejo_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_varejo_copy = df_varejo2.copy().dropna()

# Listas das empresas por segmento
lst_roupas = ['AZZA3', 'LREN3', 'GUAR3', 'CEAB3', 'SBFG3', 'VULC3']
lst_eletrodomesticos = ['BHIA3', 'MGLU3']
lst_outros = ['VIVA3', 'PETZ3']

# Atualizando os tickers das empresas
for periodo, df in dict_dfs.items():
    if (df['TICKER'] == 'ARZZ3').any():
        df.loc[df['TICKER'] == 'ARZZ3', 'TICKER'] = 'AZZA3'
    if (df['TICKER'] == 'VIIA3').any():
        df.loc[df['TICKER'] == 'VIIA3', 'TICKER'] = 'BHIA3'

In [None]:
# Selecionando as principais empresas
df_varejo_roupa = df_varejo_copy[[
    #'AZZA3.SA', 
    'LREN3.SA', 
    'GUAR3.SA',
    'CEAB3.SA',
    'SBFG3.SA',
    'VULC3.SA'
]]

df_varejo_eletrodomestico = df_varejo_copy[[
    'BHIA3.SA', 
    'MGLU3.SA'
]]

df_varejo_outros = df_varejo_copy[[
    'VIVA3.SA', 
    'PETZ3.SA'
]]

# Retirando o NaN
df_varejo_roupa = df_varejo_roupa.dropna()
df_varejo_eletrodomestico = df_varejo_eletrodomestico.dropna()
df_varejo_outros = df_varejo_outros.dropna()

# Momentum de um ano   
momentum_roupa = df_varejo_roupa - df_varejo_roupa.shift(252)
momentum_eletrodomestico = df_varejo_eletrodomestico - df_varejo_eletrodomestico.shift(252)
momentum_outros = df_varejo_outros - df_varejo_outros.shift(252)

# Retirando o NaN
momentum_roupa = momentum_roupa.dropna()
momentum_eletrodomestico = momentum_eletrodomestico.dropna()    
momentum_outros = momentum_outros.dropna()

# Plotando o momentum
fig = make_subplots(
    rows=3, 
    cols=1,
    subplot_titles=['Empresas de Roupas',
                    'Empresas de Eletrodomésticos',
                    'Outros'],
    vertical_spacing=0.08
)

for empresa in momentum_roupa:
    fig.add_trace(go.Scatter(
        x=momentum_roupa.index,
        y=momentum_roupa[empresa],
        name=empresa
    ), row=1, col=1)

for empresa in momentum_eletrodomestico:
    fig.add_trace(go.Scatter(
        x=momentum_eletrodomestico.index,
        y=momentum_eletrodomestico[empresa],
        name=empresa
    ), row=2, col=1)

for empresa in momentum_outros:
    fig.add_trace(go.Scatter(
        x=momentum_outros.index,
        y=momentum_outros[empresa],
        name=empresa
    ), row=3, col=1)

for _ in [1,2,3]:
    fig.add_hline(
        y=0, 
        line=dict(color='red', width=1),
        row=_, 
        col=1
    )

fig.update_layout(
    title_text='Setor de Varejo - Momentum',
    template='seaborn',
    height=1000
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_varejo = f_br.vol_anual(df_setor=df_varejo2, ticker=lista_varejo_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_varejo.index,
    y=df_vol_anual_varejo['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Varejo',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_varejo2.loc['2021':'2025', lista_varejo_sa] / df_varejo2.loc['2021':'2025', lista_varejo_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Selecionando apenas as empresas de transmissão
volatility_linha_branca = volatility[['BHIA3.SA', 'MGLU3.SA']]
volatility_calcados = volatility[['ALPA4.SA', 'GRND3.SA', 'VULC3.SA']]
volatility_roupas = volatility[['AMAR3.SA', 'AZZA3.SA','CEAB3.SA', 'GUAR3.SA', 'LREN3.SA', 'SBFG3.SA', 'TFCO4.SA']]
volatility_outros = volatility[['PETZ3.SA', 'VIVA3.SA']]

# Criando os subplots
fig = make_subplots(
    rows=5, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=(
        'Linha branca', 
        'Calçados', 
        'Roupas',
        'Outros',
        'Todas as empresas'
    ),
    vertical_spacing=0.04
)

# Linha Branca
for col in volatility_linha_branca.columns:
    fig.add_trace(go.Scatter(
        x=volatility_linha_branca.index, 
        y=volatility_linha_branca[col], 
        mode='lines', 
        name=col), 
        row=1, col=1)

# Calçados    
for col in volatility_calcados.columns:
    fig.add_trace(go.Scatter(
        x=volatility_calcados.index, 
        y=volatility_calcados[col], 
        mode='lines', 
        name=col), 
        row=2, col=1)
    
# Roupas  
for col in volatility_roupas.columns:
    fig.add_trace(go.Scatter(
        x=volatility_roupas.index, 
        y=volatility_roupas[col], 
        mode='lines', 
        name=col), 
        row=3, col=1)
    
# Outros
for col in volatility_outros.columns:
    fig.add_trace(go.Scatter(
        x=volatility_outros.index, 
        y=volatility_outros[col], 
        mode='lines', 
        name=col), 
        row=4, col=1)

# Todas as empresas
for col in volatility.columns:
    fig.add_trace(go.Scatter(
        x=volatility.index, 
        y=volatility[col], 
        mode='lines', 
        name=col), 
        row=5, col=1)

# Atualizar layout
fig.update_layout(
    height=1800, 
    width=1200, 
    title_text='Evolução da Volatilidade - Setor Varejo', 
    template='seaborn'
)

# Mostrar gráfico
fig.show()

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_varejo = []

for _ in lst_anos:
    vol_media_varejo = np.mean(f_br.vol_anual(df_setor=df_varejo2, ticker=lista_varejo_sa, ano=_)) * 100
    lst_vol_media_varejo.append(vol_media_varejo)

df_vol_media_varejo = pd.DataFrame(lst_vol_media_varejo, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_varejo.index,
    y=df_vol_media_varejo['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'

# Roupas
df_vm_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_vm_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_vm_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('Valor de Mercado - Roupas', 'Valor de Mercado - Eletrodomésticos', 'Valor de Mercado - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_vm_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_roupas.index, 
        y=df_vm_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_vm_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_eletrodomesticos.index, 
        y=df_vm_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_vm_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_outros.index, 
        y=df_vm_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do Valor de Mercado - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'

# Roupas
df_pl_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_pl_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_pl_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('P/L - Roupas', 'P/L - Eletrodomésticos', 'P/L - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_pl_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_roupas.index, 
        y=df_pl_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_pl_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_eletrodomesticos.index, 
        y=df_pl_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_pl_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_outros.index, 
        y=df_pl_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do P/L - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_varejo['P/L']) == len(df_varejo.loc[df_varejo['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_varejo = np.mean(df_varejo['P/L'])
    print(f'O P/L médio do setor de varejo é de: {pl_medio_varejo:.2f}.')
    print(f"O número total de empresas no setor de varejo é de {len(df_varejo['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_varejo = np.mean(df_varejo['P/L'])
    print(f'O P/L médio do setor de varejo é de: {pl_medio_varejo:.2f}.')
    print(f"O número total de empresas no setor de varejo é de {len(df_varejo['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_varejo = np.mean(df_varejo.loc[df_varejo['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de varejo é de: {pl_medio_varejo:.2f}.')
    print(f"O número total de empresas no setor de varejo com P/L positivo é de {len(df_varejo.loc[df_varejo['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_varejo.loc[df_varejo['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativo são {list(df_varejo.loc[df_varejo['P/L'] < 0, 'TICKER'])}.")

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'

# Roupas
df_p_vp_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_p_vp_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_p_vp_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('P/VP - Roupas', 'P/VP - Eletrodomésticos', 'P/VP - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_p_vp_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_roupas.index, 
        y=df_p_vp_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_p_vp_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_eletrodomesticos.index, 
        y=df_p_vp_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_p_vp_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_outros.index, 
        y=df_p_vp_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do P/VP - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'

# Roupas
df_ev_ebit_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_ev_ebit_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_ev_ebit_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('EV/EBIT - Roupas', 'EV/EBIT - Eletrodomésticos', 'EV/EBIT - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_ev_ebit_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_roupas.index, 
        y=df_ev_ebit_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_ev_ebit_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_eletrodomesticos.index, 
        y=df_ev_ebit_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_ev_ebit_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_outros.index, 
        y=df_ev_ebit_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do EV/EBIT - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'

# Roupas
df_roe_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_roe_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_roe_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('ROE - Roupas', 'ROE - Eletrodomésticos', 'ROE - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_roe_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_roupas.index, 
        y=df_roe_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_roe_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_eletrodomesticos.index, 
        y=df_roe_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_roe_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_outros.index, 
        y=df_roe_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do ROE - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'

# Roupas
df_roic_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_roic_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_roic_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('ROIC - Roupas', 'ROIC - Eletrodomésticos', 'ROIC - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_roic_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_roupas.index, 
        y=df_roic_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_roic_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_eletrodomesticos.index, 
        y=df_roic_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_roic_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_outros.index, 
        y=df_roic_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do ROIC - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'

# Roupas
df_dl_ebit_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_dl_ebit_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_dl_ebit_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('DL/EBIT - Roupas', 'DL/EBIT - Eletrodomésticos', 'DL/EBIT - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_dl_ebit_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_roupas.index, 
        y=df_dl_ebit_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_dl_ebit_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_eletrodomesticos.index, 
        y=df_dl_ebit_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_dl_ebit_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_outros.index, 
        y=df_dl_ebit_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do DL/EBIT - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'

# Roupas
df_dl_pl_roupas = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lst_roupas]
        for periodo, df in dict_dfs.items()
    },
    index=lst_roupas
).T

# Eletrodomésticos
df_dl_pl_eletrodomesticos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lst_eletrodomesticos]
        for periodo, df in dict_dfs.items()
    },
    index=lst_eletrodomesticos
).T

# Outros
df_dl_pl_outros = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lst_outros]
        for periodo, df in dict_dfs.items()
    },
    index=lst_outros
).T

# Criando os subplots
fig = make_subplots(
    rows=3, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('DL/PL - Roupas', 'DL/PL - Eletrodomésticos', 'DL/PL - Outros'),
    vertical_spacing=0.05
)

# Roupas
for col in df_dl_pl_roupas.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_roupas.index, 
        y=df_dl_pl_roupas[col], 
        mode='lines+markers', 
        name=col), 
        row=1, col=1)

# Eletrodomésticos
for col in df_dl_pl_eletrodomesticos.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_eletrodomesticos.index, 
        y=df_dl_pl_eletrodomesticos[col], 
        mode='lines+markers', 
        name=col), 
        row=2, col=1)

# Outros
for col in df_dl_pl_outros.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_outros.index, 
        y=df_dl_pl_outros[col], 
        mode='lines+markers', 
        name=col), 
        row=3, col=1)

fig.update_layout(
    height=1500, 
    width=1200, 
    title_text='Evolução do DL/PL - Setor de Varejo', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(30, 15))

# Correlação das empresas de varejo
sns.heatmap(df_varejo2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Varejo', fontsize=12)

# Transformando a correlação em uma métrica
varejo_metrica = df_varejo2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
varejo_metrica = varejo_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(varejo_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Varejo')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_varejo = df_varejo2.pct_change().dropna()

# Drawdown
max_drawdown_varejo = f_br.drawdown(df_returns=ret_varejo)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_varejo.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Varejo - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno diário das empresas de varejo 
ret_varejo_roupa = df_varejo2[[
    'AZZA3.SA', 
    'LREN3.SA', 
    'GUAR3.SA',
    'CEAB3.SA',
    'SBFG3.SA',
    'VULC3.SA'
]].pct_change().dropna()

ret_varejo_eletrodomestico = df_varejo2[[
    'BHIA3.SA', 
    'MGLU3.SA',
    'AMER3.SA'
]].pct_change().dropna()

ret_varejo_outros = df_varejo2[[
    'VIVA3.SA', 
    'PETZ3.SA'
]].pct_change().dropna()

# Calculando o retorno acumulado
ret_accum_roupa = (1 + ret_varejo_roupa).cumprod()
ret_accum_eletrodomestico = (1 + ret_varejo_eletrodomestico).cumprod()
ret_accum_outros = (1 + ret_varejo_outros).cumprod()

# Primeiro dia começa em 1
ret_accum_roupa.iloc[0] = 1
ret_accum_eletrodomestico.iloc[0] = 1
ret_accum_outros.iloc[0] = 1

# Plotando o retorno acumulado
   
fig = make_subplots(
    rows=3, 
    cols=1,
    subplot_titles=['Empresas de Roupas',
                    'Empresas de Eletrodomésticos',
                    'Outros'],
    vertical_spacing=0.08
)

for empresa in ret_accum_roupa:
    fig.add_trace(go.Scatter(
        x=ret_accum_roupa.index,
        y=ret_accum_roupa[empresa],
        name=empresa
    ), row=1, col=1)

for empresa in ret_accum_eletrodomestico:
    fig.add_trace(go.Scatter(
        x=ret_accum_eletrodomestico.index,
        y=ret_accum_eletrodomestico[empresa],
        name=empresa
    ), row=2, col=1)

for empresa in ret_accum_outros:
    fig.add_trace(go.Scatter(
        x=ret_accum_outros.index,
        y=ret_accum_outros[empresa],
        name=empresa
    ), row=3, col=1)

for _ in [1,2,3]:
    fig.update_yaxes(
        title_text='Porcentagem (%)',
        row=_,
        col=1
    )

    fig.add_hline(
        y=1, 
        line_width=1, 
        line_color='red', 
        row=_, 
        col=1
    )

fig.update_layout(
    height=1500,
    title_text='Retorno Acumulado das Empresas do Setor de Varejo',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_varejo_anual = df_varejo2.groupby(df_varejo2.index.year).last().drop(df_varejo2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_varejo = ((df_varejo_anual / df_varejo_anual.shift(1)) - 1) * 100

# Selecionando as principais empresas
df_ret_anual_varejo_principais = df_ret_anual_varejo[[
    # Roupas
    'AZZA3.SA', 
    'LREN3.SA', 
    'GUAR3.SA', 
    'CEAB3.SA', 
    'SBFG3.SA',
    'VULC3.SA', 
    # Eletrodoméstico
    'BHIA3.SA', 
    'MGLU3.SA',
    # Outros
    'VIVA3.SA', 
    'PETZ3.SA'
]]

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_varejo_principais, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Varejo')
plt.show()

In [None]:
# Número de anos
num_years = len(df_varejo_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
azza_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'AZZA3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'AZZA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
lren_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'LREN3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'LREN3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
guar_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'GUAR3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'GUAR3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
ceab_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'CEAB3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'CEAB3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
sbfg_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'SBFG3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'SBFG3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
bhia_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'BHIA3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'BHIA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
mglu_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'MGLU3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'MGLU3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
viva_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'VIVA3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'VIVA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
vulc_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'VULC3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'VULC3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
petz_cagr = round(f_br.cagr(start_value=df_varejo_copy.loc[:, 'PETZ3.SA'].iloc[0], end_value=df_varejo_copy.loc[:, 'PETZ3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'AZZA3.SA':azza_cagr,
    'LREN3.SA':lren_cagr,
    'GUAR3.SA':guar_cagr,
    'CEAB3.SA':ceab_cagr,
    'SBFG3.SA':sbfg_cagr,
    'BHIA3.SA':bhia_cagr,
    'MGLU3.SA':mglu_cagr,
    'VIVA3.SA':viva_cagr,
    'VULC3.SA':vulc_cagr,
    'PETZ3.SA':petz_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Varejo',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_azza, model_azza = f_br.calculate_beta(index='^BVSP', stock='AZZA3.SA', period='3y', interval='1wk')
beta_lren, model_lren = f_br.calculate_beta(index='^BVSP', stock='LREN3.SA', period='3y', interval='1wk')
beta_guar, model_guar = f_br.calculate_beta(index='^BVSP', stock='GUAR3.SA', period='3y', interval='1wk')
beta_ceab, model_ceab = f_br.calculate_beta(index='^BVSP', stock='CEAB3.SA', period='3y', interval='1wk')
beta_sbfg, model_sbfg = f_br.calculate_beta(index='^BVSP', stock='SBFG3.SA', period='3y', interval='1wk')
beta_bhia, model_bhia = f_br.calculate_beta(index='^BVSP', stock='BHIA3.SA', period='3y', interval='1wk')
beta_mglu, model_mglu = f_br.calculate_beta(index='^BVSP', stock='MGLU3.SA', period='3y', interval='1wk')
beta_viva, model_viva = f_br.calculate_beta(index='^BVSP', stock='VIVA3.SA', period='3y', interval='1wk')
beta_vulc, model_vulc = f_br.calculate_beta(index='^BVSP', stock='VULC3.SA', period='3y', interval='1wk')
beta_petz, model_petz = f_br.calculate_beta(index='^BVSP', stock='PETZ3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'AZZA3.SA':beta_azza, 
    'LREN3.SA':beta_lren, 
    'GUAR3.SA':beta_guar, 
    'CEAB3.SA':beta_ceab, 
    'ITSA4.SA':beta_sbfg,
    'BHIA3.SA':beta_bhia,
    'MGLU3.SA':beta_mglu,
    'VIVA3.SA':beta_viva,
    'VULC3.SA':beta_vulc,
    'PETZ3.SA':beta_petz
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange',
    'dimgrey',
    'cyan',
    'gold',
    'magenta',
    'dodgerblue',
    'royalblue',
    'navy',
    'darkgreen',
    'lime'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5)  

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Varejo', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 3)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de saúde

In [None]:
# Selecionado o setor
df_saude = df_3T2025.query('(SEGMENTO == "SAUDE")')

# Retirando os tickers com menos liquidez
df_saude = df_saude[
    (df_saude['TICKER'] != 'KRSA3')   
]

# Criando uma lista dos tickers do setor de saúde
lista_saude = df_saude['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_saude_sa = list(map(lambda x: x + ".SA" , lista_saude))

# Download dos preços de fechamento de cada papel
df_saude2 = yf.download(lista_saude_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_saude_copy = df_saude2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_saude_copy - df_saude_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Saúde - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_saude = f_br.vol_anual(df_setor=df_saude2, ticker=lista_saude_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_saude.index,
    y=df_vol_anual_saude['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Saúde',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_saude2.loc['2021':'2025', lista_saude_sa] / df_saude2.loc['2021':'2025', lista_saude_sa].shift(1)).dropna()   #usar o dropna() se o gráfico ficar com "buracos" entre os anos.

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_saude = []

for _ in lst_anos:
    vol_media_saude = np.mean(f_br.vol_anual(df_setor=df_saude2, ticker=lista_saude_sa, ano=_)) * 100
    lst_vol_media_saude.append(vol_media_saude)

df_vol_media_saude = pd.DataFrame(lst_vol_media_saude, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_saude.index,
    y=df_vol_media_saude['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_vm_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_saude.index, 
        y=df_vm_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_pl_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_saude.index, 
        y=df_pl_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_saude['P/L']) == len(df_saude.loc[df_saude['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas do setor.
    pl_medio_saude = np.mean(df_saude['P/L'])
    print(f'O P/L médio do setor de saúde é de: {pl_medio_saude:.2f}.')
    print(f"O número total de empresas no setor de saúde é de {len(df_saude['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas do setor
    pl_medio_saude = np.mean(df_saude['P/L'])
    print(f'O P/L médio do setor de saúde é de: {pl_medio_saude:.2f}.')
    print(f"O número total de empresas no setor de saúde é de {len(df_saude['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_saude = np.mean(df_saude.loc[df_saude['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de saude é de: {pl_medio_saude:.2f}.')
    print(f"O número total de empresas no setor de saúde com P/L positivo é de {len(df_saude.loc[df_saude['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_saude.loc[df_saude['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativo são {list(df_saude.loc[df_saude['P/L'] < 0, 'TICKER'])}.")

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_p_vp_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_saude.index, 
        y=df_p_vp_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_saude.index, 
        y=df_ev_ebit_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_roe_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_saude.index, 
        y=df_roe_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_roic_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_saude.index, 
        y=df_roic_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_saude.index, 
        y=df_dl_ebit_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_saude = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_saude]
        for periodo, df in dict_dfs.items()
    },
    index=lista_saude
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_saude.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_saude.index, 
        y=df_dl_pl_saude[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Saúde', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de saúde
sns.heatmap(df_saude2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Saúde', fontsize=12)

# Transformando a correlação em uma métrica
saude_metrica = df_saude2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
saude_metrica = saude_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(saude_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Saúde')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_saude = df_saude2.pct_change().dropna()

# Drawdown
max_drawdown_saude = f_br.drawdown(df_returns=ret_saude)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_saude.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Saúde - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_saude).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Saúde',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_saude_anual = df_saude2.groupby(df_saude2.index.year).last().drop(df_saude2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_saude = ((df_saude_anual / df_saude_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_saude, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Saúde')
plt.show()

In [None]:
# Número de anos
num_years = len(df_saude_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
aalr_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'AALR3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'AALR3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
dasa_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'DASA3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'DASA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
flry_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'FLRY3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'FLRY3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
hapv_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'HAPV3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'HAPV3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
matd_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'MATD3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'MATD3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
odpv_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'ODPV3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'ODPV3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
onco_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'ONCO3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'ONCO3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
qual_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'QUAL3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'QUAL3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
rdor_cagr = round(f_br.cagr(start_value=df_saude_copy.loc[:, 'RDOR3.SA'].iloc[0], end_value=df_saude_copy.loc[:, 'RDOR3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'AALR3.SA':aalr_cagr,
    'DASA3.SA':dasa_cagr,
    'FLRY3.SA':flry_cagr,
    'HAPV3.SA':hapv_cagr,
    'MATD3.SA':matd_cagr,
    'ODPV3.SA':odpv_cagr,
    'ONCO3.SA':onco_cagr,
    'QUAL3.SA':qual_cagr,
    'RDOR3.SA':rdor_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Saúde',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_aalr, model_aalr = f_br.calculate_beta(index='^BVSP', stock='AALR3.SA', period='3y', interval='1wk')
beta_dasa, model_dasa = f_br.calculate_beta(index='^BVSP', stock='DASA3.SA', period='3y', interval='1wk')
beta_flry, model_flry = f_br.calculate_beta(index='^BVSP', stock='FLRY3.SA', period='3y', interval='1wk')
beta_hapv, model_hapv = f_br.calculate_beta(index='^BVSP', stock='HAPV3.SA', period='3y', interval='1wk')
beta_matd, model_matd = f_br.calculate_beta(index='^BVSP', stock='MATD3.SA', period='3y', interval='1wk')
beta_odpv, model_odpv = f_br.calculate_beta(index='^BVSP', stock='ODPV3.SA', period='3y', interval='1wk')
beta_onco, model_onco = f_br.calculate_beta(index='^BVSP', stock='ONCO3.SA', period='3y', interval='1wk')
beta_qual, model_qual = f_br.calculate_beta(index='^BVSP', stock='QUAL3.SA', period='3y', interval='1wk')
beta_rdor, model_rdor = f_br.calculate_beta(index='^BVSP', stock='RDOR3.SA', period='3y', interval='1wk')


# Juntando em um dicionário
dict_beta = {   
    'AALR3.SA':beta_aalr, 
    'DASA3.SA':beta_dasa, 
    'FLRY3.SA':beta_flry, 
    'HAPV3.SA':beta_hapv,
    'MATD3.SA':beta_matd,
    'ODPV3.SA':beta_odpv,
    'ONCO3.SA':beta_onco,
    'QUAL3.SA':beta_qual,
    'RDOR3.SA':beta_rdor
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange',
    'dimgrey',
    'cyan',
    'gold',
    'magenta',
    'dodgerblue'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Saúde', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de petróleo, gás e combustível

In [None]:
# Selecionado o setor
df_petroleo = df_3T2025.query('(SEGMENTO == "PETROLEO, GAS E BIOCOMBUSTIVEL")')

# Retirando os tickers com menos liquidez
df_petroleo = df_petroleo[
    (df_petroleo['TICKER'] != 'ENAT3') &
    (df_petroleo['TICKER'] != 'RRRP3') &
    (df_petroleo['TICKER'] != 'BRAV3') & # Retirei o ticker, porque ele possui poucos dados. É a junção da ENAT3 e RRRP3.
    (df_petroleo['TICKER'] != 'AZTE3')   # Retirei o ticker, porque ele possui poucos dados. 
]

# Criando uma lista dos tickers do setor de petróleo
lista_petroleo = df_petroleo['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_petroleo_sa = list(map(lambda x: x + ".SA" , lista_petroleo))

# Download dos preços de fechamento de cada papel
df_petroleo2 = yf.download(lista_petroleo_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_petroleo_copy = df_petroleo2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_petroleo_copy - df_petroleo_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Petróleo - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_petroleo = f_br.vol_anual(df_setor=df_petroleo2, ticker=lista_petroleo_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_petroleo.index,
    y=df_vol_anual_petroleo['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Petróleo',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_petroleo2.loc['2021':'2025', lista_petroleo_sa] / df_petroleo2.loc['2021':'2025', lista_petroleo_sa].shift(1)).dropna()   #usar o dropna() se o gráfico ficar com "buracos" entre os anos.

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

# Petroleo
volatility_petroleo = volatility[['PETR4.SA', 'PRIO3.SA', 'RECV3.SA']]

# Criando os subplots
fig = make_subplots(
    rows=2, 
    cols=1, 
    shared_xaxes=True, 
    subplot_titles=('Petroleiras', 'Todas as empresas'),
    vertical_spacing=0.08
)

# Petroleiras
for col in volatility_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=volatility_petroleo.index, 
        y=volatility_petroleo[col], 
        mode='lines', 
        name=col), 
        row=1, col=1)

# Todas as empresas
for col in volatility.columns:
    fig.add_trace(go.Scatter(
        x=volatility.index, 
        y=volatility[col], 
        mode='lines', 
        name=col), 
        row=2, col=1)

# Atualizar layout
fig.update_layout(
    height=900, 
    width=1200, 
    title_text='Evolução da Volatilidade - Setor de Petróleo', 
    template='seaborn'
)

# Mostrar gráfico
fig.show()

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_petroleo = []

for _ in lst_anos:
    vol_media_petroleo = np.mean(f_br.vol_anual(df_setor=df_petroleo2, ticker=lista_petroleo_sa, ano=_)) * 100
    lst_vol_media_petroleo.append(vol_media_petroleo)

df_vol_media_petroleo = pd.DataFrame(lst_vol_media_petroleo, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_petroleo.index,
    y=df_vol_media_petroleo['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_vm_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_petroleo.index, 
        y=df_vm_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_pl_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_petroleo.index, 
        y=df_pl_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_petroleo['P/L']) == len(df_petroleo.loc[df_petroleo['P/L'] > 0, 'P/L']):

# P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_petroleo = np.mean(df_petroleo['P/L'])
    print(f'O P/L médio do setor de petróleo é de: {pl_medio_petroleo:.2f}.')
    print(f"O número total de empresas no setor de petróleo é de {len(df_petroleo['P/L'])}.")

else:
# P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_petroleo = np.mean(df_petroleo['P/L'])
    print(f'O P/L médio do setor de petróleo é de: {pl_medio_petroleo:.2f}.')
    print(f"O número total de empresas no setor de petróleo é de {len(df_petroleo['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_petroleo = np.mean(df_petroleo.loc[df_petroleo['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de petroleo é de: {pl_medio_petroleo:.2f}.')
    print(f"O número total de empresas no setor de petróleo com P/L positivo é de {len(df_petroleo.loc[df_petroleo['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_petroleo.loc[df_petroleo['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativo são {list(df_petroleo.loc[df_petroleo['P/L'] < 0, 'TICKER'])}.")

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_p_vp_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_petroleo.index, 
        y=df_p_vp_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_petroleo.index, 
        y=df_ev_ebit_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_roe_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_petroleo.index, 
        y=df_roe_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_roic_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_petroleo.index, 
        y=df_roic_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_petroleo.index, 
        y=df_dl_ebit_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_petroleo = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_petroleo]
        for periodo, df in dict_dfs.items()
    },
    index=lista_petroleo
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_petroleo.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_petroleo.index, 
        y=df_dl_pl_petroleo[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Petróleo', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de petróleo
sns.heatmap(df_petroleo2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Petróleo', fontsize=12)

# Transformando a correlação em uma métrica
petroleo_metrica = df_petroleo2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
petroleo_metrica = petroleo_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(petroleo_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Petróleo')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_petroleo = df_petroleo2.pct_change().dropna()

# Drawdown
max_drawdown_petroleo = f_br.drawdown(df_returns=ret_petroleo)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_petroleo.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Petróleo - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_petroleo).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Petróleo',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_petroleo_anual = df_petroleo2.groupby(df_petroleo2.index.year).last().drop(df_petroleo2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_petroleo = ((df_petroleo_anual / df_petroleo_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_petroleo, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Petróleo')
plt.show()

In [None]:
# Número de anos
num_years = len(df_petroleo_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
petr_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'PETR4.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'PETR4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
prio_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'PRIO3.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'PRIO3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
recv_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'RECV3.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'RECV3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
rpmg_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'RPMG3.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'RPMG3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
vbbr_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'VBBR3.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'VBBR3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
ugpa_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'UGPA3.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'UGPA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
csan_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'CSAN3.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'CSAN3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
raiz_cagr = round(f_br.cagr(start_value=df_petroleo_copy.loc[:, 'RAIZ4.SA'].iloc[0], end_value=df_petroleo_copy.loc[:, 'RAIZ4.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'PETR4.SA':petr_cagr,
    'PRIO3.SA':prio_cagr,
    'RECV3.SA':recv_cagr,
    'RPMG3.SA':rpmg_cagr,
    'VBBR3.SA':vbbr_cagr,
    'UGPA3.SA':ugpa_cagr,
    'CSAN3.SA':csan_cagr,
    'RAIZ4.SA':raiz_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Petróleo',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_petr, model_petr = f_br.calculate_beta(index='^BVSP', stock='PETR4.SA', period='3y', interval='1wk')
beta_prio, model_prio = f_br.calculate_beta(index='^BVSP', stock='PRIO3.SA', period='3y', interval='1wk')
beta_recv, model_recv = f_br.calculate_beta(index='^BVSP', stock='RECV3.SA', period='3y', interval='1wk')
beta_rpmg, model_rpmg = f_br.calculate_beta(index='^BVSP', stock='RPMG3.SA', period='3y', interval='1wk')
beta_vbbr, model_vbbr = f_br.calculate_beta(index='^BVSP', stock='VBBR3.SA', period='3y', interval='1wk')
beta_ugpa, model_ugpa = f_br.calculate_beta(index='^BVSP', stock='UGPA3.SA', period='3y', interval='1wk')
beta_csan, model_csan = f_br.calculate_beta(index='^BVSP', stock='CSAN3.SA', period='3y', interval='1wk')
beta_raiz, model_raiz = f_br.calculate_beta(index='^BVSP', stock='RAIZ4.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'PETR4.SA':beta_petr, 
    'PRIO3.SA':beta_prio, 
    'RECV3.SA':beta_recv,
    'RPMG3.SA':beta_rpmg,
    'VBBR3.SA':beta_vbbr,
    'UGPA3.SA':beta_ugpa,
    'CSAN3.SA':beta_csan,
    'RAIZ4.SA':beta_raiz
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange',
    'dimgrey',
    'cyan',
    'gold',
    'magenta',
    'dodgerblue'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Petróleo', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de mineração

In [None]:
# Selecionado o setor
df_mineracao = df_3T2025.query('(SEGMENTO == "MINERACAO")')

# Retirando os tickers com menos liquidez
df_mineracao = df_mineracao[(df_mineracao['TICKER'] != 'BRAP3')]

# Criando uma lista dos tickers do setor de mineração
lista_mineracao = df_mineracao['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_mineracao_sa = list(map(lambda x: x + ".SA" , lista_mineracao))

# Download dos preços de fechamento de cada papel
df_mineracao2 = yf.download(lista_mineracao_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_mineracao_copy = df_mineracao2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_mineracao_copy - df_mineracao_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Mineração - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_mineracao = f_br.vol_anual(df_setor=df_mineracao2, ticker=lista_mineracao_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_mineracao.index,
    y=df_vol_anual_mineracao['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Mineração',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_mineracao2.loc['2021':'2025', lista_mineracao_sa] / df_mineracao2.loc['2021':'2025', lista_mineracao_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_mineracao = []

for _ in lst_anos:
    vol_media_mineracao = np.mean(f_br.vol_anual(df_setor=df_mineracao2, ticker=lista_mineracao_sa, ano=_)) * 100
    lst_vol_media_mineracao.append(vol_media_mineracao)

df_vol_media_mineracao = pd.DataFrame(lst_vol_media_mineracao, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_mineracao.index,
    y=df_vol_media_mineracao['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_vm_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_mineracao.index, 
        y=df_vm_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_pl_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_mineracao.index, 
        y=df_pl_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_mineracao['P/L']) == len(df_mineracao.loc[df_mineracao['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_mineracao = np.mean(df_mineracao['P/L'])
    print(f'O P/L médio do setor de mineração é de: {pl_medio_mineracao:.2f}.')
    print(f"O número total de empresas no setor de mineração é de {len(df_mineracao['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_mineracao = np.mean(df_mineracao['P/L'])
    print(f'O P/L médio do setor de mineração é de: {pl_medio_mineracao:.2f}.')
    print(f"O número total de empresas no setor de mineração é de {len(df_mineracao['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_mineracao = np.mean(df_mineracao.loc[df_mineracao['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de mineracao com P/L positivo é de: {pl_pos_medio_mineracao:.2f}.')
    print(f"O número total de empresas no setor de mineração com P/L positivo é de {len(df_mineracao.loc[df_mineracao['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_mineracao.loc[df_mineracao['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_mineracao.loc[df_mineracao['P/L'] < 0, 'TICKER'])}.") # CBAV tem P/L igual a NA.

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_p_vp_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_mineracao.index, 
        y=df_p_vp_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_mineracao.index, 
        y=df_ev_ebit_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_roe_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_mineracao.index, 
        y=df_roe_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_roic_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_mineracao.index, 
        y=df_roic_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_mineracao.index, 
        y=df_dl_ebit_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_mineracao = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_mineracao]
        for periodo, df in dict_dfs.items()
    },
    index=lista_mineracao
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_mineracao.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_mineracao.index, 
        y=df_dl_pl_mineracao[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Mineração', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de mineração
sns.heatmap(df_mineracao2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Mineração', fontsize=12)

# Transformando a correlação em uma métrica
mineracao_metrica = df_mineracao2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
mineracao_metrica = mineracao_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(mineracao_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Mineração')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor
# Calculando o retorno diário
ret_mineracao = df_mineracao2.pct_change().dropna()

# Drawdown
max_drawdown_mineracao = f_br.drawdown(df_returns=ret_mineracao)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_mineracao.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Mineração - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_mineracao).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Mineração',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_mineracao_anual = df_mineracao2.groupby(df_mineracao2.index.year).last().drop(df_mineracao2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_mineracao = ((df_mineracao_anual / df_mineracao_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_mineracao, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Mineração')
plt.show()

In [None]:
# Número de anos
num_years = len(df_mineracao_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
vale_cagr = round(f_br.cagr(start_value=df_mineracao_copy.loc[:, 'VALE3.SA'].iloc[0], end_value=df_mineracao_copy.loc[:, 'VALE3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
brpa_cagr = round(f_br.cagr(start_value=df_mineracao_copy.loc[:, 'BRAP4.SA'].iloc[0], end_value=df_mineracao_copy.loc[:, 'BRAP4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
cbav_cagr = round(f_br.cagr(start_value=df_mineracao_copy.loc[:, 'CBAV3.SA'].iloc[0], end_value=df_mineracao_copy.loc[:, 'CBAV3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
cmin_cagr = round(f_br.cagr(start_value=df_mineracao_copy.loc[:, 'CMIN3.SA'].iloc[0], end_value=df_mineracao_copy.loc[:, 'CMIN3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
aura_cagr = round(f_br.cagr(start_value=df_mineracao_copy.loc[:, 'AURA33.SA'].iloc[0], end_value=df_mineracao_copy.loc[:, 'AURA33.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'VALE3.SA':vale_cagr,
    'BRAP4.SA':brpa_cagr,
    'CBAV3.SA':cbav_cagr,
    'CMIN3.SA':cmin_cagr,
    'AURA33.SA':aura_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Mineração',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_vale, model_vale = f_br.calculate_beta(index='^BVSP', stock='VALE3.SA', period='3y', interval='1wk')
beta_brap, model_brap = f_br.calculate_beta(index='^BVSP', stock='BRAP4.SA', period='3y', interval='1wk')
beta_cbav, model_cbav = f_br.calculate_beta(index='^BVSP', stock='CBAV3.SA', period='3y', interval='1wk')
beta_cmin, model_cmin = f_br.calculate_beta(index='^BVSP', stock='CMIN3.SA', period='3y', interval='1wk')
beta_aura, model_aura = f_br.calculate_beta(index='^BVSP', stock='AURA33.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'VALE3.SA':beta_vale, 
    'BRAP4.SA':beta_brap, 
    'CBAV3.SA':beta_cbav, 
    'CMIN3.SA':beta_cmin,
    'AURA33.SA':beta_aura
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Mineração', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de celulose

In [None]:
# Selecionado o setor
df_celulose = df_3T2025.query('(SEGMENTO == "MADEIRAS E PAPEL")')

# Retirando os tickers com menos liquidez
df_celulose = df_celulose[
    (df_celulose['TICKER'] != 'MSPA3') & 
    (df_celulose['TICKER'] != 'MSPA4') & 
    (df_celulose['TICKER'] != 'KLBN3') & 
    (df_celulose['TICKER'] != 'EUCA3')
]

# Criando uma lista dos tickers do setor de celulose
lista_celulose = df_celulose['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_celulose_sa = list(map(lambda x: x + ".SA" , lista_celulose))

# Download dos preços de fechamento de cada papel
df_celulose2 = yf.download(lista_celulose_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_celulose_copy = df_celulose2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_celulose_copy - df_celulose_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Celulose - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_celulose = f_br.vol_anual(df_setor=df_celulose2, ticker=lista_celulose_sa, ano='2024').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_celulose.index,
    y=df_vol_anual_celulose['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Celulose',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_celulose2.loc['2021':'2025', lista_celulose_sa] / df_celulose2.loc['2021':'2025', lista_celulose_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_celulose = []

for _ in lst_anos:
    vol_media_celulose = np.mean(f_br.vol_anual(df_setor=df_celulose2, ticker=lista_celulose_sa, ano=_)) * 100
    lst_vol_media_celulose.append(vol_media_celulose)

df_vol_media_celulose = pd.DataFrame(lst_vol_media_celulose, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_celulose.index,
    y=df_vol_media_celulose['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_vm_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_celulose.index, 
        y=df_vm_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_pl_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_celulose.index, 
        y=df_pl_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_celulose['P/L']) == len(df_celulose.loc[df_celulose['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_celulose = np.mean(df_celulose['P/L'])
    print(f'O P/L médio do setor de celulose é de: {pl_medio_celulose:.2f}.')
    print(f"O número total de empresas no setor de celulose é de {len(df_celulose['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_celulose = np.mean(df_celulose['P/L'])
    print(f'O P/L médio do setor de celulose é de: {pl_medio_celulose:.2f}.')
    print(f"O número total de empresas no setor de celulose é de {len(df_celulose['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_celulose = np.mean(df_celulose.loc[df_celulose['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de celulose com P/L positivo é de: {pl_pos_medio_celulose:.2f}.')
    print(f"O número total de empresas no setor de celulose com P/L positivo é de {len(df_celulose.loc[df_celulose['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_celulose.loc[df_celulose['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_celulose.loc[df_celulose['P/L'] < 0, 'TICKER'])}.") 

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_p_vp_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_celulose.index, 
        y=df_p_vp_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_celulose.index, 
        y=df_ev_ebit_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_roe_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_celulose.index, 
        y=df_roe_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_roic_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_celulose.index, 
        y=df_roic_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_celulose.index, 
        y=df_dl_ebit_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_celulose = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_celulose]
        for periodo, df in dict_dfs.items()
    },
    index=lista_celulose
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_celulose.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_celulose.index, 
        y=df_dl_pl_celulose[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Celulose', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de celulose
sns.heatmap(df_celulose2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Celulose', fontsize=12)

# Transformando a correlação em uma métrica
celulose_metrica = df_celulose2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
celulose_metrica = celulose_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(celulose_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Celulose')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_celulose = df_celulose2.pct_change().dropna()

# Drawdown
max_drawdown_celulose = f_br.drawdown(df_returns=ret_celulose)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_celulose.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Celulose - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_celulose).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Celulose',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_celulose_anual = df_celulose2.groupby(df_celulose2.index.year).last().drop(df_celulose2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_celulose = ((df_celulose_anual / df_celulose_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_celulose, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Celulose')
plt.show()

In [None]:
# Número de anos
num_years = len(df_celulose_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
klbn_cagr = round(f_br.cagr(start_value=df_celulose_copy.loc[:, 'KLBN4.SA'].iloc[0], end_value=df_celulose_copy.loc[:, 'KLBN4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
suzb_cagr = round(f_br.cagr(start_value=df_celulose_copy.loc[:, 'SUZB3.SA'].iloc[0], end_value=df_celulose_copy.loc[:, 'SUZB3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
rani_cagr = round(f_br.cagr(start_value=df_celulose_copy.loc[:, 'RANI3.SA'].iloc[0], end_value=df_celulose_copy.loc[:, 'RANI3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
euca_cagr = round(f_br.cagr(start_value=df_celulose_copy.loc[:, 'EUCA4.SA'].iloc[0], end_value=df_celulose_copy.loc[:, 'EUCA4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
dxco_cagr = round(f_br.cagr(start_value=df_celulose_copy.loc[:, 'DXCO3.SA'].iloc[0], end_value=df_celulose_copy.loc[:, 'DXCO3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'KLBN4.SA':klbn_cagr,
    'SUZB3.SA':suzb_cagr,
    'RANI3.SA':rani_cagr,
    'EUCA4.SA':euca_cagr,
    'DXCO3.SA':dxco_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Celulose',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_klbn, model_klbn = f_br.calculate_beta(index='^BVSP', stock='KLBN4.SA', period='3y', interval='1wk')
beta_suzb, model_suzb = f_br.calculate_beta(index='^BVSP', stock='SUZB3.SA', period='3y', interval='1wk')
beta_rani, model_rani = f_br.calculate_beta(index='^BVSP', stock='RANI3.SA', period='3y', interval='1wk')
beta_euca, model_euca = f_br.calculate_beta(index='^BVSP', stock='EUCA4.SA', period='3y', interval='1wk')
beta_dxco, model_dxco = f_br.calculate_beta(index='^BVSP', stock='DXCO3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'KLBN4.SA':beta_klbn, 
    'SUZB3.SA':beta_suzb, 
    'RANI3.SA':beta_rani, 
    'EUCA4.SA':beta_euca,
    'DXCO3.SA':beta_dxco
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Celulose', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de aluguel de carros

In [None]:
# Selecionado o setor
df_aluguel = df_3T2025.query('(SEGMENTO == "ALUGUEL DE CARRO")')

# Criando uma lista dos tickers do setor de aluguel de carros
lista_aluguel = df_aluguel['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_aluguel_sa = list(map(lambda x: x + ".SA" , lista_aluguel))

# Download dos preços de fechamento de cada papel
df_aluguel2 = yf.download(lista_aluguel_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_aluguel_copy = df_aluguel2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_aluguel_copy - df_aluguel_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Aluguel de Carros - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_aluguel = f_br.vol_anual(df_setor=df_aluguel2, ticker=lista_aluguel_sa, ano='2024').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_aluguel.index,
    y=df_vol_anual_aluguel['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Aluguel de Carros',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_aluguel2.loc['2021':'2025', lista_aluguel_sa] / df_aluguel2.loc['2021':'2025', lista_aluguel_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_aluguel = []

for _ in lst_anos:
    vol_media_aluguel = np.mean(f_br.vol_anual(df_setor=df_aluguel2, ticker=lista_aluguel_sa, ano=_)) * 100
    lst_vol_media_aluguel.append(vol_media_aluguel)

df_vol_media_aluguel = pd.DataFrame(lst_vol_media_aluguel, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_aluguel.index,
    y=df_vol_media_aluguel['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_vm_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_aluguel.index, 
        y=df_vm_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_pl_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_aluguel.index, 
        y=df_pl_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_aluguel['P/L']) == len(df_aluguel.loc[df_aluguel['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_aluguel = np.mean(df_aluguel['P/L'])
    print(f'O P/L médio do setor de aluguel de carros é de: {pl_medio_aluguel:.2f}.')
    print(f"O número total de empresas no setor de aluguel de carros é de {len(df_aluguel['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_aluguel = np.mean(df_aluguel['P/L'])
    print(f'O P/L médio do setor de aluguel de carros é de: {pl_medio_aluguel:.2f}.')
    print(f"O número total de empresas no setor de aluguel de carros é de {len(df_aluguel['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_aluguel = np.mean(df_aluguel.loc[df_aluguel['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de aluguel de carros com P/L positivo é de: {pl_pos_medio_aluguel:.2f}.')
    print(f"O número total de empresas no setor de aluguel de carros com P/L positivo é de {len(df_aluguel.loc[df_aluguel['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_aluguel.loc[df_aluguel['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_aluguel.loc[df_aluguel['P/L'] < 0, 'TICKER'])}.") 

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_p_vp_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_aluguel.index, 
        y=df_p_vp_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_aluguel.index, 
        y=df_ev_ebit_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_roe_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_aluguel.index, 
        y=df_roe_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_roic_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_aluguel.index, 
        y=df_roic_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_aluguel.index, 
        y=df_dl_ebit_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_aluguel = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_aluguel]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_aluguel.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_aluguel.index, 
        y=df_dl_pl_aluguel[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Aluguel de Carros', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de aluguel de carros
sns.heatmap(df_aluguel2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Aluguel de Carros', fontsize=12)

# Transformando a correlação em uma métrica
aluguel_metrica = df_aluguel2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
aluguel_metrica = aluguel_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(aluguel_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Aluguel de Carros')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_aluguel = df_aluguel2.pct_change().dropna()

# Drawdown
max_drawdown_aluguel = f_br.drawdown(df_returns=ret_aluguel)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_aluguel.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Aluguel de Carros - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_aluguel).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Aluguel de Carros',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_aluguel_anual = df_aluguel2.groupby(df_aluguel2.index.year).last().drop(df_aluguel2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_aluguel = ((df_aluguel_anual / df_aluguel_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_aluguel, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Aluguel de Carros')
plt.show()

In [None]:
# Número de anos
num_years = len(df_aluguel_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
rent_cagr = round(f_br.cagr(start_value=df_aluguel_copy.loc[:, 'RENT3.SA'].iloc[0], end_value=df_aluguel_copy.loc[:, 'RENT3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
movi_cagr = round(f_br.cagr(start_value=df_aluguel_copy.loc[:, 'MOVI3.SA'].iloc[0], end_value=df_aluguel_copy.loc[:, 'MOVI3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'RENT3.SA':rent_cagr,
    'MOVI3.SA':movi_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Aluguel de Carros',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_rent, model_rent = f_br.calculate_beta(index='^BVSP', stock='RENT3.SA', period='3y', interval='1wk')
beta_movi, model_movi = f_br.calculate_beta(index='^BVSP', stock='MOVI3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'RENT3.SA':beta_rent, 
    'MOVI3.SA':beta_movi
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Aluguel de Carros', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 3)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de aluguel de máquinas e equipamentos

In [None]:
# Selecionado o setor
df_aluguel_maq_equip = df_3T2025.query('(SEGMENTO == "ALUGUEL DE MAQ. E EQUIP.")')

# Criando uma lista dos tickers do setor de aluguel de máquinas e equipamentos
lista_aluguel_maq_equip = df_aluguel_maq_equip['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_aluguel_maq_equip_sa = list(map(lambda x: x + ".SA" , lista_aluguel_maq_equip))

# Download dos preços de fechamento de cada papel
df_aluguel_maq_equip2 = yf.download(lista_aluguel_maq_equip_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_aluguel_maq_equip_copy = df_aluguel_maq_equip2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_aluguel_maq_equip_copy - df_aluguel_maq_equip_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Aluguel de Máquinas e Equipamentos - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_aluguel_maq_equip = f_br.vol_anual(df_setor=df_aluguel_maq_equip2, ticker=lista_aluguel_maq_equip_sa, ano='2024').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_aluguel_maq_equip.index,
    y=df_vol_anual_aluguel_maq_equip['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Aluguel de Máquinas e Equipamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_aluguel_maq_equip2.loc['2021':'2025', lista_aluguel_maq_equip_sa] / df_aluguel_maq_equip2.loc['2021':'2025', lista_aluguel_maq_equip_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_aluguel_maq_equip = []

for _ in lst_anos:
    vol_media_aluguel_maq_equip = np.mean(f_br.vol_anual(df_setor=df_aluguel_maq_equip2, ticker=lista_aluguel_maq_equip_sa, ano=_)) * 100
    lst_vol_media_aluguel_maq_equip.append(vol_media_aluguel_maq_equip)

df_vol_media_aluguel_maq_equip = pd.DataFrame(lst_vol_media_aluguel_maq_equip, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_aluguel_maq_equip.index,
    y=df_vol_media_aluguel_maq_equip['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_vm_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_aluguel_maq_equip.index, 
        y=df_vm_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_pl_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_aluguel_maq_equip.index, 
        y=df_pl_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_aluguel_maq_equip['P/L']) == len(df_aluguel_maq_equip.loc[df_aluguel_maq_equip['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_aluguel_maq_equip = np.mean(df_aluguel_maq_equip['P/L'])
    print(f'O P/L médio do setor de aluguel de máquinas e equipamentos é de: {pl_medio_aluguel_maq_equip:.2f}.')
    print(f"O número total de empresas no setor de aluguel de máquinas e equipamentos é de {len(df_aluguel_maq_equip['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_aluguel_maq_equip = np.mean(df_aluguel_maq_equip['P/L'])
    print(f'O P/L médio do setor de aluguel de máquinas e equipamentos é de: {pl_medio_aluguel_maq_equip:.2f}.')
    print(f"O número total de empresas no setor de aluguel de máquinas e equipamentos é de {len(df_aluguel_maq_equip['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_aluguel_maq_equip = np.mean(df_aluguel_maq_equip.loc[df_aluguel_maq_equip['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de aluguel de máquinas e equipamentos com P/L positivo é de: {pl_pos_medio_aluguel_maq_equip:.2f}.')
    print(f"O número total de empresas no setor de aluguel de máquinas e equipamentos com P/L positivo é de {len(df_aluguel_maq_equip.loc[df_aluguel_maq_equip['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_aluguel_maq_equip.loc[df_aluguel_maq_equip['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_aluguel_maq_equip.loc[df_aluguel_maq_equip['P/L'] < 0, 'TICKER'])}.") 

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_p_vp_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_aluguel_maq_equip.index, 
        y=df_p_vp_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_aluguel_maq_equip.index, 
        y=df_ev_ebit_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_roe_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_aluguel_maq_equip.index, 
        y=df_roe_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_roic_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_aluguel_maq_equip.index, 
        y=df_roic_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_aluguel_maq_equip.index, 
        y=df_dl_ebit_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_aluguel_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_aluguel_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_aluguel_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_aluguel_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_aluguel_maq_equip.index, 
        y=df_dl_pl_aluguel_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Aluguel de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de aluguel de máquinas e equipamentos
sns.heatmap(df_aluguel_maq_equip2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Aluguel de Máquinas e Equipamentos', fontsize=12)

# Transformando a correlação em uma métrica
aluguel_maq_equip_metrica = df_aluguel_maq_equip2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
aluguel_maq_equip_metrica = aluguel_maq_equip_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(aluguel_maq_equip_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Aluguel de Máquinas e Equipamentos')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_aluguel_maq_equip = df_aluguel_maq_equip2.pct_change().dropna()

# Drawdown
max_drawdown_aluguel_maq_equip = f_br.drawdown(df_returns=ret_aluguel_maq_equip)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_aluguel_maq_equip.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Aluguel de Máquinas e Equipamentos - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_aluguel_maq_equip).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Aluguel de Máquinas e Equipamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_aluguel_maq_equip_anual = df_aluguel_maq_equip2.groupby(df_aluguel_maq_equip2.index.year).last().drop(df_aluguel_maq_equip2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_aluguel_maq_equip = ((df_aluguel_maq_equip_anual / df_aluguel_maq_equip_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_aluguel_maq_equip, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Aluguel de Máquinas e Equipamentos')
plt.show()

In [None]:
# Número de anos
num_years = len(df_aluguel_maq_equip_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
arml_cagr = round(f_br.cagr(start_value=df_aluguel_maq_equip_copy.loc[:, 'ARML3.SA'].iloc[0], end_value=df_aluguel_maq_equip_copy.loc[:, 'ARML3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
mils_cagr = round(f_br.cagr(start_value=df_aluguel_maq_equip_copy.loc[:, 'MILS3.SA'].iloc[0], end_value=df_aluguel_maq_equip_copy.loc[:, 'MILS3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
vamo_cagr = round(f_br.cagr(start_value=df_aluguel_maq_equip_copy.loc[:, 'VAMO3.SA'].iloc[0], end_value=df_aluguel_maq_equip_copy.loc[:, 'VAMO3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'ARML3.SA':arml_cagr,
    'MILS3.SA':mils_cagr,
    'VAMO3.SA':vamo_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Aluguel de Máquinas e Equipamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_arml, model_arml = f_br.calculate_beta(index='^BVSP', stock='ARML3.SA', period='3y', interval='1wk')
beta_mils, model_mils = f_br.calculate_beta(index='^BVSP', stock='MILS3.SA', period='3y', interval='1wk')
beta_vamo, model_vamo = f_br.calculate_beta(index='^BVSP', stock='VAMO3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'ARML3.SA':beta_arml, 
    'MILS3.SA':beta_mils,
    'VAMO3.SA':beta_vamo
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue',
    'green'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Aluguel de Máquinas e Equipamentos', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 3)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de shoppings

In [None]:
# Selecionado o setor de shoppings
df_shoppings = df_3T2025.query('(SEGMENTO == "EXPLORAÇAO DE IMOVEIS")')

# Selecionando os tickers do setor de shopping
lista_shoppings = ['ALOS3', 'IGTI11', 'MULT3']

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_shoppings_sa = list(map(lambda x: x + ".SA" , lista_shoppings))

# Download dos preços de fechamento de cada papel
df_shoppings2 = yf.download(lista_shoppings_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_shoppings_copy = df_shoppings2.copy().dropna()

# Atualizando os tickers das empresas (ALOS3 é a fusão entre a BR Malls, Aliansce e Sonae Sierra)
for periodo, df in dict_dfs.items():
    if (df['TICKER'] == 'BRML3').any():
        df.loc[df['TICKER'] == 'BRML3', 'TICKER'] = 'ALOS3'

In [None]:
# Momentum de um ano   
momentum = df_shoppings_copy - df_shoppings_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Shoppings - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_shoppings = f_br.vol_anual(df_setor=df_shoppings2, ticker=lista_shoppings_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_shoppings.index,
    y=df_vol_anual_shoppings['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Shoppings',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_shoppings2.loc['2021':'2025', lista_shoppings_sa] / df_shoppings2.loc['2021':'2025', lista_shoppings_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_shoppings = []

for _ in lst_anos:
    vol_media_shoppings = np.mean(f_br.vol_anual(df_setor=df_shoppings2, ticker=lista_shoppings_sa, ano=_)) * 100
    lst_vol_media_shoppings.append(vol_media_shoppings)

df_vol_media_shoppings = pd.DataFrame(lst_vol_media_shoppings, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_shoppings.index,
    y=df_vol_media_shoppings['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_vm_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_shoppings.index, 
        y=df_vm_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_pl_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_shoppings.index, 
        y=df_pl_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_shoppings['P/L']) == len(df_shoppings.loc[df_shoppings['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_shoppings = np.mean(df_shoppings['P/L'])
    print(f'O P/L médio do setor de shoppings é de: {pl_medio_shoppings:.2f}.')
    print(f"O número total de empresas no setor de shoppings é de {len(df_shoppings['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_shoppings = np.mean(df_shoppings['P/L'])
    print(f'O P/L médio do setor de shoppings é de: {pl_medio_shoppings:.2f}.')
    print(f"O número total de empresas no setor de shoppings é de {len(df_shoppings['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_shoppings = np.mean(df_shoppings.loc[df_shoppings['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de shoppings com P/L positivo é de: {pl_pos_medio_shoppings:.2f}.')
    print(f"O número total de empresas no setor de shoppings com P/L positivo é de {len(df_shoppings.loc[df_shoppings['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_shoppings.loc[df_shoppings['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_shoppings.loc[df_shoppings['P/L'] < 0, 'TICKER'])}.") 
    
    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_p_vp_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_shoppings.index, 
        y=df_p_vp_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_shoppings.index, 
        y=df_ev_ebit_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_roe_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_shoppings.index, 
        y=df_roe_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_roic_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_shoppings.index, 
        y=df_roic_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_shoppings.index, 
        y=df_dl_ebit_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_shoppings = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_shoppings]
        for periodo, df in dict_dfs.items()
    },
    index=lista_shoppings
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_shoppings.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_shoppings.index, 
        y=df_dl_pl_shoppings[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Shoppings', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de aluguel de máquinas e equipamentos
sns.heatmap(df_shoppings2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Shoppings', fontsize=12)

# Transformando a correlação em uma métrica
shoppings_metrica = df_shoppings2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
shoppings_metrica = shoppings_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(shoppings_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Shoppings')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_shoppings = df_shoppings2.pct_change().dropna()

# Drawdown
max_drawdown_shoppings = f_br.drawdown(df_returns=ret_shoppings)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_shoppings.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Shoppings - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_shoppings).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Shoppings',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_shoppings_anual = df_shoppings2.groupby(df_shoppings2.index.year).last().drop(df_shoppings2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_shoppings = ((df_shoppings_anual / df_shoppings_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_shoppings, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Shoppings')
plt.show()

In [None]:
# Número de anos
num_years = len(df_shoppings_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
alos_cagr = round(f_br.cagr(start_value=df_shoppings_copy.loc[:, 'ALOS3.SA'].iloc[0], end_value=df_shoppings_copy.loc[:, 'ALOS3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
igti_cagr = round(f_br.cagr(start_value=df_shoppings_copy.loc[:, 'IGTI11.SA'].iloc[0], end_value=df_shoppings_copy.loc[:, 'IGTI11.SA'].iloc[-1], num_periods=num_years) * 100, 2)
mult_cagr = round(f_br.cagr(start_value=df_shoppings_copy.loc[:, 'MULT3.SA'].iloc[0], end_value=df_shoppings_copy.loc[:, 'MULT3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'ALOS3.SA':alos_cagr,
    'IGTI11.SA':igti_cagr,
    'MULT3.SA':mult_cagr
}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Shoppings',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_alos, model_alos = f_br.calculate_beta(index='^BVSP', stock='ALOS3.SA', period='3y', interval='1wk')
beta_igti, model_igti = f_br.calculate_beta(index='^BVSP', stock='IGTI11.SA', period='3y', interval='1wk')
beta_mult, model_mult = f_br.calculate_beta(index='^BVSP', stock='MULT3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'ALOS3.SA':beta_alos, 
    'IGTI11.SA':beta_igti,
    'MULT3.SA':beta_mult
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue',
    'green'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Shoppings', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de máquinas e equipamentos

In [None]:
# Selecionado o setor de máquinas e equipamentos
df_maq_equip = df_3T2025.query('(SEGMENTO == "MAQUINAS E EQUIPAMENTOS")')

# Selecionando os tickers do setor de máquinas e equipamentos
lista_maq_equip = ['KEPL3', 'SHUL4', 'WEGE3']

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_maq_equip_sa = list(map(lambda x: x + ".SA" , lista_maq_equip))

# Download dos preços de fechamento de cada papel
df_maq_equip2 = yf.download(lista_maq_equip_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_maq_equip_copy = df_maq_equip2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_maq_equip_copy - df_maq_equip_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Máquinas e Equipamentos - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_maq_equip = f_br.vol_anual(df_setor=df_maq_equip2, ticker=lista_maq_equip_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_maq_equip.index,
    y=df_vol_anual_maq_equip['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Máquinas e Equipamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_maq_equip2.loc['2021':'2025', lista_maq_equip_sa] / df_maq_equip2.loc['2021':'2025', lista_maq_equip_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_maq_equip = []

for _ in lst_anos:
    vol_media_maq_equip = np.mean(f_br.vol_anual(df_setor=df_maq_equip2, ticker=lista_maq_equip_sa, ano=_)) * 100
    lst_vol_media_maq_equip.append(vol_media_maq_equip)

df_vol_media_maq_equip = pd.DataFrame(lst_vol_media_maq_equip, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_maq_equip.index,
    y=df_vol_media_maq_equip['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_vm_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_maq_equip.index, 
        y=df_vm_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_pl_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_maq_equip.index, 
        y=df_pl_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_maq_equip['P/L']) == len(df_maq_equip.loc[df_maq_equip['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_maq_equip = np.mean(df_maq_equip['P/L'])
    print(f'O P/L médio do setor de máquinas  e equipamentos é de: {pl_medio_maq_equip:.2f}.')
    print(f"O número total de empresas no setor de máquinas  e equipamentos é de {len(df_maq_equip['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_maq_equip = np.mean(df_maq_equip['P/L'])
    print(f'O P/L médio do setor de máquinas  e equipamentos é de: {pl_medio_maq_equip:.2f}.')
    print(f"O número total de empresas no setor de máquinas  e equipamentos é de {len(df_maq_equip['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_shoppings = np.mean(df_maq_equip.loc[df_maq_equip['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de máquinas  e equipamentos com P/L positivo é de: {pl_pos_medio_shoppings:.2f}.')
    print(f"O número total de empresas no setor de máquinas  e equipamentos com P/L positivo é de {len(df_maq_equip.loc[df_maq_equip['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_maq_equip.loc[df_maq_equip['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_maq_equip.loc[df_maq_equip['P/L'] < 0, 'TICKER'])}.") 

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_p_vp_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_maq_equip.index, 
        y=df_p_vp_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_maq_equip.index, 
        y=df_ev_ebit_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_roe_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_maq_equip.index, 
        y=df_roe_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_roic_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_maq_equip.index, 
        y=df_roic_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_maq_equip.index, 
        y=df_dl_ebit_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_maq_equip = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_maq_equip]
        for periodo, df in dict_dfs.items()
    },
    index=lista_maq_equip
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_maq_equip.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_maq_equip.index, 
        y=df_dl_pl_maq_equip[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Máquinas e Equipamentos', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de aluguel de máquinas e equipamentos
sns.heatmap(df_maq_equip2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Máquinas e Equipamentos', fontsize=12)

# Transformando a correlação em uma métrica
maq_equip_metrica = df_maq_equip2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
maq_equip_metrica = maq_equip_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(maq_equip_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Máquinas e Equipamentos')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_maq_equip = df_maq_equip2.pct_change().dropna()

# Drawdown
max_drawdown_maq_equip = f_br.drawdown(df_returns=ret_maq_equip)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_maq_equip.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Máquinas e Equipamentos - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_maq_equip).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Máquinas e Equipamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_maq_equip_anual = df_maq_equip2.groupby(df_maq_equip2.index.year).last().drop(df_maq_equip2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_maq_equip = ((df_maq_equip_anual / df_maq_equip_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_maq_equip, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Máquinas e Equipamentos')
plt.show()

In [None]:
# Número de anos
num_years = len(df_maq_equip_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
kepl_cagr = round(f_br.cagr(start_value=df_maq_equip_copy.loc[:, 'KEPL3.SA'].iloc[0], end_value=df_maq_equip_copy.loc[:, 'KEPL3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
shul_cagr = round(f_br.cagr(start_value=df_maq_equip_copy.loc[:, 'SHUL4.SA'].iloc[0], end_value=df_maq_equip_copy.loc[:, 'SHUL4.SA'].iloc[-1], num_periods=num_years) * 100, 2)
wege_cagr = round(f_br.cagr(start_value=df_maq_equip_copy.loc[:, 'WEGE3.SA'].iloc[0], end_value=df_maq_equip_copy.loc[:, 'WEGE3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'KEPL3.SA':kepl_cagr,
    'SHUL4.SA':shul_cagr,
    'WEGE3.SA':wege_cagr

}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Máquinas e Equipamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_kepl, model_kepl = f_br.calculate_beta(index='^BVSP', stock='KEPL3.SA', period='3y', interval='1wk')
beta_shul, model_shul = f_br.calculate_beta(index='^BVSP', stock='SHUL4.SA', period='3y', interval='1wk')
beta_wege, model_wege = f_br.calculate_beta(index='^BVSP', stock='WEGE3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'KEPL3.SA':beta_kepl,
    'SHUL4.SA':beta_shul,
    'WEGE3.SA':beta_wege
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue',
    'green',
    'purple'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Máquinas e Equipamentos', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de medicamentos e outros produtos

In [None]:
# Selecionado o setor de medicamentos 
df_medicamentos = df_3T2025.query('(SEGMENTO == "MEDICAMENTOS E OUTROS PRODUTOS")')

# Criando uma lista dos tickers do setor de medicamentos 
lista_medicamentos = df_medicamentos['TICKER'].tolist()

# Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
lista_medicamentos_sa = list(map(lambda x: x + ".SA" , lista_medicamentos))

# Download dos preços de fechamento de cada papel
df_medicamentos2 = yf.download(lista_medicamentos_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# Fazendo uma cópia
df_medicamentos_copy = df_medicamentos2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_medicamentos_copy - df_medicamentos_copy.shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()
for empresa in momentum:
    fig.add_trace(go.Scatter(
        x=momentum.index,
        y=momentum[empresa],
        name=empresa
    ))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Medicamentos - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor
df_vol_anual_medicamentos = f_br.vol_anual(df_setor=df_medicamentos2, ticker=lista_medicamentos_sa, ano='2025').sort_values(by='vol_anual')

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_vol_anual_medicamentos.index,
    y=df_vol_anual_medicamentos['vol_anual'],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Medicamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_medicamentos2.loc['2021':'2025', lista_medicamentos_sa] / df_medicamentos2.loc['2021':'2025', lista_medicamentos_sa].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.columns).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_medicamento = []

for _ in lst_anos:
    vol_media_medicamento = np.mean(f_br.vol_anual(df_setor=df_medicamentos2, ticker=lista_medicamentos_sa, ano=_)) * 100
    lst_vol_media_medicamento.append(vol_media_medicamento)

df_vol_media_medicamentos = pd.DataFrame(lst_vol_media_medicamento, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_medicamentos.index,
    y=df_vol_media_medicamentos['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_vm_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_medicamentos.index, 
        y=df_vm_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_pl_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_medicamentos.index, 
        y=df_pl_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_medicamentos['P/L']) == len(df_medicamentos.loc[df_medicamentos['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_medicamento = np.mean(df_medicamentos['P/L'])
    print(f'O P/L médio do setor de medicamentos é de: {pl_medio_medicamento:.2f}.')
    print(f"O número total de empresas no setor de medicamentos é de {len(df_medicamentos['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_medicamento = np.mean(df_medicamentos['P/L'])
    print(f'O P/L médio do setor de medicamentos é de: {pl_medio_medicamento:.2f}.')
    print(f"O número total de empresas no setor de medicamentos é de {len(df_medicamentos['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_medicamento = np.mean(df_medicamentos.loc[df_medicamentos['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de medicamentos com P/L positivo é de: {pl_pos_medio_medicamento:.2f}.')
    print(f"O número total de empresas no setor de medicamentos com P/L positivo é de {len(df_medicamentos.loc[df_medicamentos['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_medicamentos.loc[df_medicamentos['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_medicamentos.loc[df_medicamentos['P/L'] < 0, 'TICKER'])}.") 

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_p_vp_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_medicamentos.index, 
        y=df_p_vp_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_medicamentos.index, 
        y=df_ev_ebit_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_roe_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_medicamentos.index, 
        y=df_roe_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_roic_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_medicamentos.index, 
        y=df_roic_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_medicamentos.index, 
        y=df_dl_ebit_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_medicamentos = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_medicamentos]
        for periodo, df in dict_dfs.items()
    },
    index=lista_medicamentos
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_medicamentos.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_medicamentos.index, 
        y=df_dl_pl_medicamentos[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Medicamentos', 
    template='seaborn'
)

fig.show()

In [None]:
fig, axs = plt.subplots(1, 2, figsize=(15, 8))

# Correlação das empresas de medicamentos
sns.heatmap(df_medicamentos2.corr(), ax=axs[0], annot=True, cmap='coolwarm')
axs[0].set_title('Matriz de Correlação das Empresas de Medicamenetos', fontsize=12)

# Transformando a correlação em uma métrica
medicamento_metrica = df_medicamentos2.corr().apply(lambda x: np.sqrt(0.5 * (1 - x)))
medicamento_metrica = medicamento_metrica.dropna()

# Utilizando a função 'cluster_corr' que reorganiza a matriz de correlação, de modo que grupos de variáveis altamente correlacionadas fiquem próximas umas das outras
sns.heatmap(f_br.cluster_corr(medicamento_metrica), ax=axs[1], annot=True, cmap='coolwarm')
axs[1].set_title('Matriz de Correlação Ajustada das Empresas de Medicamenetos')

# Ajustando o layout para evitar sobreposição
plt.tight_layout()  
plt.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_medicamento = df_medicamentos2.pct_change().dropna()

# Drawdown
max_drawdown_medicamento = f_br.drawdown(df_returns=ret_medicamento)

# Filtrando os drawdowns dos maiores p/ os menores
max_drawdown = max_drawdown_medicamento.sort_values(ascending=True) * 100

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=max_drawdown.index,
    y=max_drawdown.values
))

fig.update_layout(
    title_text='Setor de Medicamentos - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_medicamento).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

for empresa in ret_accum:
    fig.add_trace(go.Scatter(
        x=ret_accum.index,
        y=ret_accum[empresa],
        name=empresa
    ))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Medicamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_medicamento_anual = df_medicamentos2.groupby(df_medicamentos2.index.year).last().drop(df_medicamentos2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_medicamento = ((df_medicamento_anual / df_medicamento_anual.shift(1)) - 1) * 100

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_medicamento, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Medicamentos')
plt.show()

In [None]:
# Número de anos
num_years = len(df_medicamentos_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
biom_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'BIOM3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'BIOM3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
blau_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'BLAU3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'BLAU3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
dmvf_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'DMVF3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'DMVF3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
hype_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'HYPE3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'HYPE3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
ofsa_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'OFSA3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'OFSA3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
pfrm_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'PFRM3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'PFRM3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
pgmn_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'PGMN3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'PGMN3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
pnvl_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'PNVL3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'PNVL3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
radl_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'RADL3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'RADL3.SA'].iloc[-1], num_periods=num_years) * 100, 2)
vveo_cagr = round(f_br.cagr(start_value=df_medicamentos_copy.loc[:, 'VVEO3.SA'].iloc[0], end_value=df_medicamentos_copy.loc[:, 'VVEO3.SA'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'BIOM3.SA':biom_cagr,
    'BLAU3.SA':blau_cagr,
    'DMVF3.SA':dmvf_cagr,
    'HYPE3.SA':hype_cagr,
    'OFSA3.SA':ofsa_cagr,
    'PFRM3.SA':pfrm_cagr,
    'PGMN3.SA':pgmn_cagr,
    'PNVL3.SA':pnvl_cagr,
    'RADL3.SA':radl_cagr,
    'VVEO3.SA':vveo_cagr

}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Medicamentos',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_biom, model_biom = f_br.calculate_beta(index='^BVSP', stock='BIOM3.SA', period='3y', interval='1wk')
beta_blau, model_blau = f_br.calculate_beta(index='^BVSP', stock='BLAU3.SA', period='3y', interval='1wk')
beta_dmvf, model_dmvf = f_br.calculate_beta(index='^BVSP', stock='DMVF3.SA', period='3y', interval='1wk')
beta_hype, model_hype = f_br.calculate_beta(index='^BVSP', stock='HYPE3.SA', period='3y', interval='1wk')
beta_ofsa, model_ofsa = f_br.calculate_beta(index='^BVSP', stock='OFSA3.SA', period='3y', interval='1wk')
beta_pfrm, model_pfrm = f_br.calculate_beta(index='^BVSP', stock='PFRM3.SA', period='3y', interval='1wk')
beta_pgmn, model_pgmn = f_br.calculate_beta(index='^BVSP', stock='PGMN3.SA', period='3y', interval='1wk')
beta_pnvl, model_pnvl = f_br.calculate_beta(index='^BVSP', stock='PNVL3.SA', period='3y', interval='1wk')
beta_radl, model_radl = f_br.calculate_beta(index='^BVSP', stock='RADL3.SA', period='3y', interval='1wk')
beta_vveo, model_vveo = f_br.calculate_beta(index='^BVSP', stock='VVEO3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'BIOM3.SA':beta_biom, 
    'BLAU3.SA':beta_blau,
    'DMVF3.SA':beta_dmvf,
    'HYPE3.SA':beta_hype,
    'OFSA3.SA':beta_ofsa,
    'PFRM3.SA':beta_pfrm,
    'PGMN3.SA':beta_pgmn,
    'PNVL3.SA':beta_pnvl,
    'RADL3.SA':beta_radl,
    'VVEO3.SA':beta_vveo
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
    'blue', 
    'green', 
    'purple', 
    'orange',
    'dimgrey',
    'cyan',
    'gold',
    'magenta',
    'dodgerblue'
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Medicamentos', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()

### Setor de material de aeronautico

In [None]:
# O YFINANCE possui dados do novo ticker (EMBJ3) só a partir de 2025

for periodo, df in dict_dfs.items():
    if (df['TICKER'] == 'EMBR3').any():
        df.loc[df['TICKER'] == 'EMBR3', 'TICKER'] = 'EMBJ3'


# Selecionado o setor de material de aeronautico 
df_material_aeronautico = df_3T2025.query('(SEGMENTO == "MATERIAL AERONAUTICO")')

# Criando uma lista dos tickers do setor de material de aeronautico 
lista_material_aeronautico = df_material_aeronautico['TICKER'].tolist()

# # Adicionando a string ".SA" para fazer o download dos dados na biblioteca yfinance
# lista_material_aeronautico_sa = list(map(lambda x: x + ".SA" , lista_material_aeronautico))

# # Download dos preços de fechamento de cada papel
# df_material_aeronautico2 = yf.download(lista_material_aeronautico_sa, start='2020-01-01', auto_adjust=True, multi_level_index=False)['Close']

# # Fazendo uma cópia
# df_material_aeronautico_copy = df_material_aeronautico2.copy().dropna()

# Preços de fechamento - EMBJ
# Baixei os dados históricos no Investing, porque no yfinance não tem os dados completos, porque mudou de ticker (EMBR3 -> EMBJ3)
df_material_aeronautico2 = pd.read_csv('C://B3//historico-arquivos//precos-historicos//embj3_2017_2025.csv')
df_material_aeronautico2 = df_material_aeronautico2.rename(columns={'Data':'dt_refer', 'Último':'Close'})
df_material_aeronautico2 = df_material_aeronautico2[['dt_refer', 'Close']]
df_material_aeronautico2['dt_refer'] = pd.to_datetime(df_material_aeronautico2['dt_refer'], format='%d.%m.%Y')
df_material_aeronautico2['Close'] = df_material_aeronautico2['Close'].str.replace(',', '.').astype(float)
df_material_aeronautico2 = df_material_aeronautico2.set_index('dt_refer')
df_material_aeronautico2 = df_material_aeronautico2.iloc[::-1]

# Fazendo uma cópia
df_material_aeronautico_copy = df_material_aeronautico2.copy().dropna()

In [None]:
# Momentum de um ano   
momentum = df_material_aeronautico_copy['Close'] - df_material_aeronautico_copy['Close'].shift(252)

# Retirando o NaN
momentum = momentum.dropna()

# Plotando o momentum
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=momentum.index,
    y=momentum.values
))

fig.add_hline(
    y=0, 
    line=dict(color='red', width=1)
)

fig.update_layout(
    title_text='Setor de Material Aeronáutico - Momentum',
    template='seaborn',
)

fig.show()

In [None]:
# Calculando a volatilidade anualizada de cada ação do setor

# Calculando o retorno logarítmico
log_return = np.log(df_material_aeronautico2.loc['2025'] / df_material_aeronautico2.loc['2025'].shift(1))

# Calculando a volatilidade anualizada
f_br.vol_anual_material_aeronautico = np.std(log_return) * np.sqrt(252)

# Plotando a volatilidade anualizada
fig = go.Figure()

fig.add_trace(go.Bar(
    x=['EMBR3.SA'],
    y=[f_br.vol_anual_material_aeronautico],
))

fig.update_layout(
    title_text='Volatilidade Anualizada das Empresas do Setor de Material Aeronáutico',
    template='seaborn'
)

fig.show()

In [None]:
# Gráfico da evolução da volatilidade histórica ao longo do tempo

# Calculando o retorno logarítmico
log_return = np.log(df_material_aeronautico2.loc['2021':'2025', 'Close'] / df_material_aeronautico2.loc['2021':'2025', 'Close'].shift(1))

# Calculando a volatilidade média móvel de 60
volatility = log_return.rolling(window=60).std()*np.sqrt(60)

# Retirando o NaN
volatility = volatility.dropna()

px.line(data_frame=volatility, 
        x=volatility.index, 
        y=volatility.values).update_layout(title='Evolução da Volatilidade', 
                                            xaxis_title='Anos', 
                                            yaxis_title='Volatilidade', 
                                            template='seaborn')

In [None]:
# Volatilidade anualizada média
lst_anos = ['2021', '2022', '2023', '2024', '2025']
lst_vol_media_material_aeronautico = []

for _ in lst_anos:

    # Calculando o retorno logarítmico
    log_return = np.log(df_material_aeronautico2.loc[_] / df_material_aeronautico2.loc[_].shift(1))

    # Calculando a volatilidade anualizada
    f_br.vol_anual_material_aeronautico = np.mean(np.std(log_return) * np.sqrt(252)) * 100
    lst_vol_media_material_aeronautico.append(f_br.vol_anual_material_aeronautico)

df_vol_media_material_aeronautico = pd.DataFrame(lst_vol_media_material_aeronautico, index=lst_anos, columns=['vol_media_anual'])

# Plotando a volatilidade anualizada média
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=df_vol_media_material_aeronautico.index,
    y=df_vol_media_material_aeronautico['vol_media_anual']
))

fig.update_layout(
    title_text='Volatilidade Anualizada Média do Setor de Material Aeronáutico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'VALOR DE MERCADO'
df_vm_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'VALOR DE MERCADO'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_vm_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_vm_material_aeronautico.index, 
        y=df_vm_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do Valor de Mercado - Setor de Material Aeronautico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'P/L'
df_pl_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/L'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_pl_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_pl_material_aeronautico.index, 
        y=df_pl_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/L - Setor de Material Aeronautico', 
    template='seaborn'
)

fig.show()

In [None]:
# Indicador P/L
if len(df_material_aeronautico['P/L']) == len(df_material_aeronautico.loc[df_material_aeronautico['P/L'] > 0, 'P/L']):

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_medicamento = np.mean(df_material_aeronautico['P/L'])
    print(f'O P/L médio do setor de material aeronáutico é de: {pl_medio_medicamento:.2f}.')
    print(f"O número total de empresas no setor de material aeronáutico é de {len(df_material_aeronautico['P/L'])}.")

else:
    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_medio_medicamento = np.mean(df_material_aeronautico['P/L'])
    print(f'O P/L médio do setor de material aeronáutico é de: {pl_medio_medicamento:.2f}.')
    print(f"O número total de empresas no setor de material aeronáutico é de {len(df_material_aeronautico['P/L'])}.")

    print('='*50)

    # P/L médio do setor, considerando todas as empresas com P/L positivo
    pl_pos_medio_medicamento = np.mean(df_material_aeronautico.loc[df_material_aeronautico['P/L'] > 0, 'P/L'])
    print(f'O P/L médio do setor de material aeronáutico com P/L positivo é de: {pl_pos_medio_medicamento:.2f}.')
    print(f"O número total de empresas no setor de material aeronáutico com P/L positivo é de {len(df_material_aeronautico.loc[df_material_aeronautico['P/L'] > 0, 'P/L'])}.")
    print(f"As empresas que tem o P/L positivo são {list(df_material_aeronautico.loc[df_material_aeronautico['P/L'] > 0, 'TICKER'])}.")
    print(f"As empresas que tem o P/L negativos são {list(df_material_aeronautico.loc[df_material_aeronautico['P/L'] < 0, 'TICKER'])}.") 

    print('='*50)

In [None]:
# Df com o histórico do indicador 'P/VP'
df_p_vp_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'P/VP'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_p_vp_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_p_vp_material_aeronautico.index, 
        y=df_p_vp_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do P/VP - Setor de Material Aeronautico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'EV/EBIT'
df_ev_ebit_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'EV/EBIT'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_ev_ebit_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_ev_ebit_material_aeronautico.index, 
        y=df_ev_ebit_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do EV/EBIT - Setor de Material Aeronautico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROE'
df_roe_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROE'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_roe_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_roe_material_aeronautico.index, 
        y=df_roe_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROE - Setor de Material Aeronáutico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'ROIC'
df_roic_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'ROIC'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_roic_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_roic_material_aeronautico.index, 
        y=df_roic_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do ROIC - Setor de Material Aeronáutico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIVIDA LIQUIDA / EBIT'
df_dl_ebit_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIVIDA LIQUIDA / EBIT'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_dl_ebit_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_ebit_material_aeronautico.index, 
        y=df_dl_ebit_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/EBIT - Setor de Material Aeronáutico', 
    template='seaborn'
)

fig.show()

In [None]:
# Df com o histórico do indicador 'DIV. LIQ. / PATRI.'
df_dl_pl_material_aeronautico = pd.DataFrame(
    {
        periodo: [df.loc[df['TICKER'] == empresa, 'DIV. LIQ. / PATRI.'].values[0] for empresa in lista_material_aeronautico]
        for periodo, df in dict_dfs.items()
    },
    index=lista_material_aeronautico
).T

# Plot
fig = go.Figure()

for col in df_dl_pl_material_aeronautico.columns:
    fig.add_trace(go.Scatter(
        x=df_dl_pl_material_aeronautico.index, 
        y=df_dl_pl_material_aeronautico[col], 
        mode='lines+markers', 
        name=col
))

fig.update_layout(
    height=600, 
    title_text='Evolução do DL/PL - Setor de Material Aeronáutico', 
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o drawdown de cada ação do setor

# Calculando o retorno diário
ret_material_aeronautico = df_material_aeronautico2['Close'].pct_change().dropna()

# Drawdown
max_drawdown_material_aeronautico = f_br.drawdown(df_returns=ret_material_aeronautico)

# Plotando o drawndown
fig = go.Figure()

fig.add_trace(go.Bar(
    x=['EMBR3.SA'],
    y=[max_drawdown_material_aeronautico]
))

fig.update_layout(
    title_text='Setor de Material Aeronáutico - Drawdown',
    template='seaborn',
    showlegend=False   
)

fig.show()

In [None]:
# Calculando o retorno acumulado
ret_accum = (1 + ret_material_aeronautico).cumprod()

# Primeiro dia começa em 1
ret_accum.iloc[0] = 1

# Plotando o retorno acumulado
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=ret_accum.index,
    y=ret_accum.values,
))

fig.add_hline(y=1, line=dict(color='red', width=1))

fig.update_layout(
    height=700,
    width=1000,
    title_text='Retorno Acumulado das Empresas do Setor de Material Aeronáutico',
    template='seaborn'
)

fig.show()

In [None]:
# Selecionando o último preço de cada ano e retirando o ano vigente
df_material_aeronautico_anual = df_material_aeronautico2.groupby(df_material_aeronautico2.index.year).last().drop(df_material_aeronautico2.index.year.unique()[-1])

# Calculando o retorno anual
df_ret_anual_material_aeronautico = ((df_material_aeronautico_anual['Close'] / df_material_aeronautico_anual['Close'].shift(1)) - 1) * 100

# Convertendo a série em um DataFrame
df_ret_anual_material_aeronautico = df_ret_anual_material_aeronautico.to_frame() 

plt.figure(figsize=(20, 10))
sns.heatmap(df_ret_anual_material_aeronautico, annot=True, cmap='Blues', fmt=".2f", linewidths=0.8)
plt.title('Retorno Anual - Setor de Material Aeronáutico')
plt.show()

In [None]:
# Número de anos
num_years = len(df_material_aeronautico_copy.index.year.unique())

# Calculando o CAGR (Compound Annual Growth Rate)
embr_cagr = round(f_br.cagr(start_value=df_material_aeronautico_copy.loc[:, 'Close'].iloc[0], end_value=df_material_aeronautico_copy.loc[:, 'Close'].iloc[-1], num_periods=num_years) * 100, 2)

# Juntando todas os CAGR em um df
df_cagr = pd.DataFrame({
    'EMBR3.SA':embr_cagr,

}, index=[num_years])

# Transpondo o df
df_cagr = df_cagr.T
df_cagr.columns = ['cagr']

# Plotando o cagr
fig = go.Figure()

fig.add_trace(go.Bar(
    x=df_cagr.index,
    y=df_cagr['cagr'],
))

fig.update_layout(
    title_text=f'CAGR de {num_years} anos das Empresas do Setor de Material Aeronáutico',
    template='seaborn'
)

fig.show()

In [None]:
# Calculando o beta das empresas
beta_embr, model_embr = f_br.calculate_beta(index='^BVSP', stock='EMBJ3.SA', period='3y', interval='1wk')

# Juntando em um dicionário
dict_beta = {   
    'EMBJ3.SA':beta_embr, 
}

# Transformando em um DataFrame
df_beta = pd.DataFrame(list(dict_beta.items()), columns=['Empresa', 'Beta'])

# Plot dos betas das empresas em uma linha horizontal ('régua')
cores_beta = [
    'red', 
]

# Valores de 0 a 10 com passos de 0.5 da régua
valores = np.arange(0, 10, 0.5) 

# Tamanho do plot
fig, ax = plt.subplots(figsize=(15, 3))
# Adicionando um título ao gráfico
ax.set_title('Beta - Empresas do Setor de Material Aeronáutico', loc='left', fontsize=16)
# Criando uma barra horizontal que representa a régua
ax.barh(y=0, width=100, height=0.1, color='lightgrey', edgecolor='black')

# Adicionando ticks e labels
ax.set_xticks(valores)
ax.set_xticklabels(valores)
ax.set_yticks([])  # Remove y-ticks
ax.set_xlim(0, 2)
ax.set_ylim(-1, 1)

# Adicionando linhas verticais para cada valor (ticks da régua)
for valor in valores:
    ax.axvline(valor, color='black', linestyle='--', ymin=0.3, ymax=0.7)

# Removendo o eixo y
ax.spines['left'].set_color('none')
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')

# Adicionando números de beta acima e abaixo da linha horizontal
for i, (beta, empresa, cor) in enumerate(zip(df_beta['Beta'], df_beta['Empresa'], cores_beta)):
    ax.plot(beta, 0, 'o', color=cor)
    # Ajustando a posição vertical dos números de beta
    if i % 3 == 0:
        offset = 0.2
    else:
        offset = -0.35
    ax.text(beta, offset, f'{beta:.2f}', ha='center', color=cor, fontsize=12, rotation=90)  # Rótulo do beta acima ou abaixo da linha

# Criando uma legenda manualmente
handles = [Patch(facecolor=cor, edgecolor='black') for cor in cores_beta]
ax.legend(handles, df_beta['Empresa'], loc='upper left', bbox_to_anchor=(1.03, 1.1))

plt.show()