# Bulltrend

A consultoria financeira *Bulltrend* busca visualizar as carteiras de investimento de seus clientes pensando na melhor forma de indicar bons ativos e acompanhar a evolução destes.
Você, como analista de dados dessa consultoria, decidiu combinar duas potentes ferramentas de Data Science, Python e Power Bi, para auxiliar o time de consultores a acompanhar de perto a carteira de ativos dos clientes.
Aqui vamos trazer duas importantes correntes para análise de ativos: a análise fundamentalista e a análise gráfica.
Por meio da coleta dos dados com as bibliotecas Python e carga no Power BI, será possível avaliar a carteira da pessoa cliente e acompanhar os indicadores fundamentalistas que avaliam a situação financeira das empresas listadas na bolsa e as flutuações das cotações no período estipulado:

#### *Base de dados*

Vamos importar duas bases de dados em que:

* A nase de dados com as cotações será gerada dentro do periodo de 01/08/2022 à 01/08/2023, por meio da biblioteca *yfinance* que lê os dados das cotações de todoso os ativos listadas na bolsa do Brasil e do Mundo por meio do site Yahoo Finance.
* A base de dados com os indicadores será gerado, por meio da biblioteca *fundamentus* que lê os dados dos indicadores fundamentalstas de todos os ativos listadas na bolsa do Brasil por meio do site da fundamentus.

#### *Desafio*

Você como analista de dados do time de dados da Finvestment tem o desafio de extrair os dados fundamentalistas e de cotações dos ativos de uma carteira hipotética por meio das bibliotecas Python e carregá-los dentro do Power BI a fim de construir um dashboard com os dados compilados e disponíveis para a análise da pessoa consultora.

### Importando as bibliotecas e trazendo os dados de cotação

In [20]:
import pandas as pd
import numpy as np

import yfinance as yf
import fundamentus

2024-08-28 20:33:10,803 [logging.log_init] INFO: LOGLEVEL=INFO


In [4]:
# Definindo a carteira de ações
carteira_yf = ['ABEV3.SA', 'B3SA3.SA', 'ELET3.SA', 'GGBR4.SA', 'ITSA4.SA',
                'PETR4.SA', 'RENT3.SA', 'SUZB3.SA', 'VALE3.SA', 'WEGE3.SA']

In [5]:
# Carregando os dados da carteira
df = yf.download(carteira_yf, start='2022-08-01', end='2023-08-01')

[*********************100%***********************]  10 of 10 completed


In [6]:
#Visualizando
df.head(3)

Price,Adj Close,Adj Close,Adj Close,Adj Close,Adj Close,Adj Close,Adj Close,Adj Close,Adj Close,Adj Close,...,Volume,Volume,Volume,Volume,Volume,Volume,Volume,Volume,Volume,Volume
Ticker,ABEV3.SA,B3SA3.SA,ELET3.SA,GGBR4.SA,ITSA4.SA,PETR4.SA,RENT3.SA,SUZB3.SA,VALE3.SA,WEGE3.SA,...,ABEV3.SA,B3SA3.SA,ELET3.SA,GGBR4.SA,ITSA4.SA,PETR4.SA,RENT3.SA,SUZB3.SA,VALE3.SA,WEGE3.SA
Date,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2
2022-08-01 00:00:00+00:00,13.207384,10.113264,45.70425,15.495656,6.317715,17.478104,53.86264,44.766506,56.024532,26.946508,...,34565900,26237600,12239200,16655058,24571002,81365100,6769429,7127600,38874000,8202200
2022-08-02 00:00:00+00:00,13.279604,10.048139,46.05809,15.973555,6.376897,17.555946,54.117069,45.134293,57.810268,27.429768,...,12515800,29130100,7477600,16078734,15000327,69147100,4870629,4379000,32636900,7214800
2022-08-03 00:00:00+00:00,13.207384,10.383076,46.205521,15.325445,6.428681,17.566324,55.80381,44.634476,55.56369,27.17848,...,19576600,29172900,8281500,30645468,24131173,65544500,4927295,4451900,31934600,6627100


In [8]:
#Passando os ativos para o multindex do df
cotacoes = df.stack(level=1)
cotacoes

  cotacoes = df.stack(level=1)


Unnamed: 0_level_0,Price,Adj Close,Close,High,Low,Open,Volume
Date,Ticker,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2022-08-01 00:00:00+00:00,ABEV3.SA,13.207384,14.630000,14.890000,14.430000,14.860000,34565900
2022-08-01 00:00:00+00:00,B3SA3.SA,10.113264,10.870000,11.120000,10.710000,11.020000,26237600
2022-08-01 00:00:00+00:00,ELET3.SA,45.704250,46.500000,46.889999,45.660000,45.799999,12239200
2022-08-01 00:00:00+00:00,GGBR4.SA,15.495656,18.785713,19.547619,18.650793,19.547619,16655058
2022-08-01 00:00:00+00:00,ITSA4.SA,6.317715,7.362799,7.483501,7.285205,7.457636,24571002
...,...,...,...,...,...,...,...
2023-07-31 00:00:00+00:00,PETR4.SA,25.403507,31.110001,31.150000,30.299999,30.299999,91290800
2023-07-31 00:00:00+00:00,RENT3.SA,65.090393,67.067726,67.506729,66.289497,66.888138,5980447
2023-07-31 00:00:00+00:00,SUZB3.SA,46.971523,48.070000,48.610001,47.340000,47.389999,4602700
2023-07-31 00:00:00+00:00,VALE3.SA,61.386002,69.160004,69.680000,67.839996,68.000000,26065700


In [15]:
# Resetando o index e renomeando a coluna dos ativos
cotacoes = cotacoes.reset_index().rename(columns={"Ticker": "Ativos"})

In [16]:
# Organizando as colunas
cotacoes = cotacoes[['Date','Open','High','Low','Close','Ativos']]

# Visualizando
cotacoes.head(5)

Price,Date,Open,High,Low,Close,Ativos
0,2022-08-01 00:00:00+00:00,14.86,14.89,14.43,14.63,ABEV3.SA
1,2022-08-01 00:00:00+00:00,11.02,11.12,10.71,10.87,B3SA3.SA
2,2022-08-01 00:00:00+00:00,45.799999,46.889999,45.66,46.5,ELET3.SA
3,2022-08-01 00:00:00+00:00,19.547619,19.547619,18.650793,18.785713,GGBR4.SA
4,2022-08-01 00:00:00+00:00,7.457636,7.483501,7.285205,7.362799,ITSA4.SA


In [19]:
# Visualizando as informações dos dados
cotacoes.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2500 entries, 0 to 2499
Data columns (total 6 columns):
 #   Column  Non-Null Count  Dtype              
---  ------  --------------  -----              
 0   Date    2500 non-null   datetime64[ns, UTC]
 1   Open    2500 non-null   float64            
 2   High    2500 non-null   float64            
 3   Low     2500 non-null   float64            
 4   Close   2500 non-null   float64            
 5   Ativos  2500 non-null   object             
dtypes: datetime64[ns, UTC](1), float64(4), object(1)
memory usage: 117.3+ KB


In [21]:
# Lendo um papel específico
weg = fundamentus.get_papel("WEGE3")
weg

2024-08-28 20:36:51,585 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')


Unnamed: 0,Papel,Tipo,Empresa,Setor,Subsetor,Cotacao,Data_ult_cot,Min_52_sem,Max_52_sem,Vol_med_2m,...,Ativo_Circulante,Div_Bruta,Div_Liquida,Patrim_Liq,Receita_Liquida_12m,EBIT_12m,Lucro_Liquido_12m,Receita_Liquida_3m,EBIT_3m,Lucro_Liquido_3m
WEGE3,WEGE3,ON N1,WEG SA ON N1,Máquinas e Equipamentos,"Motores, Compressores e Outros",54.0,2024-08-28,30.96,54.2,339924000,...,25019400000,4180980000,-3049790000,19299600000,33943900000,7609910000,5826240000,9274430000,2115140000,1441660000


In [22]:
# Definindo a carteira de ações
carteira_fund = ["ABEV3", "B3SA3", "ELET3", "GGBR4", "ITSA4",
                 "PETR4", "RENT3", "SUZB3", "VALE3", "WEGE3"]

In [24]:
# Criando um df com algumas infos da carteira
ind = pd.concat([fundamentus.get_papel(papel)[['Setor', 'Cotacao', 'Min_52_sem', 'Max_52_sem', 'Valor_de_mercado', 
                                               'Nro_Acoes', 'Patrim_Liq','Receita_Liquida_12m','Receita_Liquida_3m', 
                                               'Lucro_Liquido_12m', 'Lucro_Liquido_3m']] for papel in carteira_fund])
ind.head(3)

2024-08-28 20:39:25,282 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')
2024-08-28 20:39:25,341 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')
2024-08-28 20:39:26,101 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')
2024-08-28 20:39:26,825 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')
2024-08-28 20:39:27,567 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')
2024-08-28 20:39:28,311 [detalhes.get_papel] INFO: detalhes: call: get..._papel()
  tables_html = pd.read_html(content.text, decimal=",", thousands='.')
2024-08-28 20:39:29,039 [detalhes.get_papel] INFO: detalhes: call: get..._papel()


Unnamed: 0,Setor,Cotacao,Min_52_sem,Max_52_sem,Valor_de_mercado,Nro_Acoes,Patrim_Liq,Receita_Liquida_12m,Receita_Liquida_3m,Lucro_Liquido_12m,Lucro_Liquido_3m
ABEV3,Bebidas,12.95,11.09,14.08,204062000000,15757700000,95262800000,80627500000,20044200000,14396000000,2396310000
B3SA3,Serviços Financeiros Diversos,12.7,10.0,14.5,70440600000,5546500000,19117100000,10177200000,2727240000,4183420000,1244050000
ELET3,Energia Elétrica,42.04,33.41,43.99,96990500000,2307100000,114094000000,35817100000,8395280000,4444280000,1740300000


In [25]:
# Retornando as informações
ind.info()

<class 'pandas.core.frame.DataFrame'>
Index: 10 entries, ABEV3 to WEGE3
Data columns (total 11 columns):
 #   Column               Non-Null Count  Dtype 
---  ------               --------------  ----- 
 0   Setor                10 non-null     object
 1   Cotacao              10 non-null     object
 2   Min_52_sem           10 non-null     object
 3   Max_52_sem           10 non-null     object
 4   Valor_de_mercado     10 non-null     int64 
 5   Nro_Acoes            10 non-null     object
 6   Patrim_Liq           10 non-null     object
 7   Receita_Liquida_12m  10 non-null     object
 8   Receita_Liquida_3m   10 non-null     object
 9   Lucro_Liquido_12m    10 non-null     object
 10  Lucro_Liquido_3m     10 non-null     object
dtypes: int64(1), object(10)
memory usage: 960.0+ bytes


In [26]:
# Passando o ticker para uma coluna
ind = ind.reset_index()
ind.rename(columns={"index":"Ativo"}, inplace=True)

In [27]:
# Alterando colunas object para numeric
colunas = ['Cotacao', 'Min_52_sem', 'Max_52_sem', 'Valor_de_mercado', 'Nro_Acoes', 'Patrim_Liq',
           'Receita_Liquida_12m', 'Receita_Liquida_3m', 'Lucro_Liquido_12m', 'Lucro_Liquido_3m']
ind[colunas] = ind[colunas].apply(pd.to_numeric, errors='coerce', axis=1)
ind.head()

Unnamed: 0,Ativo,Setor,Cotacao,Min_52_sem,Max_52_sem,Valor_de_mercado,Nro_Acoes,Patrim_Liq,Receita_Liquida_12m,Receita_Liquida_3m,Lucro_Liquido_12m,Lucro_Liquido_3m
0,ABEV3,Bebidas,12.95,11.09,14.08,204062000000.0,15757700000.0,95262800000.0,80627500000.0,20044200000.0,14396000000.0,2396310000.0
1,B3SA3,Serviços Financeiros Diversos,12.7,10.0,14.5,70440600000.0,5546500000.0,19117100000.0,10177200000.0,2727240000.0,4183420000.0,1244050000.0
2,ELET3,Energia Elétrica,42.04,33.41,43.99,96990500000.0,2307100000.0,114094000000.0,35817100000.0,8395280000.0,4444280000.0,1740300000.0
3,GGBR4,Siderurgia e Metalurgia,18.06,16.7,20.86,38079100000.0,2108480000.0,55130300000.0,64604900000.0,16615800000.0,5062630000.0,859110000.0
4,ITSA4,Intermediários Financeiros,11.15,7.79,11.15,115159000000.0,10328100000.0,83551000000.0,7648000000.0,1995000000.0,14312000000.0,3762000000.0
