# 5. Análises do mercado financeiro

## 5.1. Que análises são essas?

Agora que já entendemos os aspectos principais dos dados de mercado financeiro, e já conseguimos utilizar diversas bibliotecas para obter dados de mercado financeiro, chegou a hora de fazer algumas análises básicas.

Utilizando ferramentas de dados e de visualização, conseguimos explorar os dados para obter insights. Com isso, vamos mostrar alguns exemplos da aplicação do Python no mercado financeiro.

Realizando uma análise exploratória dos dados, vamos calcular métricas importantes no mercado financeiro, como retorno, volatilidade, drawdown, distribuições, skewness, dentre outras.


## 5.2. Obtenção dos dados

Utilizando a biblioteca yfinance, vamos obter os dados de negociação para algum papel, como por exemplo PETR4

In [None]:
import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Você pode obter outros ativos que quiser, como ações, FIIs, ETFs, BDRs, etc.

In [None]:
petro = yf.download("PETR4.SA", start="2017-01-01", end="2022-02-10")

In [None]:
petro.Close.plot();

## 5.3. Médias móveis

### 5.3.1. O que são médias móveis?

Porque elas são tão importantes no mercado financeiro?

Algumas métricas com as quais podemos criar médias móveis: preço, retorno, volatilidade, drawdown


### 5.3.2. Médias móveis do preço

In [None]:
petro.Close.head(10)

In [None]:
petro.Close.rolling(5).mean()

In [None]:
petro.Close.plot()

In [None]:
petro.Close.rolling(5).mean().plot()

In [None]:
petro.Close.rolling(10).mean().plot()

In [None]:
petro.Close.rolling(50).mean().plot()

In [None]:
petro.Close.rolling(100).mean().plot()

## 5.4. Retornos diários

In [None]:
petro.head()

Calculando os retornos diários

In [None]:
petro['Adj Close'].pct_change()

In [None]:
retornos = pd.DataFrame(petro['Adj Close'].pct_change())
retornos

Gráfico dos retornos diários

In [None]:
retornos.plot()

Retorno diário médio

In [None]:
retornos.mean()

Média móvel dos retornos

In [None]:
retornos.rolling(50).mean().plot()

## 5.5. Volatilidade

A medida mais básica de volatilidade que podemos ter é o desvio padrão

Calculando o desvio padrão dos retornos diários

In [None]:
retornos.std()

Portanto, essa é a volatilidade de PETR4 no período

E se quiséssemos visualizar a volatilidade em janelas de tempo, isto é, o comportamento da volatilidade de PETR4 ao longo de períodos específicos de tempo, por exemplo, 10 dias?

In [None]:
janelas_vol = retornos.rolling(10).std()

In [None]:
janelas_vol.plot()

## 5.6. Métricas estatísticas

In [None]:
retornos.describe()

## 5.7. Distribuição dos retornos

Forma de entender onde os retornos se "concentram" com o tempo

In [None]:
retornos.plot.hist(bins = 100);

## 5.8. Drawdown em janela de 30 dias

Perda máxima em um determinado período - distância entre ganho máximo e a mínima

In [None]:
dd_30 = retornos.rolling(30).min()

In [None]:
dd_30.plot();

## 5.9. Métricas de retorno acumulado

In [None]:
# Calculando o retorno acumulado
ret_acum = (retornos + 1).cumprod()
ret_acum

In [None]:
ret_acum.plot(figsize = (12,6))

In [None]:
# Vamos calcular agora o cumulativo máximo, ou seja, os picos atingidos ao longo do tempo
picos = ret_acum.cummax()
picos

In [None]:
picos.plot(figsize = (12,6))

#### Drawdown

Forma alternativa de cálculo do drawdown, considerando a diferença entre o retorno acumulado e os picos.

In [None]:
drawdown = (ret_acum - picos)/picos
drawdown.plot()

Qual o drawdown máximo? É justamente o valor mais 'fundo' que o gráfico acima atinge

In [None]:
max_ddw = drawdown.min()

In [None]:
max_ddw*100

In [None]:
retornos['Retorno Acumulado'] = ret_acum
retornos['Picos'] = picos
retornos['Drawdowns'] = drawdown

In [None]:
retornos.head()

In [None]:
retornos[['Retorno Acumulado', 'Picos']].plot(figsize = (12,6))

## 5.10. Normalização

Para explicar o conceito de normalização, vamos obter dados de vários papéis ao mesmo tempo para ficar mais fácil de exemplificar

In [None]:
acoes = ['PETR4.SA', 'WEGE3.SA', 'MGLU3.SA', 'LREN3.SA', 'VALE3.SA', 'BPAC11.SA','OIBR3.SA']

In [None]:
data = yf.download(acoes, start="2019-01-01", end="2022-05-15")['Adj Close']

In [None]:
data.head()

In [None]:
data.plot(figsize = (12,6))

Observe que é 'injusto' realizar uma comparação de um papel numa magnitude mais alta com outros que possuem o preço menor.

In [None]:
data.plot(figsize = (8,8))
plt.title('Ativos sem normalização', fontsize = 15)
plt.xlabel('Data')
plt.ylabel('Preço')
plt.show()

Introduzindo conceito da normalização

In [None]:
data.head()

In [None]:
normalizado = data/data.iloc[0]

In [None]:
normalizado.head()

In [None]:
normalizado.plot(figsize = (8,8))
plt.title('Ativos normalizados a 1', fontsize = 15)
plt.xlabel('Data')
plt.ylabel('Preço')
plt.show()

## 5.1. Plot de cotação com volume

Vamos extrair dados para um ativo só

In [None]:
lren = yf.download('LREN3.SA', start = '2017-01-01', end = '2022-05-15')

In [None]:
lren.head()

In [None]:
lren.Close.plot()

In [None]:
fig = plt.figure(figsize = (15,8))
gs = fig.add_gridspec(nrows = 6, ncols =1)
ax1 = fig.add_subplot(gs[0:5, 0])
ax2 = fig.add_subplot(gs[5, 0])

ax1.plot(lren.Close)
ax2.bar(lren.index, lren.Volume)
ax1.set_title('Fechamento | Volume | Cotação de LREN3')

**Exercício**

Crie uma função que recebe um papel determinado pelo usuário (sem .SA) e cria um plot de cotação e volume, com dimensões e datas (início e fim) também especificadas pelo usuário.

In [None]:
papel = 'PETR4'

In [None]:
f'{papel}'

In [None]:
tamanho = (15,8)

In [None]:
def plota_cotacao_volume(papel, tamanho, inicio, fim):
    dados = yf.download(papel + '.SA', start = inicio, end = fim)
    fig = plt.figure(figsize = tamanho)
    gs = fig.add_gridspec(nrows = 6, ncols =1)
    ax1 = fig.add_subplot(gs[0:5, 0])
    ax2 = fig.add_subplot(gs[5, 0])

    ax1.plot(dados.Close)
    ax2.bar(dados.index, dados.Volume)
    # O título do gráfico precisa ser adaptável ao papel determinado pelos usuários
    ax1.set_title(f'Fechamento | Volume | Cotação de {papel}')

In [None]:
plota_cotacao_volume('GOAU4', tamanho, '2020-01-01', '2022-05-15')

# 6. Estudo de caso: matriz de correlação

## 6.1. Importando dados de FIIs, ETFs e BDRs

In [None]:
ativos = ['KNRI11.SA', 'ONEF11.SA', 'HCTR11.SA', 'HGLG11.SA', 
          'HGBS11.SA', 'SMAL11.SA', 'IVVB11.SA', 'AAPL34.SA']

In [None]:
inicio = '2017-01-01'

In [None]:
precos_ativos = pd.DataFrame()

for i in ativos:
    precos_ativos[i] = yf.download(i, start = inicio)['Adj Close']

In [None]:
precos_ativos.head()

## 6.2. Importando dados de índices, commodities e criptomoedas

### 6.2.1. Índices

In [None]:
import investpy

In [None]:
search_results = investpy.search_quotes(text = 'bvsp', products = ['indices'],
                      countries = ['brazil'], n_results = 10)

In [None]:
for search_result in search_results[:1]:
    print(search_result)

In [None]:
ibov = search_result.retrieve_historical_data(from_date = '01/01/2017', to_date = '15/05/2022')

In [None]:
ibov.head()

In [None]:
search_results = investpy.search_quotes(text = 'spx', products = ['indices'],
                      countries = ['united states'], n_results = 10)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
sp500 = search_result.retrieve_historical_data(from_date = '01/01/2017', to_date = '15/05/2022')

In [None]:
sp500.head()

In [None]:
ibov.rename(columns = {'Close': 'IBOV'}, inplace = True)

In [None]:
ibov.head()

In [None]:
sp500.rename(columns = {'Close': 'S&P500'}, inplace = True)

In [None]:
sp500.head()

In [None]:
indices = pd.merge(ibov, sp500, how = 'inner', on = 'Date')

In [None]:
indices = indices[['IBOV', 'S&P500']]

In [None]:
indices

### 6.2.2. Commodities

In [None]:
# Café
search_results = investpy.search_quotes(text = 'coffe', products = ['commodities'],
                      countries = ['brazil'], n_results = 10)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
cafe = search_result.retrieve_historical_data(from_date = '01/01/2017', to_date = '15/05/2022')

In [None]:
cafe.head()

In [None]:
cafe.Close.plot()

In [None]:
cafe.rename(columns = {'Close': 'cafe'}, inplace = True)

In [None]:
cafe.head()

In [None]:
# Soja
search_results = investpy.search_quotes(text = 'soy', products = ['commodities'],
                      countries = ['brazil'], n_results = 10)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
soja = search_result.retrieve_historical_data(from_date = '01/01/2017', to_date = '15/05/2022')

In [None]:
soja.Close.plot()

In [None]:
soja.rename(columns = {'Close': 'soja'}, inplace = True)

In [None]:
# Etanol
search_results = investpy.search_quotes(text = 'ethanol', products = ['commodities'],
                      countries = ['brazil'], n_results = 10)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
etanol = search_result.retrieve_historical_data(from_date = '01/01/2017', to_date = '15/05/2022')

In [None]:
etanol.Close.plot()

In [None]:
etanol.rename(columns = {'Close': 'etanol'}, inplace = True)

In [None]:
interm = pd.merge(cafe, soja, how = 'inner', on = 'Date')
commodities = pd.merge(interm, etanol, how = 'inner', on = 'Date')

In [None]:
commodities.head()

In [None]:
from functools import reduce

In [None]:
lista_dfs = [cafe, soja, etanol]

In [None]:
commodities = reduce(lambda left, right: pd.merge(left, right, how = 'inner', on = 'Date'), lista_dfs)

In [None]:
commodities.head()

In [None]:
commodities = commodities[['cafe','soja','etanol']]

In [None]:
commodities.head()

### Criptomoedas

In [None]:
bitcoin = investpy.get_crypto_historical_data(crypto = 'bitcoin', 
                                              from_date = '01/01/2017', to_date = '15/05/2022')

In [None]:
bitcoin.rename(columns = {'Close': 'bitcoin'}, inplace = True)

In [None]:
ethereum = investpy.get_crypto_historical_data(crypto = 'ethereum', 
                                              from_date = '01/01/2017', to_date = '15/05/2022')

ethereum.rename(columns = {'Close': 'ethereum'}, inplace = True)

In [None]:
cripto = pd.merge(bitcoin, ethereum, how = 'inner', on = 'Date')

In [None]:
cripto = cripto[['bitcoin', 'ethereum']]

In [None]:
cripto.head()

## 6.3. Dados do dólar

In [None]:
dolar = yf.download('USDBRL=X', start = inicio)

In [None]:
dolar.head()

In [None]:
dolar.Close.plot()

In [None]:
dolar = pd.DataFrame(dolar.Close).rename(columns = {'Close': 'Dolar'})

In [None]:
dolar.head()

## 6.4. Dados de ações

In [None]:
data.head()

## 6.5. Juntando tudo num dataframe só

In [None]:
# Dados de ações
data.index = pd.to_datetime(data.index)
# Dados de FIIs, ETFs e BDRs
precos_ativos.index = pd.to_datetime(precos_ativos.index)
# Dados de índices
indices.index = pd.to_datetime(indices.index)
# Dados de commodities
commodities.index = pd.to_datetime(commodities.index)
# Dados de criptomoedas
cripto.index = pd.to_datetime(cripto.index)
# Cotação do dólar
dolar.index = pd.to_datetime(dolar.index)

In [None]:
dfs = [data, precos_ativos, indices, commodities, cripto, dolar]

In [None]:
df_final = reduce(lambda left, right: pd.merge(left, right, how = 'inner', on = 'Date'), dfs)

In [None]:
df_final.head()

In [None]:
retornos = df_final.pct_change()

In [None]:
retornos.head()

In [None]:
retornos = retornos.dropna()

In [None]:
retornos.head()

## 6.6. Matriz de Correlação

In [None]:
import seaborn as sns

In [None]:
import matplotlib.pyplot as plt

In [None]:
df_final.corr()

In [None]:
sns.heatmap(df_final.corr())

In [None]:
plt.figure(figsize = (16,8))

sns.heatmap(df_final.corr(),
           vmin = -1, vmax = 1, annot = True, cmap = 'BrBG')

# 7. Estudo de caso: comparação de carteira com o IBOV

Simplificação: vamos simular um único aporte feito no primeiro dia

## 7.1. Importando dados

In [None]:
ativos = ['PETR4','VALE3', 'ABEV3', 'WEGE3', 'EMBR3', 'RADL3', 'CVCB3', 'CIEL3', 'OIBR3', 'KNRI11']

In [None]:
ativos = [i + '.SA' for i in ativos]

In [None]:
inicio = '2020-01-01'
fim = '2022-05-15'

In [None]:
df = yf.download(ativos, start = inicio, end = fim)['Adj Close']

In [None]:
df.head()

## 7.2. Normalização dos ativos

In [None]:
normalizado = df/df.iloc[0]

In [None]:
normalizado.plot(figsize = (8,7))

## 7.3. Métricas básicas de carteira

Preços no dia do aporte

In [None]:
primeiro = df.iloc[0]

In [None]:
primeiro

Se investimos R$ 1000 em cada papel, quantos papéis precisamos comprar de cada?

In [None]:
comprados = 1000/primeiro

In [None]:
comprados

In [None]:
# Número de papéis arredondados
round(comprados, 0)

In [None]:
comprados = round(comprados, 0)

In [None]:
comprados

## 7.4. Construção da carteira e da comparação com o IBOV

Como saber qual era o valor que tínhamos em cada papel, por dia? Basta multiplicar o número de papéis que compramos com os preços diários

In [None]:
PL = df*comprados

In [None]:
PL.head()

In [None]:
PL.tail()

In [None]:
# Criando uma nova coluna que vai demonstrar o valor total da nossa carteira, por dia
PL['PL Total'] = PL.sum(axis = 1)

In [None]:
PL.head()

In [None]:
PL.tail()

Vamos obter agora os dados do IBOV para compará-lo com nossa carteira

In [None]:
ibov = yf.download('^BVSP', start = inicio, end = fim)

In [None]:
ibov.head()

In [None]:
ibov.rename(columns = {'Close':'Ibov'}, inplace = True)

In [None]:
ibov = ibov[['Ibov']]

In [None]:
ibov

Agora vamos juntar os dados das tabelas do IBOV e da nossa carteira

In [None]:
novo_df = pd.merge(ibov, PL, how = 'inner', on = 'Date')

In [None]:
novo_df.head()

In [None]:
novo_df.plot()

Vamos normalizar tudo para colocá-los na mesma base, ou seja, todos começam com 100

In [None]:
novo_normalizado = (novo_df/novo_df.iloc[0])*100

In [None]:
novo_normalizado

In [None]:
novo_normalizado.plot()

In [None]:
novo_normalizado.tail()

In [None]:
novo_normalizado[['Ibov','PL Total']].plot(figsize = (8,6))

E se o usuário conseguisse determinar quanto ele investiria em cada ativo?

In [None]:
ativos

In [None]:
alocacoes = {'PETR4.SA':2000,
 'VALE3.SA':2000,
 'ABEV3.SA':1000,
 'WEGE3.SA':1000,
 'EMBR3.SA':500,
 'RADL3.SA':500,
 'CVCB3.SA':500,
 'CIEL3.SA':500,
 'OIBR3.SA':500,
 'KNRI11.SA':1500}

In [None]:
alocacoes

In [None]:
alocacoes.keys()

In [None]:
alocacoes_df = pd.Series(data = alocacoes, index = list(alocacoes.keys()))

In [None]:
alocacoes.values()

In [None]:
sum(alocacoes.values())

Obtendo preços dos ativos no primeiro dia do investimento

In [None]:
primeiro = df.iloc[0]

In [None]:
primeiro

Quantidade de papéis comprados de cada ativo (determinados no primeiro dia)

In [None]:
compras = alocacoes_df/primeiro

In [None]:
compras = round(compras, 0)

In [None]:
compras

Criando um dataframe que contém a posição diária de cada ativo

In [None]:
PL02 = df*compras

In [None]:
PL02.head()

In [None]:
PL02['PL Total'] = PL02.sum(axis = 1)

In [None]:
novo_df02 = pd.merge(ibov, PL02, how = 'inner', on = 'Date')

In [None]:
novo_df02.head()

In [None]:
novo_normalizado_02 = (novo_df02/novo_df02.iloc[0])*100

In [None]:
novo_normalizado_02.head()

In [None]:
novo_normalizado_02.tail()

In [None]:
novo_normalizado_02.plot()

In [None]:
novo_normalizado_02[['Ibov','PL Total']].plot(figsize = (8,6))

**Exercício**

Crie uma função que recebe um dicionário de alocações definido pelo usuário, e compara essa carteira com o Ibov. As datas de início e fim também devem ser definidas pelo usuário.

In [None]:
alocacoes = {'PETR4.SA':2000,
 'VALE3.SA':2000,
 'ABEV3.SA':1000}

In [None]:
ativos = ['PETR4.SA', 'VALE3.SA', 'ABEV3.SA']

In [None]:
def compara_carteiras(ativos, dicionario, inicio, fim):
    df = yf.download(ativos, start = inicio, end = fim)['Adj Close']
    alocacoes_df = pd.Series(data = dicionario, index = list(dicionario.keys()))
    primeiro = df.iloc[0]
    compras = alocacoes_df/primeiro
    compras = round(compras, 0)
    PL00 = df*compras
    PL00['PL Total'] = PL00.sum(axis = 1)
    ibov = yf.download('^BVSP', start = inicio, end = fim)
    ibov.rename(columns = {'Close':'Ibov'}, inplace = True)
    novo_df00 = pd.merge(ibov, PL00, how = 'inner', on = 'Date')
    novo_normalizado_00 = (novo_df00/novo_df00.iloc[0])*100
    novo_normalizado_00[['Ibov','PL Total']].plot(figsize = (8,6))

In [None]:
inicio

In [None]:
fim

In [None]:
compara_carteiras(ativos, alocacoes, inicio, fim)

In [None]:
lista_ativos = ['PETR4.SA', 'MGLU3.SA', 'WEGE3.SA']

carteira = {'PETR4.SA':2000,
 'MGLU3.SA':3000,
 'WEGE3.SA':13000}

In [None]:
compara_carteiras(lista_ativos, carteira, inicio, fim)