In [3]:
#Bibliotecas necessárias
import pandas as pd
import math
from pandas_datareader import data, wb
import numpy as np
import datetime
import seaborn as sns
import matplotlib.pyplot as plt
import mplfinance as mpf
sns.set_style('white')
sns.despine(top=True, right=True)

<Figure size 432x288 with 0 Axes>

<h1>Análise exploratoria de dados</h1>

In [None]:
inicio = datetime.datetime(2020, 1, 1)
fim = datetime.datetime(2020, 12, 1)
tickers = ['BANCO DO BRASIL', 'PETROBRÁS', 'GOL', 'JBS', 'MAGAZINE LUIZA', 'COGNA EDUCAÇÃO']
BANCO_DO_BRASIL = data.DataReader('BBAS3.SA', "yahoo", inicio, fim)
PETROBRAS = data.DataReader('PETR4.SA', 'yahoo', inicio, fim)
GOL = data.DataReader('GOLL4.SA', 'yahoo', inicio, fim)
JBS = data.DataReader('JBSS3.SA', 'yahoo', inicio, fim)
MAGAZINE_LUIZA = data.DataReader('MGLU3.SA', 'yahoo', inicio, fim)
COGNA_EDUCACAO = data.DataReader('COGN3.SA','yahoo', inicio, fim)

ativos = pd.concat([BANCO_DO_BRASIL, PETROBRAS, GOL, JBS, MAGAZINE_LUIZA, COGNA_EDUCACAO], axis=1, keys=tickers)
ativos.columns.names = ['Nome_ativo','Acontecimento']
ativos.head()

<h2>1. Análise dos preços de cada ativo financeiro</h2>

<p>Os preços numa economia de mercado estão sempre num movimento de sobe e desce, obedecendo a lei da oferta e demanda. No mercado financeiro isso não é diferente, o preço dos ativos estão sempre subindo e descendo, obedecendo a lei fundamental do mercado.</p>

In [None]:
for i in tickers:
  ativos[i]['Close'].plot(figsize=(10,6),legend=True, label=i)
  ax = plt.title('Preço dos ativos financeiros em 2020', fontsize=20,)
  sns.despine()
  plt.xlabel('')
  plt.xticks(rotation=360)
  sns.set_style('white')
ax.figure.set_size_inches(16, 10)

<p>Podemos observar que os preços caíram na mesma época do ano. O que será que aconteceu no início de março? Se formos lembrar, foi a época em que iniciaram os isolamentos sociais, os comércios fecharam, os números de mortes já começava a preocupar, e o mercado começou a tombar. As expectativas sobre a economia não eram muito boas no mundo inteiro, então ações começaram a se desvalorizar devido essa incerteza gerada pelo início da crise sanitária. Até aquele ponto, a sociedade e o mercado possuíam poucas informações sobre o que aconteceria nos próximos meses. A resposta do mercado foi no sentido das expectativas: para baixo!

Estatísticas descritivas dos fechamentos</p>

In [None]:
print(f'Fechamento mínimo: {ativos.xs(key="Close", axis=1, level="Acontecimento").min()}\n\nFechamento máximo: {ativos.xs(key="Close", axis=1, level="Acontecimento").max()}\n\nFechamendo médio:  {ativos.xs(key="Close", axis=1, level="Acontecimento").mean()}\n\nDesvio padrão:  {ativos.xs(key="Close", axis=1, level="Acontecimento").std()}')


<h2>Volatilidade</h2>

<p>A volatilidade é uma variável que representa a frequência e intensidade oscilações no preço de um ativo num determinado período de tempo. Quanto maior a volatilidade, maior a variação do preço do ativo ativo. Mas a volatilidade vai além disso. Ela mostra se relaciona também com o próprio mercado. Os índices do mercado financeiro podem ser influenciados por uma série de fatores externos, como o cenário político, o otimismo e pessimismo dos investidores, ou uma pandemia.

Veremos agora, a volatilidade dos ativos financeiros que estamos analisando</p>

In [None]:
volatilidade = pd.DataFrame()
for tick in tickers:
  volatilidade[tick + '(volatilidade)'] = ativos[tick]['Close'].pct_change()
volatilidade.head()

In [None]:
for i in volatilidade.columns:
  plt.figure()
  volatilidade[i].plot(figsize=(10,5))
  plt.title(f'Volatilidade do retorno do ativo {str(i).strip("(volatilidade)")}')
  sns.despine(bottom=True)
  plt.xticks(fontsize=8, rotation=360)
  plt.xlabel('')

<p>Como podemos observar, entre março e maio, as variações do preço do ativo foram muito mais intensas, e isso é representado pelas oscilações nos gráficos. O que explica essa oscilação nessa intensidade? A explicação mais plausível é que esse foi o período onde começaram os isolamentos sociais, e as quarentenas. Seguido do fechamento de comércios e muitos postos de trabalho

Descobrir o que aconteceu no dia da alta e baixa dos ativos</p>

In [None]:
print(f'Dias de baixa volatilidade:\n\n{volatilidade.idxmin()}\n\n\nDias de alta volatilidade\n\n{volatilidade.idxmax()}')

<p>Observa-se que o dia com menor volatilidade for 16/03 e o dia com maior volatilidade foi 13/03. Foi justamente na época onde começamos a apertar o isolamento social, por volta do meado de março. O leitor ainda pode pesquisar no Google sobre notícias que aconteceram nesse dia.</p>

<h2>Médias móveis<h2>

In [None]:
for i in ativos.columns.levels[0]:
  ativos_2020_close = ativos[f'{i}']['Close'][ativos[f'{i}'].index.year == 2020]
  ativos_2020_open = ativos[f'{i}']['Open'][ativos[f'{i}'].index.year == 2020]
  ativos_2020_high = ativos[f'{i}']['High'][ativos[f'{i}'].index.year == 2020]
  ativos_2020_low = ativos[f'{i}']['Low'][ativos[f'{i}'].index.year == 2020]
  ativos_2020_volume = ativos[f'{i}']['Volume'][ativos[f'{i}'].index.year == 2020]

  media = ativos_2020_close.rolling(30).mean()
  std = ativos_2020_close.rolling(30).std()

  plt.figure(figsize=(10,4))
  ativos_2020_close.plot(label='Fechamento')
  media.plot(label='Média móvel')
  plt.fill_between(ativos_2020_close.index, media - 2 * std, media + 2 * std, color='b', alpha=0.09)#Dois desvios padroes da média
  plt.legend()
  sns.despine()
  plt.xlabel('')
  plt.xticks(rotation=360)
  plt.title(f'Média móvel do {f"{i}"}')

<p>As oscilações maiores (em laranja) nos mostram os ciclos que se passaram no mercado durante esse ano, sendo no período de março a maior queda. De fato, a doença, o isolamento social (que foi necessário para conter o avanço da pandemia), as incertezas sobre o ano, as notícias sobre mortes e casos avançando cada vez mais, e todo o caos influenciaram as expectativas no mercado financeiro. Podemos observar aqui, que a Magazine Luiza conseguiu decolar em meio a uma crise mundial. Quando analisarmos as correlações, ela terá correlação muito baixa/negativa com os demais ativos.</p>

<h2>Correlação entre a volatilidade</h2>

In [None]:
volatilidade.corr()

<p>Temos a maior correlação da volatilidade sendo entre BANCO DO BRASIL e PETROBRÁS, com 75,08% de correlação

Ainda conseguimos visualizar, de forma que a informação seja assimilada com mais facilidade. Faremos um mapa de calor para a correlação entre a volatilidade dos ativos financeiros.</p>

In [None]:
mask = np.zeros_like(volatilidade.corr())
mask[np.triu_indices_from(mask)] = True
ax = sns.heatmap(volatilidade.corr(), annot=True, cmap='Blues', vmin=0.5, linewidths=1, fmt='.3g', mask=mask);
ax.figure.set_size_inches(16, 10)

<p>Com um gráfico de dispersão podemos observar as mesmas informações de maneira diferente, nos dando mais uma percepção sobre a mesma informação.

Uma maneira simples e eficiente de fazer isso é usando o pairplot do seaborn.</p>

In [None]:
sns.pairplot(volatilidade);

<h2>Correlações</h2>

<p>O quão correlacionadas estão essas volatilidades? Elas se acompanham? Positivamente ou negativamente?

Os ativos no mercado costumam se comportar de maneira similar em casos de crise ou de boom. Isso porque a economia vai perdendo ou ganhando como um todo, o que por sua vez reflete o resultado no mercado financeiro.

Um guia para interpretar correlações:

Utilizaremos a correlação de Pearson nessa análise, ela se encaixa melhor com o objetivo do projeto.</p>
<ul>
<li>1.0 positivo ou negativo indica uma correlação perfeita
<li>0.9 positivo ou negativo indica uma correlação muito forte.
<li>:0.7 a 0.9 positivo ou negativo indica uma correlação forte.
<li>0.5 a 0.7 positivo ou negativo indica uma correlação moderada.
<li>0.3 a 0.5 positivo ou negativo indica uma correlação fraca.
<li>0.1 a 0.3 positivo ou negativo indica uma correlação desprezível.
<li>0 indica uma correlação inexistente
</ul>    

<h2>Correlação entre os preços</h2>

In [None]:
preço_ativos = pd.DataFrame()
for i in tickers:
  preço_ativos[i + '(preço)'] = ativos[i]['Close']
preço_ativos.corr()

In [None]:
mask = np.zeros_like(preço_ativos.corr())
mask[np.triu_indices_from(mask)] = True
ax = sns.heatmap(preço_ativos.corr(), annot=True, cmap='Blues', fmt='.3g', linewidths=1, mask = mask)
ax.figure.set_size_inches(16, 10)

<h4>Podemos observar aqui, uma correlação muito alta entre:</h4>
<ul>
    <li>BANCO DO BRASIL e COGNA EDUCAÇÃO (0.932)
    <li>BANCO DO BRASIL e GOL (0.945)
    <li>PETROBRÁS e GOL (0.942);
</ul>
    
<h4>Alta entre:</h4>
<ul>
    <li>BANCO DO BRASIL e PETROBRÁS (0.887)
    <li>BANCO DO BRASIL e JBS (0.777)
    <li>PETROBRÁS e COGNA EDUCAÇÃO (0.82)
    <li>PETROBRÁS e JBS (0.792)
    <li>GOL e JBS (0.814)
    <li>GOL e COGNA EDUCAÇÃO (0.867)
    <li>JBS e COGNA EDUCAÇÃO (0.762)
</ul>
    
<h4>Desprezível/inexistente entre:</h4>
<ul>
    <li>MAGAZINE LUIZA e BANCO DO BRASIL (-0,193)
    <li>MAGAZINE LUIZA e PETROBRÁS (0,154)
    <li>MAGAZINE LUIZA e JBS (0,028)
    <li>MAGAZINE LUIZA e GOL (-0,174)
    <li>MAGAZINE LUIZA e COGNA EDUCAÇÃO (-0,268)
</ul>    

In [None]:
sns.pairplot(preço_ativos);
