# Analisando Dados da Bolsa de Valores com Python | Canal Minerando Dados

Vamos fazer uma análise dos preços das ações da Petrobras (PETR4), esse dados foram obtidos no site do Yahooh finance. https://finance.yahoo.com/   
Nosso dataset terá dados referentes a 5 anos, de 2015 a 2020.  

Os dados podem ser obtidos com uma frequência diária, semanal ou mensal. Para o nosso exemplo utilizaremos os dados diários. 


In [54]:
# Montando o Drive
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


__A biblioteca Plotly contém diversos métodos específicos para trabalhar com dados de preços__

In [55]:
# Importando as bibliotecas
import plotly
import plotly.offline as py
import pandas as pd

É interessante habilitar os dados para uso offline do plotly.   
Do contrário será solicitado login com usuário e senha do plotly para autenticação, e não é o intuito na nossa proposta.

In [56]:
# Habilitando o modo offline para conseguir plotar os gráficos localmente
from plotly.offline import plot, iplot
plotly.offline.init_notebook_mode(connected=True)

In [57]:
# Nosso dataset terá dados da Petrobrás referentes a 5 anos, de 2015 a 2020
df = pd.read_csv('/content/drive/My Drive/Colab Notebooks/data/PETR4.SA.csv')

In [58]:
df.head(10)

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,2015-01-02,9.99,9.99,9.35,9.36,8.400567,49559500.0
1,2015-01-05,9.14,9.19,8.53,8.56,7.68257,78385100.0
2,2015-01-06,8.71,8.83,8.04,8.28,7.431271,84723300.0
3,2015-01-07,8.56,8.73,8.36,8.67,7.781296,85531000.0
4,2015-01-08,8.79,9.39,8.74,9.23,8.283895,83306300.0
5,2015-01-09,9.2,9.51,8.93,9.51,8.535192,50813100.0
6,2015-01-12,9.27,9.58,8.79,8.84,7.933868,58728900.0
7,2015-01-13,8.9,9.39,8.85,9.09,8.158246,65834800.0
8,2015-01-14,8.88,8.96,8.64,8.91,7.996694,55736500.0
9,2015-01-15,9.0,9.39,8.87,9.31,8.355694,80907800.0


Dicionário das variáveis:

    Date – dia.
    Open – O valor de abertura da ação no dia.
    High – Valor máximo que a ação chegou no dia.
    Low – O valor mínimo da ação no dia.
    Close – Preço de fechamento no dia.
    Adj Close – Preço de fechamento no dia após ser contabilizado as ações corporativas.
    Volume – Volume negociado no dia. 

In [72]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1491 entries, 0 to 1490
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   Date       1491 non-null   object 
 1   Open       1488 non-null   float64
 2   High       1488 non-null   float64
 3   Low        1488 non-null   float64
 4   Close      1488 non-null   float64
 5   Adj Close  1488 non-null   float64
 6   Volume     1488 non-null   float64
dtypes: float64(6), object(1)
memory usage: 81.7+ KB


In [71]:
df.describe()

Unnamed: 0,Open,High,Low,Close,Adj Close,Volume
count,1488.0,1488.0,1488.0,1488.0,1488.0,1488.0
mean,17.62252,17.893199,17.326001,17.597319,16.267353,57406990.0
std,7.041053,7.087367,6.985542,7.037417,6.834243,29547170.0
min,4.2,4.27,4.12,4.2,3.769486,0.0
25%,12.465,12.6975,12.22,12.385,11.149151,38351750.0
50%,16.15,16.365001,15.935,16.115001,14.535998,51606350.0
75%,23.7825,24.152499,23.212499,23.585,22.41675,68729520.0
max,30.889999,31.24,30.5,30.969999,29.804619,254813800.0


In [59]:
# Visualizando a série de dados
import plotly.io as pio
pio.renderers

# Definindo o renderizador:
pio.renderers.default = "colab"

O renderizador vai depender de qual ambiente você está trabalhando, aqui estamos trabalhando com o colab, então basta definir esse renderizador. Caso não seja definido, o gráfico não vai ser exibido.

In [60]:
# Plotando preços de fechamento da ação
import plotly.graph_objs as go

data = [go.Scatter(
    x = df.Date,
    y = df['Close'])]

py.iplot(data)

<font color='yellow'>Esse gráfico mostra o preço de fechamento ao longo do tempo, no eixo x nos temos os anos e no eixo y os preços das ações. Fica fácil observar a oscilação desses valores ao longo dos anos.</font>

## Customizando Faixas de Eixos (Range)

No exemplo acima plotamos todos os anos presentes no nosso dataset, agora vamos escolher um ano e plotar somente os dados referentes a esse ano. Faremos do ano de 2017.

In [61]:
import plotly.graph_objs as go

Close = go.Scatter(
    x = df.Date,
    y = df.Close,
    name = "PETR4 Close",
    line = dict(color = '#17BECF'),
    opacity = 0.8
)

data = [Close]

layout = dict(
    title = "Faixa de Data Customizada",
    title_x = 0.5,
    xaxis = dict(
        range = ['2017-01-01', '2017-12-31']
    )
)

fig = dict(data=data, layout=layout)
py.iplot(fig, filename = "Manually Set Range")

## Rangeslider e Rangeselector

Esses dois objetos permitem fazer uma customização e deixar os gráficos mais interativos, permite dar zoom em porções do gráfico e colocar botões. 

Conforme informado anteriormente as customizações são feitas dentro de layout.

Step é a frequência que queremos dos dados, vamos ver os dados por mês, count é a quantidade de meses que queremos visualizar, utilizaremos 1 e 6, backward quer dizer que vamos andar para trás, ou seja os últimos meses.

In [62]:
import plotly.graph_objs as go

Close = go.Scatter(
    x = df.Date,
    y = df.Close,
    name = "PETR High",
    line = dict(color = '#17BECF'),
    opacity = 0.8
)

data = [Close]

layout = dict(
    title = "Série com Rangeslider e Botões",
    title_x = 0.5,
    xaxis = dict(
        rangeselector = dict(
            buttons = list([
                            dict(count = 1,
                                 label = '1m',
                                 step = 'month',
                                 stepmode = 'backward'),
                            dict(count = 6,
                                 label = '6m',
                                 step = 'month',
                                 stepmode = 'backward'),
                            dict(step = 'all')
            ])
        ),
        rangeslider = dict(
            visible = True
        ),
        type = 'date'
    )
)

fig = dict(data=data, layout=layout)
py.iplot(fig)

Observe que com Rangeslider podemos visualizar os dados por um faixa de valor qualquer, já com os botões conseguimos visualizar os dados referentes ao último mês ou os últimos seis meses.

## Trabalhando com Candlesticks

Esse tipo de gráfico mostra o valor de abertura, fechamento, alta e baixa da ação naquele dia.

In [63]:
trace = go.Candlestick(x = df['Date'],
                       open = df['Open'],
                       high = df['High'],
                       low = df['Low'],
                       close = df['Close'])
data = [trace]
py.iplot(data, filename = 'simple_candlestick')

São gráficos no formato de velas, eles facilitam a visualização de alta e de baixa das ações.

O tamanho da vela vai depender da faixa de variação da ação, quanto maior a variação maior o corpo da vela.

Se a ação fechar com o valor menor que o preço de abertura a cor da vela será vermelha, caso contrário será verde.

É bem usado para quem trabalha com ações pelo grau de informação que esse tipo de gráfico é capaz de fornecer.

## Sem rangeslider

Para desabilitar o rangerslider basta informar no layout que o visible será igual a false.

In [64]:
trace = go.Candlestick(x = df['Date'],
                       open = df['Open'],
                       high = df['High'],
                       low = df['Low'],
                       close = df['Close'],)

layout = go.Layout(
    title = 'Preços de Candlesticks',
    title_x = 0.5,
    xaxis = dict(
        rangeslider = dict(
            visible = False
        )
    )
)

data = [trace]

fig = go.Figure(data = data, layout = layout)
py.iplot(fig)

## Customizando Candlesticks

Agora vamos refazer o gráfico anterior, mas modificando as cores das velas:

In [65]:
trace = go.Candlestick(x = df['Date'],
                       open = df['Open'],
                       high = df['High'],
                       low = df['Low'],
                       close = df['Close'],
                       increasing = dict(line = dict(color = '#17BECF')),
                       decreasing = dict(line = dict(color = '#7F7F7F'))
                       )

layout = go.Layout(
    title = 'Preços em Candlesticks',
    title_x = 0.5,
    xaxis = dict(
        rangeslider = dict(
            visible = False
        )
    )
)

data = [trace]

fig = go.Figure(data = data, layout = layout)
py.iplot(fig)

Por padrão esse tipo de gráfico tem as cores verde e vermelho como já mostramos.

## Criando um storytelling

Certos acontecimentos mexem muito com os preços das ações, dependendo do que for esses preços podem cair drasticamente ou subir na mesma proporção, principalmente se esses acontecimentos forem relacionados a política do país.

Suponha que você fará uma apresentação e queira mostrar aos diretos da empresa quais foram os períodos mais turbulentos para as ações nos últimos anos.

Você fez uma pesquisa e descobriu 3 períodos que serão importantes para a sua apresentação, mas como você pretende deixar esse gráfico mais informativo?

## Inserindo anotações

Os gráficos de candlestick permitem fazer anotações, e será assim que o seu gráfico se tornará mais informativo e apresentável.

As configurações usadas para criar o gráfico a seguir você encontra na própria documentação https://plotly.com/python/

Uma pequena observação: os valores e a localização das informações é definida por você.

In [69]:
trace = go.Candlestick(x = df['Date'],
                       open = df['Open'],
                       high = df['High'],
                       low = df['Low'],
                       close = df['Close'])

data = [trace]

layout = {
    'title': 'PETR4 Preços no Período',
    'title_x': 0.5,
    'yaxis': {'title': 'PETR4 Preço'},
    'annotations': [{
        'x': '2017-05-17',
        'y': 15,
        'xref': 'x',
        'yref': 'y',
        'showarrow': True,
        'font': dict(
            family = "Couruer New, monospace",
            size = 12
        ),
        'text': 'Audio Joesley',
        'align': "center",
        'arrowhead': 2,
        'arrowsize': 1,
        'arrowwidth': 2,
        'bordercolor': "#c7c7c7",
        'borderwidth': 2,
        'borderpad': 4
    },
    {
        'x': '2016-01-01',
        'y': 7,
        'xref': 'x',
        'yref': 'y',
        'showarrow': True,
        'font': dict(
            family = "Courrier New, monospace",
            size = 12
        ),
     'text': 'Impeachment Dilma',
     'align': "center",
     'arrowhead': 2,
     'arrowsize': 1,
     'arrowwidth': 2,
     'bordercolor': "#c7c7c7",
     'borderwidth': 2,
     'borderpad': 4
    },
    {
        'x': '2018-05-27',
        'y': 27,
        'xref': 'x',
        'yref': 'y',
        'showarrow': True,
        'font': dict(
            family = "Courier New, monospace",
            size = 12
        ),
     'text': 'Greve dos Caminhoneiros',
     'align': "center",
     'arrowhead': 2,
     'arrowsize': 1,
     'arrowwidth': 2,
     'bordercolor': "#c7c7c7",
     'borderwidth': 2,
     'borderpad': 4
    }]
}

fig = dict(data = data, layout = layout)
py.iplot(fig)

Aqui conseguimos ver claramente o comportamento das ações de acordo com cada acontecimento que foi importante na politica brasileira. 

## Trabalhando com Médias

In [70]:
# Visualizando o dataset
df.head()

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,2015-01-02,9.99,9.99,9.35,9.36,8.400567,49559500.0
1,2015-01-05,9.14,9.19,8.53,8.56,7.68257,78385100.0
2,2015-01-06,8.71,8.83,8.04,8.28,7.431271,84723300.0
3,2015-01-07,8.56,8.73,8.36,8.67,7.781296,85531000.0
4,2015-01-08,8.79,9.39,8.74,9.23,8.283895,83306300.0


## Criando as colunas com as médias

In [74]:
# Média simples de 9 dias
df['MM_9'] = df.Close.rolling(window = 9).mean()

# Média simples de 17 dias
df['MM_17'] = df.Close.rolling(window = 17).mean()

# rolling é a janela ou período observado

## Visualizando as colunas criadas

In [75]:
df.head(20)

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume,MM_9,MM_17
0,2015-01-02,9.99,9.99,9.35,9.36,8.400567,49559500.0,,
1,2015-01-05,9.14,9.19,8.53,8.56,7.68257,78385100.0,,
2,2015-01-06,8.71,8.83,8.04,8.28,7.431271,84723300.0,,
3,2015-01-07,8.56,8.73,8.36,8.67,7.781296,85531000.0,,
4,2015-01-08,8.79,9.39,8.74,9.23,8.283895,83306300.0,,
5,2015-01-09,9.2,9.51,8.93,9.51,8.535192,50813100.0,,
6,2015-01-12,9.27,9.58,8.79,8.84,7.933868,58728900.0,,
7,2015-01-13,8.9,9.39,8.85,9.09,8.158246,65834800.0,,
8,2015-01-14,8.88,8.96,8.64,8.91,7.996694,55736500.0,8.938889,
9,2015-01-15,9.0,9.39,8.87,9.31,8.355694,80907800.0,8.933333,


<font color='yellow'>__Na coluna MM_9 os primeiros nove valores são NaN, pois ele precisa dessas linhas para calcular a média, o mesmo acontece com a coluna MM_17 que terá dezessete dias NaN.__

__Vamos visualizar os preços juntamente com as suas médias.__</font>

## Plotando as médias e os preços

In [76]:
close = go.Scatter(
    x = df.Date,
    y = df.Close,
    name = "PETR4 Close",
    line = dict(color = '#330000'),
    opacity = 0.8)

MM_9 = go.Scatter(
    x = df.Date,
    y = df['MM_9'],
    name = "Média Móvel 9 Períodos",
    line = dict(color = '#B2FF66'),
    opacity = 0.8)

MM_17 = go.Scatter(
    x = df.Date,
    y = df['MM_17'],
    name = "Média Móvel 17 Períodos",
    line = dict(color = '#FF00FF'),
    opacity = 0.8)

data = [close, MM_9, MM_17]

py.iplot(data)

__Geralmente é nos cruzamentos que os traders tomam as decisões juntamente com algumas outras técnicas.__

## Adicionando uma média de 3 dias

In [77]:
# Média simples de 3 dias
df['MM_3'] = df.Close.rolling(window=3).mean()

# Média simples de 9 dias
df['MM_9'] = df.Close.rolling(window=9).mean()

# Média simples de 17 dias
df['MM_17'] = df.Close.rolling(window=17).mean()

close = go.Scatter(
    x=df.Date,
    y=df.Close,
    name = "PETR4 Close",
    line = dict(color = '#330000'),
    opacity = 0.8)

MM_3 = go.Scatter(
    x=df.Date,
    y=df['MM_3'],
    name = "Média Móvel 3 Períodos",
    line = dict(color = '#FF8000'),
    opacity = 0.8)

MM_9 = go.Scatter(
    x=df.Date,
    y=df['MM_9'],
    name = "Média Móvel 9 Períodos",
    line = dict(color = '#B2FF66'),
    opacity = 0.8)

MM_17 = go.Scatter(
    x=df.Date,
    y=df['MM_17'],
    name = "Média Móvel 17 Períodos",
    line = dict(color = '#FF00FF'),
    opacity = 0.8)

data = [close, MM_3, MM_9, MM_17]

py.iplot(data)

## Trabalhando com médias menores

In [78]:
# Cria coluna com média 3
df['MM_3'] = df.Close.rolling(window=3).mean()

# Cria coluna com média 7
df['MM_7'] = df.Close.rolling(window=7).mean()

close = go.Scatter(
    x=df.Date,
    y=df.Close,
    name = "PETR4 Close",
    line = dict(color = '#330000'),
    opacity = 0.8)

MM_3 = go.Scatter(
    x=df.Date,
    y=df['MM_3'],
    name = "Média Móvel 3 Períodos",
    line = dict(color = '#B2FF66'),
    opacity = 0.8)

MM_7 = go.Scatter(
    x=df.Date,
    y=df['MM_7'],
    name = "Média Móvel 7 Períodos",
    line = dict(color = '#CC00CC'),
    opacity = 0.8)

data = [close, MM_3, MM_7]

py.iplot(data)

## Conclusão

O objetivo foi mostrar como podemos trabalhar e visualizar dados financeiros. Fizemos várias configurações e customizações em nossos gráficos.

Existem inúmeras possibilidades ao se trabalhar com esse tipo de dado, um exemplo e plotar o gráfico de candlestick com as médias móveis e ver o seu comportamento.

Atualmente estamos passando por um período que têm influenciado bastante os preços das ações, como todos nos sabemos o mundo passa por uma pandemia. Então desafio você a fazer essas mesmas análises usando os dados mais recentes a fim de entender o quem vem acontecendo com as ações nesse período.

[Link para o vídeo no Youtube.](https://https://www.youtube.com/watch?v=UoB8w_RDXfM)

## Fim