<a href="https://colab.research.google.com/github/Nikakz/ciencia-de-dados/blob/master/Analisando_Dados_da_Bolsa_de_Valores_com_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
#Montando o drive
from google.colab import drive
drive.mount('/content/drive')


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [14]:
#maneira de verificar o diretório certo para o drive
import os
os.chdir("/content/drive/")
!ls


MyDrive  Othercomputers


In [None]:
#importando as bibliotecas
#Utilizaremos a biblioteca plotly para fazer a visualização dos nossos dados, essa biblioteca tem métodos específicos para trabalhar com dados do mercado financeiro.
import plotly
import plotly.offline as py
import pandas as pd

In [None]:
#Precisamos habilitar o modo offline para conseguir plotar os gráficos localmente.
from plotly.offline import plot, iplot
plotly.offline.init_notebook_mode(connected=True)

In [15]:
#Lendo a base de dados
#Nosso dataset terá dados referentes a 5 anos, de 2015 a 2020.
#Os dados podem ser obtidos com uma frequência diária, semanal ou mensal. Para o nosso exemplo utilizaremos os dados diários.
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Acoes/PETR4.SA.csv')

In [16]:
#Visualizando as primeiras linhas do dataset
df.head()

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,2016-12-08,15.97,16.0,15.52,15.7,11.838258,41104800
1,2016-12-09,15.88,15.9,15.52,15.58,11.747774,37161200
2,2016-12-12,15.79,15.95,15.48,15.6,11.762856,35436700
3,2016-12-13,15.55,15.69,15.38,15.45,11.649752,33455000
4,2016-12-14,15.43,15.47,14.74,14.74,11.11439,44215700


In [17]:
#Se você estiver usando o google colab, você vai precisar fazer uma pequena configuração para que os gráficos sejam exibidos.
import plotly.io as pio
pio.renderers

Renderers configuration
-----------------------
    Default renderer: 'plotly_mimetype+notebook_connected'
    Available renderers:
        ['plotly_mimetype', 'jupyterlab', 'nteract', 'vscode',
         'notebook', 'notebook_connected', 'kaggle', 'azure', 'colab',
         'cocalc', 'databricks', 'json', 'png', 'jpeg', 'jpg', 'svg',
         'pdf', 'browser', 'firefox', 'chrome', 'chromium', 'iframe',
         'iframe_connected', 'sphinx_gallery']

In [18]:
##O renderizador vai depender de qual ambiente você está trabalhando, aqui estamos trabalhando com o colab, então basta definir esse renderizador.
pio.renderers.default = "colab"

In [19]:
#Plotando preços de fechamento da ação
#Esse gráfico mostra o preço de fechamento ao longo do tempo, no eixo x nos temos os anos e no eixo y os preços das ações. Fica fácil observar a oscilação desses valores ao longo dos anos.
import plotly.graph_objs as go
data = [go.Scatter(
x=df.Date,
y=df['Close'])]

py.iplot(data)

In [20]:
#Customizando Faixas de Eixos (Range)
#No exemplo acima plotamos todos os anos presentes no nosso dataset, agora vamos escolher
#um ano e plotar somente os dados referentes a esse ano.
#Para isso basta definir um range com a data de início e fim, conforme definimos dentro do layout (onde customizamos os gráficos).
#Definimos que os dados plotados seriam referentes ao ano de 2017, além disso agora o gráfico possui um título.
import plotly.graph_objs as go

Close = go.Scatter(
x=df.Date,
y=df.Close,
name = "PETR4 Close",
line = dict(color = '#17BECF'),
opacity = 0.8)

data = [Close]

layout = dict(
title = "Faixa de Data Customizada",
title_x= 0.5,
xaxis = dict(
range = ['2017-01-01','2017-12-31'])
)

fig = dict(data=data, layout=layout)
py.iplot(fig, filename = "Manually Set Range")

In [21]:
#Rangeslider e Rangeselector
#Esses dois objetos permitem fazer uma customização e deixar os gráficos mais interativos,
#permite dar zoom em porções do gráfico e colocar botões.
#Conforme informado anteriormente as customizações são feitas dentro de layout.
#Step é a frequência que queremos dos dados, vamos ver os dados por mês, count é a
#quantidade de meses que queremos visualizar, utilizaremos 1 e 6, backward quer dizer que
#vamos andar para trás, ou seja os últimos meses.
import plotly.graph_objs as go

Close = go.Scatter(
x=df.Date,
y=df.Close,
name = "PETR4 High",
line = dict(color = '#17BECF'),
opacity = 0.8)

data = [Close]

layout = dict(
title="Série com Rangeslider e Botoes",
title_x=0.5,
xaxis=dict(
rangeselector=dict(
buttons=list([
dict(count=1,
label='1m',
step='month',
stepmode='backward'),
dict(count=6,
label='6m',
step='month',
stepmode='backward'),
dict(step='all')
])
),
rangeslider=dict(
visible = True
),
type='date'
)
)

fig = dict(data=data, layout=layout)
py.iplot(fig)
#Observe que com Rangeslider podemos visualizar os dados por um faixa de valor qualquer, já com os botões conseguimos visualizar os dados referentes ao último mês ou os últimos seis meses.

In [23]:
#Trabalhando com Candlesticks
#Esse tipo de gráfico mostra o valor de abertura, fechamento, alta e baixa da ação naquele dia.
trace = go.Candlestick(x=df['Date'],
open=df['Open'],
high=df['High'],
low=df['Low'],
close=df['Close'])
data = [trace]
py.iplot(data, filename='simple_candlestick')

In [24]:
#Sem rangerslider
#Para desabilitar o rangerslider basta informar no layout que o visible será igual a false.
trace = go.Candlestick(x=df['Date'],
open=df['Open'],
high=df['High'],
low=df['Low'],
close=df['Close'])

layout = go.Layout(
title ='Preços em Candlesticks',
title_x = 0.5,
xaxis = dict(
rangeslider = dict(
visible = False
)
)
)

data = [trace]

fig = go.Figure(data=data,layout=layout)
py.iplot(fig)

In [25]:
#Customizando candlesticks
#Aqui temos o mesmo gráfico do exemplo acima, mas queremos mudar as cores das velas, o
#código a seguir mostra como fazer isso.
trace = go.Candlestick(x=df['Date'],
open=df['Open'],
high=df['High'],
low=df['Low'],
close=df['Close'],
increasing=dict(line=dict(color= '#17BECF')),
decreasing=dict(line=dict(color= '#7F7F7F'))
)

layout = go.Layout(
title ='Preços em Candlesticks',
title_x = 0.5,
xaxis = dict(
rangeslider = dict(
visible = False
)
)
)

data = [trace]

fig = go.Figure(data=data,layout=layout)
py.iplot(fig)

In [26]:
#Criando um storytelling
#Certos acontecimentos mexem muito com os preços das ações, dependendo do que for esses preços podem cair drasticamente ou subir na mesma proporção, principalmente se esses acontecimentos forem relacionados a política do país.
#Suponha que você fará uma apresentação e queira mostrar aos diretos da empresa quais foram os períodos mais turbulentos para as ações nos últimos anos.
#Você fez uma pesquisa e descobriu 3 períodos que serão importantes para a sua apresentação, mas como você pretende deixar esse gráfico mais informativo?
#Inserindo anotações
#Os gráficos de candlestick permitem fazer anotações, e será assim que o seu gráfico se tornará mais informativo e apresentável.
#As configurações usadas para criar o gráfico a seguir você encontra na própria documentação https://plotly.com/python/
#Uma pequena observação: os valores e a localização das informações é definida por você.
#Uma pequena observação: os valores e a localização das informações é definida por você.
trace = go.Candlestick(x=df['Date'],
open=df['Open'],
high=df['High'],
low=df['Low'],
close=df['Close'])
data = [trace]

layout = {
'title': 'PETR4 Preços no Periodo',
'title_x': 0.5,
'yaxis': {'title': 'PETR4 Preço'},
'annotations': [{
'x': '2017-05-17', 
'y': 15, 
'xref': 'x', 
'yref': 'y',
'showarrow': True,
'font':dict(
family="Courier New, monospace",
size=12
),
'text': 'Audio Joesley',
'align':"center",
'arrowhead':2,
'arrowsize':1,
'arrowwidth':2,
'bordercolor':"#c7c7c7",
'borderwidth':2,
'borderpad':4
},
{
'x': '2016-01-01', 
'y': 7, 
'xref': 'x', 
'yref': 'y',
'showarrow': True,
'font':dict(
family="Courier New, monospace",
size=12
),
'text': 'Impeachment Dilma',
'align':"center",
'arrowhead':2,
'arrowsize':1,
'arrowwidth':2,
'bordercolor':"#c7c7c7",
'borderwidth':2,
'borderpad':4
},
{
'x': '2018-05-27', 
'y': 27, 
'xref': 'x', 
'yref': 'y',
'showarrow': True,
'font':dict(
family="Courier New, monospace",
size=12
),
'text': 'Greve dos Caminhoneiros',
'align':"center",
'arrowhead':2,
'arrowsize':1,
'arrowwidth':2,
'bordercolor':"#c7c7c7",
'borderwidth':2,
'borderpad':4
}]
}
fig = dict(data=data, layout=layout)
py.iplot(fig)
#Aqui conseguimos ver claramente o comportamento das ações de acordo com cada acontecimento que foi importante na politica brasileira.
#Percebeu como essa configuração faz toda a diferença e enriquece uma apresentação.

In [27]:
#Trabalhando com Médias
#Esse tipo de atividade faz parte da rotina de quem trabalha como trader (profissional responsável por negociar ativos financeiros).
#Visualizando o dataset
df.head()

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,2016-12-08,15.97,16.0,15.52,15.7,11.838258,41104800
1,2016-12-09,15.88,15.9,15.52,15.58,11.747774,37161200
2,2016-12-12,15.79,15.95,15.48,15.6,11.762856,35436700
3,2016-12-13,15.55,15.69,15.38,15.45,11.649752,33455000
4,2016-12-14,15.43,15.47,14.74,14.74,11.11439,44215700


In [28]:
#Criando as colunas com as médias
#rolling é a janela ou período observado.
# Média simples de 9 dias
df['MM_9'] = df.Close.rolling(window=9).mean()

# Média simples de 17 dias
df['MM_17'] = df.Close.rolling(window=17).mean()

In [29]:
#Visualizando as colunas criadas
df.head(20)
#Na coluna MM_9 os primeiros nove valores são NaN, pois ele precisa dessas linhas para calcular a média, 
#o mesmo acontece com a coluna MM_17 que terá dezessete dias NaN.


Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume,MM_9,MM_17
0,2016-12-08,15.97,16.0,15.52,15.7,11.838258,41104800,,
1,2016-12-09,15.88,15.9,15.52,15.58,11.747774,37161200,,
2,2016-12-12,15.79,15.95,15.48,15.6,11.762856,35436700,,
3,2016-12-13,15.55,15.69,15.38,15.45,11.649752,33455000,,
4,2016-12-14,15.43,15.47,14.74,14.74,11.11439,44215700,,
5,2016-12-15,14.78,14.91,14.33,14.85,11.197331,43338800,,
6,2016-12-16,14.9,15.14,14.76,14.76,11.129471,37876200,,
7,2016-12-19,14.88,14.89,14.35,14.36,10.827858,39128600,,
8,2016-12-20,14.46,14.59,14.1,14.35,10.820317,31810000,15.043333,
9,2016-12-21,14.45,14.48,14.04,14.34,10.812779,32856800,14.892222,


In [30]:
#Vamos visualizar os preços juntamente com as suas médias.
#Plota as médias e os preços
close = go.Scatter(
x=df.Date,
y=df.Close,
name = "PETR4 Close",
line = dict(color = '#330000'),
opacity = 0.8)

MM_9 = go.Scatter(
x=df.Date,
y=df['MM_9'],
name = "Média Móvel 9 Períodos",
line = dict(color = '#B2FF66'),
opacity = 0.8)

MM_17 = go.Scatter(
x=df.Date,
y=df['MM_17'],
name = "Média Móvel 17 Períodos",
line = dict(color = '#FF00FF'),
opacity = 0.8)

data = [close, MM_9, MM_17]

py.iplot(data)
#Geralmente é nos cruzamentos que os traders tomam as decisões juntamente com algumas outras técnicas.

In [31]:
#Adicionando uma média de 3 dias
# Média simples de 3 dias
df['MM_3'] = df.Close.rolling(window=3).mean()

# Média simples de 9 dias
df['MM_9'] = df.Close.rolling(window=9).mean()

# Média simples de 17 dias
df['MM_17'] = df.Close.rolling(window=17).mean()

close = go.Scatter(
x=df.Date,
y=df.Close,
name = "PETR4 Close",
line = dict(color = '#330000'),
opacity = 0.8)

MM_3 = go.Scatter(
x=df.Date,
y=df['MM_3'],
name = "Média Móvel 3 Períodos",
line = dict(color = '#FF8000'),
opacity = 0.8)

MM_9 = go.Scatter(
x=df.Date,
y=df['MM_9'],
name = "Média Móvel 9 Períodos",
line = dict(color = '#B2FF66'),
opacity = 0.8)

MM_17 = go.Scatter(
x=df.Date,
y=df['MM_17'],
name = "Média Móvel 17 Períodos",
line = dict(color = '#FF00FF'),
opacity = 0.8)

data = [close, MM_3, MM_9, MM_17]

py.iplot(data)

In [32]:
#Trabalhando com médias menores
# Cria coluna com média 3
df['MM_3'] = df.Close.rolling(window=3).mean()

# Cria coluna com média 7
df['MM_7'] = df.Close.rolling(window=7).mean()

close = go.Scatter(
x=df.Date,
y=df.Close,
name = "PETR4 Close",
line = dict(color = '#330000'),
opacity = 0.8)

MM_3 = go.Scatter(
x=df.Date,
y=df['MM_3'],
name = "Média Móvel 3 Períodos",
line = dict(color = '#B2FF66'),
opacity = 0.8)

MM_7 = go.Scatter(
x=df.Date,
y=df['MM_7'],
name = "Média Móvel 7 Períodos",
line = dict(color = '#CC00CC'),
opacity = 0.8)

data = [close, MM_3, MM_7]

py.iplot(data)