In [256]:
# import pacotes
import pandas as pd
import plotly
import plotly.offline as py
from plotly.offline import plot, iplot
import plotly.graph_objs as go
import yfinance as yf
plotly.offline.init_notebook_mode(connected=True)

In [257]:
# download dos dados no intervalo de 10 anos do site yahoo finance 
data = yf.download("PETR4.SA", start="2012-07-31", end="2022-07-31")
data.head()

[*********************100%***********************]  1 of 1 completed


Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2012-07-31,20.309999,20.309999,19.43,19.5,9.036306,38115700
2012-08-01,19.5,19.92,19.1,19.82,9.184594,27655700
2012-08-02,19.549999,20.040001,19.41,19.6,9.082647,25195600
2012-08-03,19.98,20.27,19.860001,19.940001,9.240203,30632200
2012-08-06,19.02,20.26,18.83,19.92,9.230934,55497300


##### Dicionário das variáveis:
    * Date – dia.
    * Open – O valor de abertura da ação no dia.
    * High – Valor máximo que a ação chegou no dia.
    * Low – O valor mínimo da ação no dia.
    * Close – Preço de fechamento no dia.
    * Adj Close – Preço de fechamento no dia após ser contabilizado as ações corporativas.
    * Volume – Volume negociado no dia. 

In [258]:
# salvar os dados originais para analise
data.to_csv('petr4SA.csv')

In [259]:
# ler os dados salvos
df = pd.read_csv('petr4SA.csv')

In [260]:
#Plotando os preços de fechamento da ação
d = [go.Scatter(x=df.Date,y=df['Close'])]
py.iplot(d)

Nota-se que há períodos com grandes variações, como no final de 2015, no primeiro semestre de 2018, no início de 2020 e no início de 2021. Estes pontos devem ser investigados, pesquisar possíveis hipóteses que tenham causado esta variação na queda das ações.

##### Gráfico Candlesticks

* Essa vizualização apresenta o valor de abertura, fechamento, alta e baixa da ação naquele dia.


In [261]:
trace = go.Candlestick(x=df['Date'],
open=df['Open'],
high=df['High'],
low=df['Low'],
close=df['Close'])
data = [trace]
py.iplot(data, filename='simple_candlestick')

Neste gráficos no formato de velas, vemos os vallores de alta e de baixa das ações. O tamanho da vela vai depender da faixa de variação da ação, quanto maior a variação maior o corpo da vela. Se a ação fechar com o valor menor que o preço de abertura a cor da vela será vermelha, caso contrário será verde.

 ##### Storytelling

* Investigação de acontecimentos marcantes no Brasil durante os 10 anos em análise das ações. Isso para encontrar possíveis causas das variações bruscas nos preços das ações.  
 




In [262]:
trace = go.Candlestick(x=df['Date'],
open=df['Open'],
high=df['High'],
low=df['Low'],
close=df['Close'])
data = [trace]

layout = {
'title': 'PETR4 Preços no Periodo',
'title_x': 0.5,
'yaxis': {'title': 'PETR4 Preço'},
'annotations': [
{
'x': '2016-01-01', 
'y': 7, 
'xref': 'x', 
'yref': 'y',
'showarrow': True,
'font':dict(
family="Courier New, monospace",
size=12
),
'text': 'Impeachment Dilma',
'align':"center",
'arrowhead':2,
'arrowsize':1,
'arrowwidth':2,
'bordercolor':"#c7c7c7",
'borderwidth':2,
'borderpad':4
},
{
'x': '2018-05-27', 
'y': 27, 
'xref': 'x', 
'yref': 'y',
'showarrow': True,
'font':dict(
family="Courier New, monospace",
size=12
),
'text': 'Greve dos Caminhoneiros',
'align':"center",
'arrowhead':2,
'arrowsize':1,
'arrowwidth':2,
'bordercolor':"#c7c7c7",
'borderwidth':2,
'borderpad':4
},


{
'x': '2020-03-20', 
'y': 27, 
'xref': 'x', 
'yref': 'y',
'showarrow': True,
'font':dict(
family="Courier New, monospace",
size=12
),
'text': 'OMS DECLARA PANDEMIA',
'align':"center",
'arrowhead':2,
'arrowsize':1,
'arrowwidth':2,
'bordercolor':"#c7c7c7",
'borderwidth':2,
'borderpad':4
},

]
}
fig = dict(data=data, layout=layout)
py.iplot(fig)

Além da pandemia da Covid-19 a segunda maior variação nos preços das ações foram a greve dos caminhoneiros. isso devido a paralização da distribuição dos combustíveis nos estados, além da redução do consumo dos combustíveis por diversos setores, tanto privado como público. 

##### Adicionando linhas de médias de 5, 10 e 15 dias

In [263]:
# Média simples de 5 dias
df['MM_5'] = df.Close.rolling(window=5).mean()

# Média simples de 10 dias
df['MM_10'] = df.Close.rolling(window=10).mean()

# Média simples de 15 dias
df['MM_15'] = df.Close.rolling(window=15).mean()

close = go.Scatter(
x=df.Date,
y=df.Close,
name = "PETR4 Close",
line = dict(color = '#330000'),
opacity = 0.8)

MM_5 = go.Scatter(
x=df.Date,
y=df['MM_5'],
name = "Média Móvel 5 Períodos",
line = dict(color = '#FF8000'),
opacity = 0.8)

MM_10 = go.Scatter(
x=df.Date,
y=df['MM_10'],
name = "Média Móvel 10 Períodos",
line = dict(color = '#B2FF66'),
opacity = 0.8)

MM_15 = go.Scatter(
x=df.Date,
y=df['MM_15'],
name = "Média Móvel 15 Períodos",
line = dict(color = '#FF00FF'),
opacity = 0.8)

data = [close, MM_5, MM_10, MM_15]

py.iplot(data)

##### Conclusão:

* Em períodos onde há grandes variações, a média fica mais distante dos preços das ações. Isso faz com que as tomadas de decisões neste período devem ser feitas com mais cautela pois são períodos de alto risco tanto para compra como para venda de ações.