# Séries temporais 1

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Introdução
- 2) Séries temporais


_____
_____
_____

Instale as seguintes bibliotecas:

In [None]:
!pip install yfinance

In [None]:
!pip install plotly==3.7.1

_____
_____
_____

## 1) Introdução

Iniciaremos agora nossos estudos de séries temporais.

Inicialmente, vamos entender **o que é uma série temporal**, para depois chegarmos ao ponto de **fazer previsões de pontos futuros**.

Antes de começarmos, é prudente que tenhamos a seguinte [citação](https://quoteinvestigator.com/tag/niels-bohr/) em mente:

## _"It’s difficult to make predictions. Especially about the future."_

__________
________
______

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import datetime as dt
import seaborn as sns

%matplotlib inline

Nessa aula, vamos utilizar o [yahoo finance](https://pypi.org/project/yfinance/), um módulo integrado ao pandas que nos auxiliará a captar dados financeiros da internet.

In [None]:
import yfinance as yf

____
____
____

## 2) Séries temporais

Uma **série temporal** nada mais é que **um conjunto de valores sequenciais temporalmente indexados**.

Séries temporais aparecem em diversos contextos, e o principal objetivo de seu estudo é o de conseguir **caputrar estrutura adicional** na indexação sequencial/temporal, como, por exemplo, padrões que se reptem periodicamente.

A **análise de séries temporais** nos proporciona ferramentas para:

- Descrever o comportamento da série;

- Encontrar periodicidades;

- Obter possíveis explicações para o comportamento da série, geralmente através de variáveis auxiliares;

- Predizer o comportamento futuro, o que possibilita fazer planos a longo, médio ou curto prazo e tomar decisões apropriadas.

Vamos começar a estudar estas ferramentas em Python!

Nesta aula, usaremos como fonte de dados o portal **Yahoo Finance** (https://finance.yahoo.com/).

Para consultar a série temporal **dos preços de algum ativo**, basta identificar qual é o seu **símbolo** no site acima. No caso de ações, temos os tickers.

In [None]:
yf.download('CIEL3.SA', start = '2010-01-01')

No nosso exemplo, vamos olhar pras ações da Cielo:

In [None]:
ticker = 'CIEL3.SA'

df = yf.download(ticker, start='2010-01-01')

df

Note que o yfinance produz automaticamente um dataframe com as datas **como os índices**

Isso ajuda muito na hora de fazermos os plots, e também nos filtros:

In [None]:
df.columns

In [None]:
df.index

In [None]:
df.loc["2011":"2012"]

Sempre que formos trabalhar com preços de ativos, é importante que trabalhemos com o **preço ajustado**, que nada mais é que o preço acrescido do pagamento de dividendos.

In [None]:
df["Adj Close"]

In [None]:
precos = df["Adj Close"]

In [None]:
precos

In [None]:
precos.describe()

________

### 2.1) Plotando séries temporais

A forma mais simples de plotar uma série temporal é através do método `plot()` do próprio pandas.

In [None]:
# plotanto o preço de fechamento ajustado

plt.figure(figsize=(14, 6))
plt.title(f"{ticker} - preço de fechamento ajustado")

# plot com o pandas
precos.plot()

plt.show()

Outra forma (um pouco mais flexível) é utilizando o seaborn

In [None]:
plt.figure(figsize=(14, 6))
plt.title(f"{ticker} - preço de fechamento ajustado")

# plot com o seaborn
sns.lineplot(x=precos.index, y=precos.values, label="série temporal", color="red")

plt.legend()
plt.show()

Há ainda, a possibilidade de utilizar a biblioteca [plotly](https://plotly.com/python/), que produz gráficos interativos muito interessantes!

Obs.: instale a biblioteca conforme `pip install plotly==3.7.1`

In [None]:
import plotly
import plotly.graph_objs as go
from plotly.offline import *

# pra plotar no jupyter
init_notebook_mode(connected=True)
    
# definindo os dados a serem plotados (note os índices no eixo x)
data = [go.Scatter(x=precos.index, y = precos)]

# definindo os botões interativos
botoes = {"buttons" : [{"count" : 1, "label" : "1m", "step" : "month", "stepmode" : "backward"},
                       {"count" : 6, "label" : "6m", "step" : "month", "stepmode" : "backward"},
                       {"count" : 12, "label" : "12m", "step" : "month", "stepmode" : "backward"},
                       {"step" : "all"}]
         }

# definindo o eixo x com a interatividade: botões e uma janela deslizante
eixo_x = {"rangeselector" : botoes,
          "rangeslider" : {"visible" : True}
         }

# definindo o layout
layout = {"title" : f"{ticker} - preço de fechamento ajustado",
          "xaxis" : eixo_x}

# dicionario final para o plot
fig = {"data" : data, "layout" : layout}

# fazendo o plot
plotly.offline.iplot(fig)

_______

### 2.2) Janelas deslizantes

É muito comum que séries temporais de preços de ativos financeiros apresentem grandes oscilações, como esta que estamos estudando.

Para eliminar estas variações e **suavizar** a série temporal, de modo que possa ser mais simples observar tendências e movimentos, é comum utilizarmos a técnica de **janela de média móvel (deslizante)**, que consiste em substituir os valores ao fim da janela pela **média** dos valores da janela imediatamente anterior.

É muito simples fazer isso com o pandas, utilizando o método `rolling`:

In [None]:
precos

In [None]:
precos.iloc[:3].mean()

In [None]:
# janela deslizante de 30 dias

precos.rolling(window='30D').mean()

Vamos plotar a série suavizada com a série original para compararmos:

In [None]:
plt.figure(figsize=(14, 6))
plt.title(f"{ticker} - preço de fechamento ajustado")

sns.lineplot(x=precos.index, y=precos, label="ST de preços original", alpha=0.6)

precos_30d = precos.rolling(window='30D').mean()
sns.lineplot(x=precos_30d.index, y=precos_30d, 
             label="ST de preços com janela deslizante de 30 dias", color="red")

plt.legend()
plt.show()

Comparando diferentes janelas:

In [None]:
plt.figure(figsize=(14, 6))
plt.title(f"{ticker} - preço de fechamento ajustado")

# série original
sns.lineplot(x=precos.index, y=precos, label="ST de preços original")

precos_30d = precos.rolling(window='30D').mean()
sns.lineplot(x=precos_30d.index, y=precos_30d, label="ST de preços com janela deslizante de 30 dias")

precos_90d = precos.rolling(window='90D').mean()
sns.lineplot(x=precos_90d.index, y=precos_90d, label="ST de preços com janela deslizante de 90 dias")

precos_120d = precos.rolling(window='120D').mean()
sns.lineplot(x=precos_120d.index, y=precos_120d, label="ST de preços com janela deslizante de 120 dias")

plt.legend()
plt.show()

Com o plotly:

In [None]:
# definindo os dados a serem plotados (note os índices no eixo x)
data = [go.Scatter(x=precos.index, y = precos, name="ST preços original"),
        go.Scatter(x=precos_30d.index, y = precos_30d, name="ST preços jd 30 dias"),
        go.Scatter(x=precos_90d.index, y = precos_90d, name="ST preços jd 90 dias"),
        go.Scatter(x=precos_120d.index, y = precos_120d, name="ST preços jd 120 dias")]

# definindo os botões interativos
botoes = {"buttons" : [{"count" : 1, "label" : "1m", "step" : "month", "stepmode" : "backward"},
                       {"count" : 6, "label" : "6m", "step" : "month", "stepmode" : "backward"}, 
                       {"step" : "all"}]
         }

# definindo o eixo x com a interatividade: botões e uma janela deslizante
eixo_x = {"rangeselector" : botoes,
          "rangeslider" : {"visible" : True}
         }

# definindo as posições das legendas
legenda = {"yanchor" : "top", "y" : 0.99, "xanchor" : "left", "x" : 0.01}

# definindo o layout
layout = {"title" : f"{ticker} - preço de fechamento ajustado",
          "xaxis" : eixo_x,
          "legend" : legenda}

# dicionario final para o plot
fig = {"data" : data, "layout" : layout}

# fazendo o plot
plotly.offline.iplot(fig)