# Quant basics

Bem vindo ao projetinho do Turing Quant!

Neste notebook você aprenderá os seguinte assuntos:

- Importação de dataset de preço históricos
- Retornos e Risco (Volatilidade)
- Lidando com portfolios
- Predição de Series Temporais
- Implementação TSMOM

## 1. Importação de dataset de preço histórico

Para a importação de dados existem diversas bibliotecas em python que fornem preços históricos de ativos

Detre elas podemos citar as seguinte plataformas:

- Google Finance (Via panda_datareader)
- Yahoo Finace (Via panda_datareader)
- Quandl

Pesquise sobre como importar dados nessas bibliotecas. Os dataset que consiguimos com essas bibliotecas são denominados OHLCV (open-high-low-close-volume).

- Plote os preços de fechamento
- Plote um gráfico de vela
- Faça uma simples analise qualitativa do ativo escolhido (Ex: porque ele teve grande variação em algum momento)

In [None]:
# importando biliotecas para manipulação, calculo e plotagem
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
from pandas_datareader import data

# Importando dataset de preços da apple
df = data.DataReader ("IBM",
                        start='2014-1-1',
                        end='2020-4-22',
                        data_source='yahoo')

In [None]:
df.head()

In [None]:
df_close = df["Close"]

plt.figure(figsize=(16,9))

plt.plot(df_close)

plt.title("Preço históricos da Petrobras")
plt.ylabel("Preço")
plt.xlabel("Data")

plt.show()


In [None]:
import plotly.graph_objects as go

fig = go.Figure(data=[go.Candlestick(x=df.index,
                                     open=df["Open"],
                                     high=df["High"],
                                     low=df["Low"],
                                     close=df["Close"])])

fig.show()

## Análise qualitativa

Responda aqui no markdown...

# 2. Retorno e Risco

Inserir intro

Com o mesmo ativo que você importou anteriormente, iremos inicial os calculos de risco e retorno. Porém inicialmente iremos analisar retorno e risco com o preço de fechamento.

Há duas maneiras de se calcular o retorno de uma série temporal

- Retorno Simples: $R_t = (P_t - P_{t-1})/P_{t-1} = P_t/P_{t-1} - 1$
- Retorno Logaritmo: $r_t = log(P_t/P{t-1}) = log(P_t) - log(P_{t-1})$

Sendo $P_t$ o preço no tempo t, e $P_{t-1}$ preço no tempo $t-1$ (Dia anterior).

Manipulando o dataframe implemente esse dois tipos de retonos e compare-os

Calcule os retornos cumulativos deles

- Retorno Cumulatvo: $R_{cum} = (1+R_t) * (1+R_{t-1})$

#### Recomendação: Na medida do possível minimize a utilização de for loops, sempre tente usar numpy para os cálculos, pois essa biblioteca é muito eficiente

In [None]:
R_simple = np.divide(df_close, df_close.shift(-1)) -1
r_log = np.log(np.divide(df_close, df_close.shift(-1)))

plt.plot(R_simple)
plt.title("Retornos simples")
plt.show()

plt.plot(r_log)
plt.title("Retornos logaritmos")
plt.show()

In [None]:
plt.plot((1+R_simple).cumprod())
plt.title("Retornos cumulativos simples")
plt.show()

plt.plot((1+r_log).cumprod())
plt.title("Retornos cumulativo logaritmos")
plt.show()

# Risco

Há diversos tipo de definições de risco, em finança quantitativas uma maneira bem fácil de calcular o risco é a partir da variação do ativo. Básicamento você não quer investir num ativo que varia muito, ou seja, muito imprevisivel. Uma maneira estátistica de cálcular a essa volatilidade é a partir do desvio padrão.

- Calcule o desvio padrão do ativo

Apenas o valor do desvio padrão não apresenta muita informação, então iremos calcular o rolling std. Básicamente iremos calcular o desvio padrão a cada t intervalo de tempo.

- Calcule o rolling std

Dica: utilize o método ```pandas.rolling(window).std()``` do pandas, window é o intervalo em que você irá calcular o desvio padrão

### Desafio

- Calcule o desvio padrão exponencial (EWMA)
- Calcule o desvio padrão estimado pelo High e Low (Parkinson Number)
- Calcule o desvio padrão estimado por High, Low, Close e Open (Garman-Klass)

In [None]:
df_close.std()

In [None]:
df_close.rolling(20).std().plot()

In [None]:
df_close.ewm(20).std().plot()

In [None]:
def parkinson_vol(high_df, low_df, period=60):

    x = np.log(np.divide(high_df, low_df)) ** 2

    pv = x.copy()

    const = 1 / (4 * period * np.log(2))

    pv.iloc[:period] = np.nan

    for row in range(period, len(high_df)):
        pv.iloc[row] = np.sqrt(const * np.sum(x.iloc[row-period:row]))

    return pv

parkinson = parkinson_vol(df["High"], df["Low"], 20)
parkinson.plot()

In [None]:
def garman_klass_vol(high_df, low_df, close_df, open_df, period=60):

    x_hl = (1/2)*(np.log(np.divide(high_df, low_df))) ** 2
    x_co = - (2 * np.log(2) - 1) * \
        (np.log(np.divide(close_df, open_df))**2)

    x = x_hl + x_co.values

    gk = x.copy()

    const = 1/period

    gk.iloc[:period] = np.nan

    for row in range(period, len(high_df)):
        gk.iloc[row] = np.sqrt(const * np.sum(x.iloc[row-period:row]))

    return gk

garman_klass = garman_klass_vol(df["High"], df["Low"], df["Close"], df["Open"], 20)
garman_klass.plot()