# Quant basics

Bem vindo ao projetinho do Turing Quant!

Neste notebook você aprenderá os seguinte assuntos:

- Importação e visualização de dados financeiros
- Retornos e Risco de um ativo
- Análise de portfólios
- Previsão de Series Temporais

## 1. Importação de dataset de preço histórico

Para a importação de dados existem diversas bibliotecas em python que fornem preços históricos de ativos

Dentre elas podemos citar as seguinte plataformas:

- Google Finance (Via panda_datareader)
- Yahoo Finace (Via panda_datareader ou yfinance)
- Quandl

Pesquise sobre como importar dados nessas bibliotecas. Os datasets que conseguimos com essas bibliotecas são denominados OHLCV (open-high-low-close-volume).

- Plote os preços de fechamento
- Plote um gráfico de vela (Candlestick)
- Faça uma simples análise qualitativa do ativo escolhido (Ex: porque ele teve grande variação em algum momento)

In [None]:
# Escreva seu código aqui!

## Análise qualitativa

Responda aqui no markdown...

# 2. Retorno e Risco

Essencialmente, a natureza do Mercado Financeiro é baseada em um certo nível de retorno (a variação do seu investimento) para um dado nível de risco (o quão provável é esse retorno). Há uma série de maneiras para mensurar o risco, mas geralmente elas estão ligadas à volatilidade do ativo, que, em sua forma mais simples, é o desvio padrão dos preços em um dado período.

Com o mesmo ativo que você importou anteriormente, iremos iniciar os calculos de risco e retorno. Porém inicialmente iremos analisar retorno e risco com o preço de fechamento.

## Retorno

Existem algumas maneiras de se calcular o retorno de uma série temporal, aqui podemos citar duas:

- Retorno Simples: $R_t = (P_t - P_{t-1})/P_{t-1} = P_t/P_{t-1} - 1$
- Retorno Logaritmo: $r_t = log(P_t/P{t-1}) = log(P_t) - log(P_{t-1})$

Sendo $P_t$ o preço no tempo t, e $P_{t-1}$ preço no tempo $t-1$ (Dia anterior).

Manipulando o dataframe implemente esse dois tipos de retonos e compare-os

Calcule os retornos cumulativos deles

- Retorno Cumulatvo: $R_{cum} = (1+R_t) * (1+R_{t-1}) * ... * (1+R_{t-n}) $

#### Recomendação: Na medida do possível minimize a utilização de `for` loops, e tente usar numpy para realizar os cálculos de forma vetorizada, o que torna os cálculos muito mais eficientes.

In [None]:
# Escreva seu código aqui

# Risco

Há diversos tipo de definições de risco, em finança quantitativas uma maneira bem fácil de calcular o risco é a partir da variação do ativo. Basicamente, você não quer investir num ativo que varia muito, ou seja, muito imprevisível. Uma maneira estátistica de cálcular essa volatilidade é a partir do desvio padrão.

- Calcule o desvio padrão do ativo

Apenas o valor do desvio padrão não apresenta muita informação, então iremos calcular o rolling std. Básicamente iremos calcular o desvio padrão a cada t intervalo de tempo.

- Calcule o rolling std

Dica: utilize o método ```pandas.rolling(window).std()``` do pandas, window é o intervalo em que você irá calcular o desvio padrão

- Calcule o desvio padrão exponencial móvel (EWMA)

### Desafio

- Calcule o desvio padrão estimado pelo High e Low ([Parkinson Number](https://www.ivolatility.com/help/3.html))
<img src="https://miro.medium.com/proxy/0*t4hSod9UQhA3Lsmz.png">

- Calcule o desvio padrão estimado por High, Low, Close e Open ([Garman-Klass](https://portfolioslab.com/garman-klass))

<img src="https://miro.medium.com/max/1400/0*S6HDttTDL2p0GCC2.png">

Temos uma breve explicação desses estimadores de volatilidade em nosso Turing Talks: [Construindo uma Estratégia de Investimentos Quantitativa — Time Series Momentum](https://medium.com/turing-talks/construindo-uma-estrat%C3%A9gia-de-investimentos-quantitativa-time-series-momentum-7e60a40636bd)

In [None]:
# Escreva seu código aqui

# 3. Lidando com portfolios
 
Notebook de auxilio (crie uma conta no quantopian): https://www.quantopian.com/lectures/introduction-to-numpy

Agora que você já aprendeu como importar preços históricos e como calcular o risco e retorno de ativos, podemos usar esse conhecimento para começar a montar o nosso portfolio!

Nessa etapa, você irá montar uma carteira com 4 ações diferentes. 
 - Use o que você aprendeu nas etapas anteriores para construir um dataframe com 4 ativos diferentes junto com os seus respectivos **dados históricos de fechamento**.
 
Em seguida, você precisa distribuir a porcentagem que cada ativo da sua carteira receberá dos seus investimentos. Em finanças, chamamos isso de [pesos de um portfolio](https://www.investopedia.com/terms/p/portfolio-weight.asp)
 - Atribua pesos ($w$) para cada um dos ativos que estão na sua carteira (Ele devem somar 1) . Ex: w = [0.3, 0.3, 0.2, 0.2]

## Retorno

Agora, você pode calcular o **retorno** do seu portfolio. 

O retorno para um período é dado pela seguinte fórmula: $R = \vec{r} \times \vec{w}$

Onde $\vec{r}$ é o vetor de retornos de cada ativo da carteira, e $\vec{w}$ os seus respectivos pesos.

- Calcule o retorno para cada dia da série temporal

- Faça um gráfico para visualizar os **retornos cumulativos** do seu portfolio e compare com algum benchmark (EX: IBOV). 

In [None]:
# Escreva seu código aqui

## Risco

Para calcular um **risco** de um portfolio precisamos levar em conta as correlações entre todos os ativos. Para isso calcularemos a matriz de covariaças $C$ (```pandas.cov()``` ou ```np.cov()```).

A equação do risco de uma portfólio é dada pela seguinte fórmula: $\sigma = \sqrt{\vec{w}C\vec{w}^\mathsf{T}}$, sendo $T$ a tranposição de um array 

- Calcule o risco de 3 portfólios (varie o vetor de pesos).

In [None]:
# Escreva seu código aqui

## Teoria Moderna de Portifolio - Markowitz 

https://campus.datacamp.com/courses/introduction-to-portfolio-analysis-in-r/optimizing-the-portfolio?ex=7

Markowitz também conhecido como efficient frontier, é uma maneira de otimizar uma carteira de investimentos. Para isso simula-se diversas pesos, e para cada peso é calculado seu retorno esperado e risco. Pesquise sobre [sharpe ratio](https://www.investopedia.com/terms/s/sharperatio.asp) para realizar o degrade de cores.

<img src="https://www.pythonforfinance.net/wp-content/uploads/2017/01/efffront-1.png">

In [None]:
# Escreva seu código aqui

## Deep Markowitz

Nesta etapa você deverá construir um modelo de machine learning para predizer o portfólio com maior sharpe ratio. Para isso iremos fornecer um dataset com os retornos anuais de 4 ativos e o respectivo peso do portfólio mais otimizado (maior sharpe ratio).

- feature.csv: Input do modelo, cada linha contém os retornos dos 4 ativos em apenas uma linha (shape = (30000,1004 )), se quiser converter para o formato de matriz utilize o método ```np.reshape(251, 4)```

- target.csv: Output do modelo, vetor com 4 valores, que são os pesos de cada ativo da carteira de investimentos. 

<img src="./images/markowitz_NN.png">

Sendo o Real: a saída do input, Markowitz: segunda interação com (5000 carteiras), e ML: a predição do modelo


In [None]:
# Escreva seu código aqui

# 4. Previsão de Time Series

## Cross validation em Séries Temporais

Sempre que lidamos com algoritmos de machine learning, para treiná-lo temos que separar os datasets em treino e em teste. Em séries temporais não podemos separar os dados aleatoriamente, pois a ordem no tempo importa! Portanto, seguimos a seguinte separação:

<img src="https://habrastorage.org/files/f5c/7cd/b39/f5c7cdb39ccd4ba68378ca232d20d864.png"/>

# _Feature Engineering_ em Série Temporal

Para inserir machine learning em séries temporais, precisamos efetuar o processo conhecido como feature engineering, que é básicamente escolher as entradas de nosso modelo.

## Lags
Os dados mais simples que podemos inserir no nosso modelo são os valores passados.
Se deslocarmos (com a função `.shift(i)`) a série temporal em $i$ vezes, conseguimos estabelecer uma feature onde o valor atual no tempo $t$ é alinhado com um valor no tempo $t-i$. Chamamos isso de _lag_, ou atraso na série temporal. Isso é bastante útil, por exemplo, para estratégias baseadas em um valor histórico de uma feature.

- Realize o feature engineering e teste alguns modelos de ML (Ex: Regressão linear, ARIMA, Decision Tree, Random Forest, Redes Neurais, etc...)
- Faça um gráfico comparando os valores reais e preditos pelo modelo, durante um determinado período.
Ex:
<img width="400" height="500" src="https://miro.medium.com/max/1000/1*NvhZBDp5jNX-5Qd4LT7FEw.png">

In [None]:
# Escreva seu código aqui

# LSTM

E por fim te desafiamos a implementar uma arquitetura de redes neurais para séries temporais, a LSTM. Podem tomar como referência esse notebook, podem copiar o código, o intuito dessa etapa é que vocês tenham um contato com Deep Learning. (https://drive.google.com/file/d/1uagMXYRMJTdMJwoQbQD5LVfrYj4aUuSF/view?usp=sharing)

In [None]:
# Escreva seu código aqui