# **Python para o Mercado Financeiro**


**Bibliotecas que podem precisar de instalação**

In [1]:
!pip install quandl
!pip install "statsmodels==0.11.1"
!pip install pyportfolioopt

Collecting quandl
  Downloading https://files.pythonhosted.org/packages/8b/2b/feefb36015beaecc5c0f9f2533e815b409621d9fa7b50b2aac621796f828/Quandl-3.6.1-py2.py3-none-any.whl
Collecting inflection>=0.3.1
  Downloading https://files.pythonhosted.org/packages/59/91/aa6bde563e0085a02a435aa99b49ef75b0a4b062635e606dab23ce18d720/inflection-0.5.1-py2.py3-none-any.whl
Installing collected packages: inflection, quandl
Successfully installed inflection-0.5.1 quandl-3.6.1
Collecting statsmodels==0.11.1
[?25l  Downloading https://files.pythonhosted.org/packages/7b/6a/0bf4184c3fb6f9f43df997b88de5784b4cb2f6bd19a5dc213463971076cf/statsmodels-0.11.1-cp37-cp37m-manylinux1_x86_64.whl (8.7MB)
[K     |████████████████████████████████| 8.7MB 5.3MB/s 
Installing collected packages: statsmodels
  Found existing installation: statsmodels 0.10.2
    Uninstalling statsmodels-0.10.2:
      Successfully uninstalled statsmodels-0.10.2
Successfully installed statsmodels-0.11.1
Collecting pyportfolioopt
[?25l  Down

# **Módulo 1**

## **Indicadores Macroeconômicos**

> Utilizando a biblioteca Quandl para importação dos dados macroeconômicos



### **Bibliotecas**

In [2]:
import quandl
import pandas as pd 
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from math import ceil

### **Acesso ao Google Drive**

In [3]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


### **Configurando acesso a Quandl**

In [4]:
arquivo = open('/content/drive/MyDrive/Colab Notebooks/Portfólio/Quant/Quandl_Key.txt', 'r')
key = arquivo.read()
arquivo.close()   

In [5]:
quandl.ApiConfig.api_key = key

### **PIB**

> O Produto Interno Bruto (PIB) é um indicador econômico que apresenta a soma de todos os bens e serviços produzidos em uma área geográfica em um determinado período. Sendo assim, ele representa a dinâmica econômica do lugar, a possibilitando a análise do crescimento econômico e também a oportunidade de comparações com outras localidades.


In [6]:
pib = quandl.get('ODA/BRA_NGDPD', start_date = '2000-01-01')
pib.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-12-31,655.435
2001-12-31,559.962
2002-12-31,509.358
2003-12-31,557.681
2004-12-31,668.432


In [7]:
px.line(pib,  x=pib.index, y=pib.values, title='PIB Histórico desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **Taxa Selic**

> ​A Selic é a taxa básica de juros da economia. É o principal instrumento de política monetária utilizado pelo Banco Central (BC) para controlar a inflação. Ela influencia todas as taxas de juros do país, como as taxas de juros dos empréstimos, dos financiamentos e das aplicações financeiras.

> A taxa Selic refere-se à taxa de juros apurada nas operações de empréstimos de um dia entre as instituições financeiras que utilizam títulos públicos federais como garantia. O BC opera no mercado de títulos públicos para que a taxa Selic efetiva esteja em linha com a meta da Selic definida na reunião do Comitê de Política Monetária do BC (Copom).

In [8]:
selic = quandl.get('BCB/432', start_date = '2000-01-01')
selic.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-01,19.0
2000-01-02,19.0
2000-01-03,19.0
2000-01-04,19.0
2000-01-05,19.0


In [9]:
px.line(selic,  x=selic.index, y=selic.values, title='Selic Histórica desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **IPCA**

> O IPCA é o Índice de Preços para o Consumidor Amplo. Esse importante índice é medido mensalmente pelo IBGE para identificar a variação dos preços no comércio. Ele é considerado, pelo Banco Central, o índice brasileiro oficial da inflação ou deflação.

> Ele funciona como um termômetro para a economia brasileira, reunindo informações que ajudam o consumidor a entender o que vai encontrar na hora da compra. E também serve como instrumento de correção de determinadas aplicações financeiras, que têm nele o seu índice de referência.

In [10]:
ipca = quandl.get('BCB/13522', start_date = '2000-01-01')
ipca.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,8.85
2000-02-29,7.86
2000-03-31,6.92
2000-04-30,6.77
2000-05-31,6.47


In [11]:
px.line(ipca,  x=ipca.index, y=ipca.values, title='IPCA Histórico desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **IGPM**

> O Índice Geral de Preços Mercado (IGP-M) é um indicador que mede a variação de preços para reajuste de contratos de aluguéis, energia elétrica e telefonia, por exemplo. Calculado mensalmente pela Fundação Getúlio Vargas, ele sofre influências de outros indicadores e do dólar para seu cálculo. 

> O cálculo do IGP-M tem em conta a variação de preços de bens e serviços, bem como de matérias-primas utilizadas na produção agrícola, industrial e construção civil. Dessa forma, o resultado do IGP-M é a média aritmética ponderada da inflação ao produtor (IPA), consumidor (IPC) e construção civil (INCC). Sendo os pesos, respectivamente, 60%, 30% e 10%.

In [12]:
igpm = quandl.get("BCB/189", start_date = '2000-01-01')
igpm.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,1.24
2000-02-29,0.35
2000-03-31,0.15
2000-04-30,0.23
2000-05-31,0.31


In [13]:
px.line(igpm,  x=igpm.index, y=igpm.values, title='IGPM Histórico desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **Comparando os valores históricos do IPCA, IGPM e Selic**

In [14]:
fig = go.Figure()
# IPCA
fig.add_trace(go.Scatter(x = ipca.index, 
                    y = ipca['Value'], 
                    name='IPCA'))
# Selic
fig.add_trace(go.Scatter(x = selic.index, 
                    y = selic['Value'], 
                    name='Selic'))
# IGPM
fig.add_trace(go.Scatter(x = igpm.index, 
                    y = igpm['Value'], 
                    name='IGPM'))
# Alterando Layout
fig.update_layout(xaxis = dict(title = 'Data'),
                  yaxis = dict(title = 'Valor'),
                  title = 'Comparando os valores históricos do IPCA, IGPM e Selic',
                  legend = dict( bgcolor = "LightSteelBlue"), 
                  legend_orientation = "h")
fig.show()

### **Cesta Básica**

> O Departamento Intersindical de Estatística e Estudos Socieconômicos (Dieese) estabeleceu uma lista de produtos considerados essenciais para que um adulto possa cuidar de sua higiene pessoal e se alimentar de forma adequada. A essa relação de produtos, foi dado o nome de cesta básica.

> O acompanhamento do custo dos itens da Cesta Básica Nacional começou em janeiro de 1959 e continua desde então. Recentemente, a pesquisa é realizada em 18 capitais brasileiras, onde mensalmente revela a evolução de valores de 13 produtos de alimentação, assim como o gasto mensal que uma pessoa teria para compra-los.

> A quantidade de ingredientes da cesta básica no Brasil pode variar de acordo com a região, mas o Dieese estabelece basicamente os seguintes alimentos: leite, feijão, arroz, farinha, batata, tomate, pão francês ou de forma, café em pó, açúcar, óleo ou banha, manteiga e frutas (banana/maçã).

In [15]:
cesta_basica_BH = quandl.get('BCB/7481', start_date = '2000-01-01')
cesta_basica_BH.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,104.3
2000-02-29,107.4
2000-03-31,110.8
2000-04-30,110.28
2000-05-31,103.28


In [16]:
cesta_basica_SP = quandl.get('BCB/7493', start_date = '2000-01-01')
cesta_basica_SP.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,112.22
2000-02-29,110.8
2000-03-31,115.13
2000-04-30,115.92
2000-05-31,111.78


In [17]:
fig = go.Figure()
# Cesta Básica de BH
fig.add_trace(go.Scatter(x = cesta_basica_BH.index, 
                    y = cesta_basica_BH['Value'], 
                    name='Cesta Básica de BH'))
# Cesta Básica de SP
fig.add_trace(go.Scatter(x = cesta_basica_SP.index, 
                    y = cesta_basica_SP['Value'], 
                    name='Cesta Básica de SP'))
# Alterando o Layout
fig.update_layout(xaxis = dict(title = 'Data'),
                  yaxis = dict(title = 'Valor'),
                  title = 'Comparando os valores históricos da Cesta Básica em Belo Horizonte e São Paulo',
                  legend = dict( bgcolor = "LightSteelBlue"), 
                  legend_orientation = "h")
fig.show()

### **Dólar Comercial**

> O dólar comercial faz referências às transações comerciais, por exemplo compra e venda de mercadorias e serviços entre empresas. É aquele utilizado para balizar as grandes movimentações de importação e exportação das empresas brasileiras e também é a cotação considerada nas ações do governo no exterior, como empréstimos (registrados no Banco Central) de brasileiros residentes em outros países.

> O valor é negociado entre bancos e empresas, mas o Banco Central brasileiro impõe um certo controle para não deixar que suba demais o preço (o que descontrola as importações e desvaloriza o real), ou que o câmbio desça demais, o que afeta diretamente as exportações.


In [18]:
dolar = quandl.get('BCB/10813', start_date = '2007-01-01')
dolar.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2007-01-02,2.1334
2007-01-03,2.1364
2007-01-04,2.1421
2007-01-05,2.1466
2007-01-08,2.1497


In [19]:
px.line(dolar,  x=dolar.index, y=dolar.values, title='Dólar Histórico desde 01/01/2007', labels={'x':'Data', 'y':'Valor'})

## **Risco**

In [20]:
import pandas_datareader as wb

In [21]:
ibov = wb.DataReader('^BVSP', data_source='yahoo', start='2008-01-01')
ibov.head()

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2008-01-02,63906.0,62659.0,63885.0,62815.0,2980200.0,62815.0
2008-01-03,63129.0,62556.0,62814.0,62892.0,1895800.0,62892.0
2008-01-04,63436.0,60574.0,62898.0,61037.0,2613800.0,61037.0
2008-01-07,61505.0,60092.0,61054.0,60772.0,2223400.0,60772.0
2008-01-08,62650.0,60771.0,60771.0,62081.0,3314000.0,62081.0


In [22]:
ibov = wb.DataReader('^BVSP', data_source='yahoo', start='2008-01-01')
ibov.rename(columns = {'Adj Close': "IBOV"}, inplace = True)
ibov.drop(columns = ['High', 'Low', 'Open', 'Close', 'Volume'], axis=1, inplace=True)
ibov.head()

Unnamed: 0_level_0,IBOV
Date,Unnamed: 1_level_1
2008-01-02,62815.0
2008-01-03,62892.0
2008-01-04,61037.0
2008-01-07,60772.0
2008-01-08,62081.0


In [23]:
px.line(ibov,  x=ibov.index, y=ibov.values, title='Valores históricos do IBOVESPA desde 01/01/2008', labels={'x':'Data', 'y':'Valor'})

In [24]:
ibov_retornos = ibov.pct_change()
ibov_retornos.head()

Unnamed: 0_level_0,IBOV
Date,Unnamed: 1_level_1
2008-01-02,
2008-01-03,0.001226
2008-01-04,-0.029495
2008-01-07,-0.004342
2008-01-08,0.02154


In [25]:
px.histogram(ibov_retornos, x='IBOV', nbins=60)

In [26]:
ibov_retornos.std()

IBOV    0.01813
dtype: float64

## **Finanças Básicas**

### **Valor Presente - Quanto vale hoje uma opção de receber um fluxo de caixa futuro**
Qual seria o valor presente de 10000,00 reais para receber daqui a 10 anos sendo que meu custo de oportunidade hoje é de 8%?

In [27]:
# VP = VF/(1+i)^n

n = 10
valor_futuro = 10000
i = 0.08

VP = valor_futuro/(1+i)**n

print(VP)

4631.934880846841


### **Financiar ou comprar a vista?**
Valor do carro 10000,00 - opção 1: pagar à vista, opção 2: financiar em 5 prestações anuais de 3000,00 à uma taxa de 12%a.a.

In [28]:
##PMT * [((1-(1/(1+i)^n))/n)]

op_1 = 10000
n = 5
PMT = 3000
i = 0.12

VP = PMT*(((1-(1/(1+i)**n))/i))

print(VP)

10814.32860703502


### **Perpetuidade ou série infinita**
Ativo que pagará para sempre uma taxa fixa de 9% a.a. e que custa hoje 100000

In [29]:
#Perpetuidade = valor do ativo/taxa

valor_ativo = 100000
taxa = 0.09

VP = valor_ativo/taxa

print(VP)

1111111.1111111112


### **Perpetuidade crescente**
* Série de pagamentos que cresce à uma taxa constante
* Uma ação que paga 4 reais de dividendos anualmente e os dividendos crescem a uma taxa de 1% a.a., qual seria o valor presente dessa ação? Seu custo de oportunidade é de 8%a.a.

In [30]:
## Perpetuidade crescente = Recebimento esperado para o próx ano/(Taxa de desconto - Taxa de crescimento esperada)

taxa_cresc = 0.01
rec_esp = 4*(1+taxa_cresc)
i = 0.08

perp_cresc = rec_esp/(i-taxa_cresc)

print(perp_cresc)

57.71428571428571


# **Módulo 2**

In [31]:
import pandas as pd
import pandas_datareader as wb
import numpy as np
import plotly.express as px
import plotly.graph_objects as go

## **Ativos**

### **Importando dados dos ativos**

In [32]:
tickers = ['BBDC4.SA', 'ITUB4.SA', 'BBAS3.SA', 'SANB3.SA']

In [33]:
def importar_ativos(ativos, data_inicio = None, data_fim = None):
  # Criando o dataframe e preenchendo com dados do primeiro ativos
  df_ativos = pd.DataFrame()
  df_ativos = wb.DataReader(ativos[0], data_source='yahoo', start=data_inicio, end=data_fim)
  df_ativos.drop(columns=['High', 'Low', 'Open', 'Close', 'Volume'], axis=1, inplace=True)
  df_ativos.rename({"Adj Close":str(ativos[0])}, axis=1, inplace=True)
  # Completando o dataframe com dados dos outros ativos
  for i in ativos[1:]:
    df = wb.DataReader(i, data_source='yahoo', start=data_inicio, end=data_fim)
    df.drop(columns=['High', 'Low', 'Open', 'Close', 'Volume'], axis=1, inplace=True)
    df.rename({"Adj Close":str(i)}, axis=1, inplace=True)
    df_ativos = pd.concat([df_ativos, df], join='inner', axis=1)
  # Retornando resultado
  return df_ativos

In [34]:
carteira = importar_ativos(tickers, '2018-01-01')
carteira.head()

Unnamed: 0_level_0,BBDC4.SA,ITUB4.SA,BBAS3.SA,SANB3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2018-01-02,20.754375,25.323982,28.053217,16.119589
2018-01-03,20.849792,25.497124,28.411016,15.965904
2018-01-04,21.191877,26.02807,28.683632,15.667076
2018-01-05,21.311911,26.103096,28.683632,15.684154
2018-01-08,21.305906,26.016529,28.751781,16.338699


### **Plotando séries históricas dos ativos**

In [35]:
def plotar_ativos(df_ativos, ativos):
  fig = go.Figure()
  for i in ativos:
    # Ativos com preços normais
    fig.add_trace(go.Scatter(x = df_ativos.index, 
                        y = df_ativos[i],
                        legendgroup='normal',
                        name=i))
  # Propriedade do Eixo X
  fig.update_xaxes(title_text="Data")
  
  # Propriedade do Eixo Y
  fig.update_yaxes(title_text="Preço")
  fig.update_layout(title = 'Comparando os valores históricos dos ativos',
                    legend = dict(bgcolor = "LightSteelBlue", orientation="v"))
  fig.show()

In [36]:
plotar_ativos(carteira, tickers)

In [37]:
def plotar_ativos_normalizados(df_ativos, ativos):
  fig = make_subplots(rows=2, cols=1, start_cell="top-left")
  for i in ativos:
    # Ativos com preços normais
    fig.add_trace(go.Scatter(x = df_ativos.index, 
                        y = df_ativos[i],
                        legendgroup='normal',
                        name=i),
                        row=1, col=1)
    # Ativos com preços normalizados
    fig.add_trace(go.Scatter(x = df_ativos.index, 
                        y = df_ativos[i]/df_ativos[i][0], 
                        legendgroup='normalizado',
                        name=i + ' Normalizado'),
                        row=2, col=1)
  # Propriedade do Eixo X
  fig.update_xaxes(title_text="Data", row=1, col=1)
  fig.update_xaxes(title_text="Data", row=2, col=1)

  # Propriedade do Eixo Y
  fig.update_yaxes(title_text="Preço", row=1, col=1)
  fig.update_yaxes(title_text="Preço Normalizado", row=2, col=1)
  fig.update_layout(title = 'Comparando os valores históricos dos ativos',
                    legend = dict(bgcolor = "LightSteelBlue", orientation="v"))
  fig.show()

In [38]:
plotar_ativos_normalizados(carteira, tickers)

## **Volatilidade (Retornos)**

### **Calculando os Retornos**

In [39]:
def calcular_retornos(df_ativos):
  df_retornos = df_ativos.pct_change()
  df_retornos.dropna(inplace=True)
  return df_retornos

In [40]:
retornos = calcular_retornos(carteira)
retornos.head()

Unnamed: 0_level_0,BBDC4.SA,ITUB4.SA,BBAS3.SA,SANB3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2018-01-03,0.004597,0.006837,0.012754,-0.009534
2018-01-04,0.016407,0.020824,0.009595,-0.018717
2018-01-05,0.005664,0.002882,0.0,0.00109
2018-01-08,-0.000282,-0.003316,0.002376,0.041733
2018-01-09,-0.009295,-0.010869,-0.009481,-0.031892


### **Plotando os Retornos**

In [41]:
def plotar_retornos(df_retornos, ativos):
  fig = make_subplots(rows=ceil(len(ativos)/2), cols=2, start_cell="top-left")
  linha = 1
  coluna = 1
  for i in ativos:
    fig.add_trace(go.Scatter(x = df_retornos.index, 
                        y = df_retornos[i], 
                        name=i),
                        row=linha, col=coluna)
    fig.update_xaxes(title_text="Data", row=linha, col=coluna)
    fig.update_yaxes(title_text=i, row=linha, col=coluna)
    if coluna == 1:
      coluna = coluna + 1 
    else:
      linha = linha + 1
      coluna = 1

  fig.update_layout(title = 'Retornos dos ativos durante o período',
                   showlegend=False)
  fig.show()

In [42]:
plotar_retornos(retornos, tickers)

### **Plotando Histograma dos Retornos**

In [43]:
def plotar_histogramas_retornos(df_retornos, ativos):
  fig = make_subplots(rows=ceil(len(ativos)/2), cols=2, start_cell="top-left")
  linha = 1
  coluna = 1
  for i in ativos:
    fig.add_trace(go.Histogram(x = df_retornos[i],
                        nbinsx=50,
                        name=i),
                        row=linha, col=coluna)
    fig.update_xaxes(title_text='Retornos', row=linha, col=coluna)
    fig.update_yaxes(title_text=i, row=linha, col=coluna)
    if coluna == 1:
      coluna = coluna + 1 
    else:
      linha = linha + 1
      coluna = 1

  fig.update_layout(title = 'Distribuição dos retornos dos ativos durante o período',
                    showlegend = False)
  fig.show()

In [44]:
plotar_histogramas_retornos(retornos, tickers)

### **Calculando a Volatilidade Diária**

In [45]:
retornos.std()

BBDC4.SA    0.025779
ITUB4.SA    0.022741
BBAS3.SA    0.029400
SANB3.SA    0.032256
dtype: float64

In [46]:
retornos.describe()

Unnamed: 0,BBDC4.SA,ITUB4.SA,BBAS3.SA,SANB3.SA
count,782.0,782.0,782.0,782.0
mean,0.000557,0.000355,0.000514,0.000726
std,0.025779,0.022741,0.0294,0.032256
min,-0.142744,-0.098204,-0.166895,-0.126019
25%,-0.013794,-0.012917,-0.013628,-0.018013
50%,0.0,-0.000285,0.000193,0.0
75%,0.01334,0.013176,0.014449,0.018353
max,0.168669,0.110593,0.171261,0.185751


## **Downside Risk**

> O Downside Risk (DR) é uma estimativa do potencial de um título de sofrer uma queda no valor se as condições de mercado mudarem. Dependendo da medida usada, o risco de queda explica o pior cenário para um investimento ou indica quanto o investidor pode perder.

> Sortino e Van der Meer (1991) argumentam que o DR é uma medida superior de risco. Ele mede a distância média dos retornos abaixo de um ponto de corte, o Retorno Mínimo Aceitável (RMA), e por isso também é conhecido por below-target semideviation (SORTINO; VAN DER MEER, 1991). Portanto, o DR é um tipo de semi-variância, e mede somente a parte indesejável do risco, que é o risco para baixo.

![Downside Risk](https://www.researchgate.net/profile/Roberto_Moro_Visconti2/publication/228231157/figure/fig1/AS:668346659921923@1536357669279/Upside-and-downside-risk-as-a-consequence-of-project-revenues-volatility.png)

In [47]:
def calcular_downside_risk(df_retornos):
  downside_ativos = df_retornos[df_retornos < 0]
  downside_ativos = np.std(downside_ativos)
  return downside_ativos

In [48]:
downside_ativos = calcular_downside_risk(retornos)
downside_ativos

BBDC4.SA    0.017367
ITUB4.SA    0.014956
BBAS3.SA    0.021012
SANB3.SA    0.020049
dtype: float64

## **Janela de Móvel de Tempo**

> Determinar uma janela móvel de tempo, ou seja, determinar a um período de tempo a ser considerado para análise.

### **Volatilidade Móvel dos Retornos**

In [49]:
def calcular_volatilidade_movel(df, janela):
  df_volatilidade_movel = df.rolling(window=janela).std()
  df_volatilidade_movel.dropna(inplace=True)
  return df_volatilidade_movel

In [50]:
df_vol_movel_retornos = calcular_volatilidade_movel(retornos, 252)
plotar_retornos(df_vol_movel_retornos, tickers)

### **Média Móvel dos Retornos**

> Determinar a média móvel dos retornos em uma janela de tempo.

In [51]:
def calcular_media_movel(df, janela):
  df_media_movel = df.rolling(window=janela).mean()
  df_media_movel.dropna(inplace=True)
  return df_media_movel

In [52]:
df_media_movel_retornos = calcular_volatilidade_movel(retornos, 252)
plotar_retornos(df_media_movel_retornos, tickers)

## **Skewness**

> A assimetria se refere a uma distorção ou assimetria que se desvia da curva em sino simétrica, ou distribuição normal, em um conjunto de dados. Se a curva for deslocada para a esquerda ou para a direita, diz-se que está inclinada.

>Além da inclinação positiva e negativa, também se pode dizer que as distribuições têm inclinação zero ou indefinida. Na curva de uma distribuição, os dados do lado direito da curva podem diminuir de forma diferente dos dados do lado esquerdo. Esses afilamentos são conhecidos como "caudas". A inclinação negativa se refere a uma cauda mais longa ou mais larga no lado esquerdo da distribuição, enquanto a inclinação positiva se refere a uma cauda mais longa ou mais grossa à direita.

* Se v>0, então a distribuição tem uma cauda direita, valores acima da média
* Se v<0, então a distribuição tem uma cauda esquerda, valores abaixo da média
* Se v=0, então a distribuição é aproximadamente simétrica.

![Skewness](https://develve.net/files/grafskewness.gif)


In [53]:
from scipy.stats import skew
def calcular_skewness(df_retornos, ativos):
  skewness = {}
  for i in ativos:
    skewness[i] = skew(df_retornos[i])
  return skewness

In [54]:
skewness = calcular_skewness(retornos, tickers)
skewness

{'BBAS3.SA': 0.0840902239206132,
 'BBDC4.SA': 0.26330345717167103,
 'ITUB4.SA': 0.10395367449461171,
 'SANB3.SA': 0.3841595900491739}

## **Curtose**

> Denomina-se Curtose ao grau de “achatamento” de uma distribuição de frequências, geralmente unimodal, medido em relação ao de uma distribuição normal que é tomada como padrão. Muito embora seja comum explicar a curtose como o “grau de achatamento” de uma distribuição de freqüências, o que as medidas de curtose buscam indicar realmente é o grau de concentração de valores da distribuição em torno do centro desta distribuição.

> Numa distribuição unimodal, quanto maior for a concentração de valores em torno do centro da mesma, maior será o valor da sua curtose. Graficamente isto será associado a uma curva com a parte central mais afilada, mostrando um pico de freqüência simples mais destacado, mais
pontiagudo, caracterizando a moda da distribuição de forma mais nítida.

> Dizemos que uma distribuição de freqüências é:

* Leptocúrtica - quando apresenta uma medida de curtose maior que a da distribuição normal.
* Mesocúrtica – quando apresenta uma medida de curtose igual à da distribuição normal.
* Platicúrtica – quando apresenta uma medida de curtose menor que a da distribuição normal.

![Curtose](https://4.bp.blogspot.com/-CeSKUrvUsq4/W-3iepg3IEI/AAAAAAAAFFw/Dh79KCpgcGUk_Ra2WnxhArUJ7t4b1L21QCLcBGAs/s1600/curtose.JPG)


In [55]:
from scipy.stats import kurtosis
def calcular_kurtose(df_retornos, ativos):
  curtose = {}
  for i in ativos:
    curtose[i] = kurtosis(df_retornos[i])
  return curtose

In [56]:
curtose = calcular_kurtose(retornos, tickers)
curtose

{'BBAS3.SA': 7.448947806844142,
 'BBDC4.SA': 6.504112153737877,
 'ITUB4.SA': 2.319906934039464,
 'SANB3.SA': 3.246281136631275}

## **Teste de Shapiro-Wilk**

> Os testes de normalidade Shapiro-Wilk são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal. 


In [57]:
from scipy.stats import shapiro
def calcular_shapiro(df_retornos, ativos):
  print('Resultados da Aplicação do Teste Shapiro-Wilk')
  for i in ativos:
    resultado_shapiro = shapiro(df_retornos[i])
    if resultado_shapiro[1] <= 0.05:
      print('Ativo ' + str(i) + ': Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.')
    else:
      print('Ativo ' + str(i) + ': Hipótese Nula Aceita, ou seja, provém de uma distribuição normal.')

In [58]:
calcular_shapiro(retornos, tickers)

Resultados da Aplicação do Teste Shapiro-Wilk
Ativo BBDC4.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.
Ativo ITUB4.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.
Ativo BBAS3.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.
Ativo SANB3.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.


## **Value at Risk**

> O VaR, ou Value at Risk, é um indicador de risco que estima a perda potencial máxima de um investimento para um período de tempo, com um determinado intervalo de confiança. Ou seja, através de um cálculo estatístico, o VaR mostra a exposição ao risco financeiro que um ou mais ativos possuem em determinado dia, semana ou mês.


### **VaR Histórico**

> O VaR Não Paramétrico é um cálculo que exclui as hipóteses e estimativas sobre a distribuição do retorno dos ativos. Nesse caso, para calcular as possíveis perdas financeiras que um investimento pode ter, é utilizado como base o rendimento histórico dos próprios retornos.

In [59]:
def calcular_var_historico(df_retornos, ativos, conf):
  var = {}
  for i in ativos:
    var[i] = np.nanpercentile(df_retornos[i], conf)
  return var

In [60]:
var_90 = calcular_var_historico(retornos, tickers, 10)
var_95 = calcular_var_historico(retornos, tickers, 5)
var_99 = calcular_var_historico(retornos, tickers, 1)
print('VaR Histórico')
print('VaR 90')
print(var_90)
print('VaR 95')
print(var_95)
print('VaR 99')
print(var_99)

VaR Histórico
VaR 90
{'BBDC4.SA': -0.02572099774025096, 'ITUB4.SA': -0.02496047037145642, 'BBAS3.SA': -0.028311694083634008, 'SANB3.SA': -0.03490172249049726}
VaR 95
{'BBDC4.SA': -0.034589036341967486, 'ITUB4.SA': -0.03543451344763069, 'BBAS3.SA': -0.03794365789734997, 'SANB3.SA': -0.046505609042523446}
VaR 99
{'BBDC4.SA': -0.07203841147057043, 'ITUB4.SA': -0.06037736394611712, 'BBAS3.SA': -0.0761786110875777, 'SANB3.SA': -0.08570773201438343}


### **VaR Paramétrico**

> O VaR Paramétrico, também chamado de método analítico ou método variância-covariância, é um cálculo que utiliza rentabilidades estimadas e pressupõe que esses dados seguem uma distribuição normal.

In [61]:
from scipy.stats import norm
def calcular_var_parametrico(df_retornos, ativos, conf):
  for i in ativos:
    media_retorno = np.mean(df_retornos[i])
    desvio_padrao = np.std(df_retornos[i])
    var = norm.ppf(conf/100, media_retorno, desvio_padrao)
    print('VaR Paramétrico do ativo ' + str(i) +': ' + str(var))

In [62]:
var_90 = calcular_var_parametrico(retornos, tickers, 10)

VaR Paramétrico do ativo BBDC4.SA: -0.032459652927161825
VaR Paramétrico do ativo ITUB4.SA: -0.02877042549228682
VaR Paramétrico do ativo BBAS3.SA: -0.03713926049992266
VaR Paramétrico do ativo SANB3.SA: -0.040585290442416454


# **Módulo 3**

## **Bibliotecas**

In [63]:
import pandas as pd
import pandas_datareader as wb
import numpy as np
import plotly.express as px
import plotly.graph_objects as go

## **Índice Beta**

> O Índice Beta é um indicador muito utilizado na análise fundamentalista, sendo bastante difundido entre os investidores, que tem como objetivo mensurar a sensibilidade de um ativo em comparação com o índice de referência do mercado.

### **Interpretação do Beta**


>A título de ilustração, um Beta de 1,6, por exemplo, indica que se um índice de mercado qualquer subir 10%, espera-se que o retorno da carteira em questão seja de 16% (1,6x). Da mesma forma, se o índice de mercado vir a cair 10%, entende-se que o retorno da carteira seja de -16%.

### **Importando dados dos ativos**

In [64]:
tickers2 = ['^BVSP', 'ITSA4.SA']
carteira2 = importar_ativos(tickers2, '2018-01-01')
carteira2.head()

Unnamed: 0_level_0,^BVSP,ITSA4.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2018-01-02,77891.0,8.320365
2018-01-03,77995.0,8.41843
2018-01-04,78647.0,8.57684
2018-01-05,79071.0,8.591928
2018-01-08,79379.0,8.584383


### **Calculando os Retornos**

In [65]:
retornos2 = calcular_retornos(carteira2)
retornos2.head()

Unnamed: 0_level_0,^BVSP,ITSA4.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2018-01-03,0.001335,0.011786
2018-01-04,0.00836,0.018817
2018-01-05,0.005391,0.001759
2018-01-08,0.003895,-0.000878
2018-01-09,-0.006488,-0.015817


### **Beta calculado através método Covariância / Variância**

In [66]:
def calcular_beta_cov_var(df_retornos, ativos):
  # 1º Calcular a variância
  var = df_retornos[ativos[0]].var()
  # 2º Matriz de covariância
  cov = df_retornos.cov()
  coef_cov = cov.iloc[0,1]
  # 3º Calcular o Beta
  beta = coef_cov/var
  return beta

In [67]:
beta_cov_var = calcular_beta_cov_var(retornos2, tickers2)
beta_cov_var

0.9417488820395483

### **Beta calculado através da Regressão Linear**

In [68]:
import statsmodels.api as sm

In [69]:
def calcular_beta_regressao(X, Y):
  X = sm.add_constant(X)
  modelo = sm.OLS(Y, X)
  resultado = modelo.fit()
  resultado = resultado.params
  return resultado

In [70]:
# Construindo variáveis X (independente) e Y (dependente)
Y = retornos2['ITSA4.SA']
X = retornos2['^BVSP']

In [71]:
beta_regressao = calcular_beta_regressao(X, Y)
beta_regressao['^BVSP']

0.9417488820395488

### **Rolling Beta**

In [72]:
from statsmodels.regression.rolling import RollingOLS

In [73]:
def calcular_rolling_beta(X, Y):
  modelo = RollingOLS( Y, X, window=60)
  resultado = modelo.fit()
  resultado = resultado.params
  resultado.dropna(inplace=True)
  return resultado

In [74]:
rolling_beta = calcular_rolling_beta(X, Y)

In [75]:
px.line(x = rolling_beta.index, y = rolling_beta['^BVSP'], title = "Rolling Beta", labels={'x':'Data','y':'Beta'})

## **Portfólio e Risco**

### **Importando dados dos ativos**

In [76]:
tickers_portfolio = ['ITSA4.SA', 'WEGE3.SA', 'BBAS3.SA', 'EGIE3.SA']
pesos = np.array([0.25,0.25,0.25,0.25])

In [77]:
df_portfolio = importar_ativos(tickers_portfolio, '2016-01-01')

In [78]:
df_portfolio.head()

Unnamed: 0_level_0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2016-01-04,3.965802,10.292249,11.239093,18.353394
2016-01-05,4.0319,10.791398,11.278558,18.57255
2016-01-06,4.067952,10.54534,11.278558,18.297195
2016-01-07,4.007864,10.243039,11.010206,17.870111
2016-01-08,4.007864,10.193828,11.010206,17.617228


In [79]:
plotar_ativos_normalizados(df_portfolio, tickers_portfolio)

### **Retornos dos Ativos**

In [80]:
retorno_ativos_portfolio = calcular_retornos(df_portfolio)

In [81]:
plotar_histogramas_retornos(retorno_ativos_portfolio, tickers_portfolio)

### **Retorno Acumulado dos Ativos**

In [82]:
def calcular_retorno_acumulado(df_retornos):
  retorno_acumulado = (1 + df_retornos).cumprod()
  return retorno_acumulado  

In [83]:
retorno_acumulado_ativos = calcular_retorno_acumulado(retorno_ativos_portfolio)
plotar_ativos(retorno_acumulado_ativos, tickers_portfolio)

### **Retorno da Carteira**

In [84]:
def calcular_retorno_carteira(df_retornos, ativos):
  retorno_carteira = pd.DataFrame(columns=['Retorno'])
  retorno_carteira['Retorno'] = (df_retornos * pesos).sum(axis=1)
  return retorno_carteira

In [85]:
retorno_portfolio = calcular_retorno_carteira(retorno_ativos_portfolio, pesos)
px.histogram(x = retorno_portfolio['Retorno'], labels={'x':'Retornos'}, title='Distribuição do retorno da carteira', nbins=60)

### **Retorno Acumulado da Carteira**

In [86]:
def calcular_retorno_acumulado_carteira(df_retornos, pesos):
  retorno_acumulado = calcular_retorno_acumulado(df_retornos)
  retorno_acum_carteira = pd.DataFrame(columns=['Carteira'])
  retorno_acum_carteira['Carteira'] = (retorno_acumulado * pesos).sum(axis=1)
  return retorno_acum_carteira

In [87]:
retorno_acumulado_portfolio = calcular_retorno_acumulado_carteira(retorno_ativos_portfolio, pesos)
px.line(x = retorno_acumulado_portfolio.index, y = retorno_acumulado_portfolio['Carteira'], title='Retorno Acumulado da Carteira de Ativos durante o Período', labels={'x':'Data', 'y':'Retorno Acumulado'})

### **Volatilidade da Carteira**

In [88]:
def calcular_volatilidade_carteira(df_retornos):
  #1º calcular a matriz de covariância
  matriz_cov = df_retornos.cov()
  #Calcular a volatilidade
  vol_carteira = np.sqrt(np.dot(pesos.T, np.dot(matriz_cov, pesos)))
  #Vol Carteira Ano
  vol_carteira_ano = vol_carteira*np.sqrt(252)
  return vol_carteira, vol_carteira_ano

In [89]:
volatilidade_portfolio, volatilidade_portfolio_ano = calcular_volatilidade_carteira(retorno_ativos_portfolio)
print('Volatilidade do Portfólio: ' + str(volatilidade_portfolio))
print('Volatilidade do Portfólio no Ano: ' + str(volatilidade_portfolio_ano))

Volatilidade do Portfólio: 0.018011770930640533
Volatilidade do Portfólio no Ano: 0.28592799932602364


### **IBOV**

In [90]:
ibov = importar_ativos(['^BVSP'], '2016-01-01')
ibov_retornos = calcular_retornos(ibov)
ibov_acumulado = calcular_retorno_acumulado(ibov_retornos)

In [91]:
plotar_ativos(pd.concat([ibov_acumulado, retorno_acumulado_portfolio]), ['^BVSP', 'Carteira'])

### **Beta Carteira**

In [92]:
base = pd.merge(retorno_portfolio, ibov_retornos, how='inner', left_index=True, right_index=True )
Y = base['Retorno']
X = base['^BVSP']
beta_carteira = calcular_beta_regressao(X, Y)
beta_carteira[1]

0.9264712099860299

### **VaR Histórico**

In [93]:
var_95 = calcular_var_historico(retorno_portfolio, ['Retorno'], 5)
var_98 = calcular_var_historico(retorno_portfolio, ['Retorno'], 2)
var_99 = calcular_var_historico(retorno_portfolio, ['Retorno'], 1)
print('VaR Histórico')
print('VaR 95: ' + str(var_95['Retorno']))
print('VaR 98: ' + str(var_98['Retorno']))
print('VaR 99: ' + str(var_99['Retorno']))

VaR Histórico
VaR 95: -0.024420695777760383
VaR 98: -0.037277737563635685
VaR 99: -0.04778138695755926


## **Exercícios**

### **Exercício 1**

> Fazer os quatro momentos para o portfólio (média, desvpad, skewness-assimetria, curtose)

***Média***

In [94]:
# Média e Desvio Padrão dos retornos da carteira
media_portfolio = retorno_portfolio.mean()
desvpad_portfolio = retorno_portfolio.std()
print('Média:\n' + str(media_portfolio))
print('\nDesvio Padrão:\n' + str(desvpad_portfolio))

Média:
Retorno    0.001167
dtype: float64

Desvio Padrão:
Retorno    0.018012
dtype: float64


In [95]:
# Média dos ativos que compõem a carteira
media_ativos_portfolio = retorno_ativos_portfolio.mean()
desvpad_ativos_portfolio = retorno_ativos_portfolio.mean()
print('Média dos Ativos:\n' + str(media_ativos_portfolio))
print('\nDesvio Padrão dos Ativos:\n' + str(desvpad_ativos_portfolio))

Média dos Ativos:
ITSA4.SA    0.000957
WEGE3.SA    0.001790
BBAS3.SA    0.001205
EGIE3.SA    0.000718
dtype: float64

Desvio Padrão dos Ativos:
ITSA4.SA    0.000957
WEGE3.SA    0.001790
BBAS3.SA    0.001205
EGIE3.SA    0.000718
dtype: float64


***Média Móvel***

In [96]:
# Média Móvel dos Retornos da Carteira em uma janela de 60 dias
media_movel_portfolio = calcular_media_movel(retorno_portfolio, 60)
plotar_ativos(media_movel_portfolio, ['Retorno'])

In [97]:
# Média Móvel dos Retornos dos Ativos da Carteira em uma janela de 60 dias
media_movel_ativos_portfolio = calcular_media_movel(retorno_ativos_portfolio, 60)
plotar_retornos(media_movel_ativos_portfolio, tickers_portfolio)

***Skewness***

In [98]:
# Skewness dos ativos
calcular_skewness(retorno_ativos_portfolio, tickers_portfolio)

{'BBAS3.SA': -0.2272924660932407,
 'EGIE3.SA': 0.07882229403992864,
 'ITSA4.SA': -0.12772189732538036,
 'WEGE3.SA': -0.46255669169696834}

In [99]:
# Skewness do portfólio
calcular_skewness(retorno_portfolio, ['Retorno'])

{'Retorno': -0.7360172715069395}

***Curtose***

In [100]:
# Curtose dos ativos
calcular_kurtose(retorno_ativos_portfolio, tickers_portfolio)

{'BBAS3.SA': 8.516168474767571,
 'EGIE3.SA': 4.459239726415114,
 'ITSA4.SA': 3.3846098639113515,
 'WEGE3.SA': 9.596702801406876}

In [101]:
# Curtose do portfólio
calcular_kurtose(retorno_portfolio, ['Retorno'])

{'Retorno': 7.331059742287605}

### **Exercício 2**

> Calcular Rolling beta

In [102]:
''' X e Y definidos anteriormente
base = pd.merge(retorno_portfolio, ibov_retornos, how='inner', left_index=True, right_index=True )
Y = base['Retorno']
X = base['^BVSP']''' 

rolling_beta_portfolio = calcular_rolling_beta(X, Y)
px.line(x = rolling_beta_portfolio.index, y = rolling_beta_portfolio['^BVSP'], title = "Rolling Beta", labels={'x':'Data','y':'Beta'})

### **Exercício 3**

>Calcular o VaR Paramétrico

In [103]:
var_parametrico_ativos = calcular_var_parametrico(retorno_ativos_portfolio, tickers_portfolio, 10)

VaR Paramétrico do ativo ITSA4.SA: -0.025470214549962417
VaR Paramétrico do ativo WEGE3.SA: -0.027980345737537493
VaR Paramétrico do ativo BBAS3.SA: -0.03679407228100963
VaR Paramétrico do ativo EGIE3.SA: -0.01959450767918771


In [104]:
var_parametrico_portfolio = calcular_var_parametrico(retorno_portfolio, ['Retorno'], 10)

VaR Paramétrico do ativo Retorno: -0.02190654814908818


# **Módulo 4**

In [105]:
carteira_passado = importar_ativos(tickers_portfolio, '2016-01-01', '2018-12-31')
carteira_futuro = importar_ativos(tickers_portfolio, '2019-01-01', '2020-12-31')

In [106]:
carteira_passado.head()

Unnamed: 0_level_0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2016-01-04,3.965802,10.292249,11.239093,18.353394
2016-01-05,4.0319,10.791398,11.278558,18.57255
2016-01-06,4.067952,10.54534,11.278558,18.297195
2016-01-07,4.007864,10.243039,11.010206,17.870111
2016-01-08,4.007864,10.193828,11.010206,17.617228


In [107]:
carteira_futuro.head()

Unnamed: 0_level_0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2019-01-02,11.316626,17.48259,43.189178,30.523008
2019-01-03,11.41503,17.881248,43.366913,31.524355
2019-01-04,11.379249,18.08544,43.366913,32.201157
2019-01-07,11.370299,17.803463,43.082542,32.001717
2019-01-08,11.522383,17.657612,42.593777,32.364338


## **Estimando Retornos**

### ***Média Retorno Histórico***

> Calcula a média anualizada do retorno histórico dos preços (diários). Usar o argumento compounding para mudar de média geométrica para média aritmética

In [108]:
from pypfopt import expected_returns

In [109]:
# Retorno Médio Out of Sample
retorno_medio_f = expected_returns.mean_historical_return(carteira_futuro)
retorno_medio_f

ITSA4.SA    0.015667
WEGE3.SA    1.110898
BBAS3.SA   -0.060650
EGIE3.SA    0.204708
dtype: float64

In [110]:
# Retorno Médio In Sample
retorno_medio = expected_returns.mean_historical_return(carteira_passado)
retorno_medio

ITSA4.SA    0.402391
WEGE3.SA    0.185749
BBAS3.SA    0.551409
EGIE3.SA    0.173916
dtype: float64

In [111]:
#Erro Médio Absoluto (Mean Absolut Error)
#|retorno_passado - retorno_futuro|/(n_retorno_passado)
ema_retorno_medio = np.sum(np.abs(retorno_medio-retorno_medio_f))/len(retorno_medio)
ema_retorno_medio

0.48868087724362147

### **Média Móvel Exponencial**

> Calcula a média móvel exponencial dos preços diários. O argumento compounding altera de geométrico para aritmético e o argumento span altera o tamanho da janela (span=500). Deixar uma janela maior se o objetivo for hold ou menor se for capturar tendências de curto prazo

In [112]:
#Media Móvel Exponencial - Out Of Sample
mme_f = expected_returns.ema_historical_return(carteira_futuro, span=700)
mme_f

ITSA4.SA    0.157563
WEGE3.SA    1.445097
BBAS3.SA    0.136682
EGIE3.SA    0.192046
Name: 2020-12-30 00:00:00, dtype: float64

In [113]:
#Media Móvel Exponencial - In Sample
mme = expected_returns.ema_historical_return(carteira_passado, span=700)
mme

ITSA4.SA    0.408084
WEGE3.SA    0.177613
BBAS3.SA    0.675855
EGIE3.SA    0.255601
Name: 2018-12-28 00:00:00, dtype: float64

In [114]:
#Erro Médio Absoluto MME
ema_mme = np.sum(np.abs(mme-mme_f))/len(mme)
ema_mme

0.5301837035254888

### **Retorno CAPM**

> Os retornos são calculados com base no modelo CAPM. Necessita dos inputs taxa livre de risco (risk_free_rate) e dos preços de fechamento de mercado (ibovespa)

Retorno_Esperado_Capm = Rf + B(Rm-Rf)

In [115]:
# 1º calcular a selic diária
selic_aa = 0.019
selic_diaria = (1+selic_aa)**(1/252) -1
selic_diaria

7.469229028500557e-05

In [116]:
# 2º Chamando Ibovespa
ibov_in = importar_ativos(['^BVSP'], '2016-01-01', '2018-12-31')
ibov_out = importar_ativos(['^BVSP'], '2019-01-01', '2020-12-31')

In [117]:
# CAPM Out of Sample
capm_f = expected_returns.capm_return(carteira_futuro, market_prices=ibov_out, risk_free_rate=selic_diaria)
capm_f

ITSA4.SA    0.129021
WEGE3.SA    0.119083
BBAS3.SA    0.183427
EGIE3.SA    0.088691
Name: mkt, dtype: float64

In [118]:
# CAPM in sample
capm = expected_returns.capm_return(carteira_passado, market_prices=ibov_in, risk_free_rate=selic_diaria)
capm

ITSA4.SA    0.318074
WEGE3.SA    0.189692
BBAS3.SA    0.459574
EGIE3.SA    0.154829
Name: mkt, dtype: float64

In [119]:
# Erro Médio Absoluto CAPM
mae_capm = np.sum(np.abs(capm-capm_f))/len(capm)
mae_capm

0.15048662602790586

## **Modelos de Risco (Matrizes de Covariância)**

> Estimar as matrizes de covariância com base no histórico passado. Utilizaremos os mesmos métodos de in-sample e out-of-sample para medir o desempenho

In [120]:
# Importando o método risk_models
from pypfopt import risk_models

### **Sample Covariance**

> Matriz de covariância da amostra de preços (inputs preços diários)

In [121]:
#Sample Cov out-of-sample
sample_cov_f = risk_models.sample_cov(carteira_futuro)
sample_cov_f

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.127435,0.068655,0.144433,0.066178
WEGE3.SA,0.068655,0.203323,0.094671,0.058356
BBAS3.SA,0.144433,0.094671,0.237978,0.088446
EGIE3.SA,0.066178,0.058356,0.088446,0.097214


In [122]:
# Sample Cov in-sample
sample_cov = risk_models.sample_cov(carteira_passado)
sample_cov

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.091226,0.039449,0.106221,0.033679
WEGE3.SA,0.039449,0.08497,0.046931,0.023378
BBAS3.SA,0.106221,0.046931,0.209885,0.048375
EGIE3.SA,0.033679,0.023378,0.048375,0.040234


In [123]:
# Mean Absolut Error
mae_sample_cov = np.sum(np.abs(np.diag(sample_cov)-np.diag(sample_cov_f))/len(np.diag(sample_cov)))
mae_sample_cov

0.05990859201028418

### **Semicovariance**

>Calcular a matriz de covariância a partir dos inputs de preço dentro de um determinado nível de risco chamado bechmark. 

>Para maiores informações: 
* Estrada(2006) - Mean-Semivariance Optimization: A Heuristic Approach 
* Rigamonti (2020) - Mean-Variance Optimization is a Good Choice, But for Other Reasons than you might think

In [124]:
#Semicovariance out of sample
semicov_f = risk_models.semicovariance(carteira_futuro, benchmark=0.02)
semicov_f 

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.208466,0.168597,0.22024,0.160502
WEGE3.SA,0.168597,0.229909,0.197304,0.154637
BBAS3.SA,0.22024,0.197304,0.279191,0.183771
EGIE3.SA,0.160502,0.154637,0.183771,0.175458


In [125]:
#Semicovariance in sample
semicov = risk_models.semicovariance(carteira_passado, benchmark=0.02)
semicov 

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.166384,0.133148,0.178457,0.126042
WEGE3.SA,0.133148,0.169675,0.146912,0.12015
BBAS3.SA,0.178457,0.146912,0.244662,0.142984
EGIE3.SA,0.126042,0.12015,0.142984,0.131786


In [126]:
# Mean Absolut Error Semicovariance
mae_semicov = np.sum(np.abs(np.diag(semicov)-np.diag(semicov_f))/len(np.diag(semicov)))
mae_semicov

0.04512943094431498

### **Exponentially-Weighted Covariance**

Retorna matriz de covariancia dentro de uma janela de tempo. Ela da peso maior às informações mais recentes através do argumento span (default=180 dias)

In [127]:
# EWC Out of Sample
exp_cov_f = risk_models.exp_cov(carteira_futuro)
exp_cov_f

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.126805,0.056358,0.136205,0.055731
WEGE3.SA,0.056358,0.208162,0.066231,0.053571
BBAS3.SA,0.136205,0.066231,0.204729,0.068372
EGIE3.SA,0.055731,0.053571,0.068372,0.083936


In [128]:
# EWC In Sample
exp_cov = risk_models.exp_cov(carteira_passado)
exp_cov

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.0979,0.037269,0.095409,0.033966
WEGE3.SA,0.037269,0.075251,0.023598,0.016934
BBAS3.SA,0.095409,0.023598,0.170383,0.042018
EGIE3.SA,0.033966,0.016934,0.042018,0.043901


In [129]:
# MAE Expo_Cov
mae_expcov = np.sum(np.abs(np.diag(exp_cov)-np.diag(exp_cov_f))/len(np.diag(exp_cov)))
mae_expcov

0.059049109160680374

### Ledoit Wolf Estimator

O objetivo dos estimadores shrinkage é reduzir o erro da previsão de matriz de covariância através de um parâmetro F (parametro shrinkage_target):
- constant_variance: diagonal da matriz de covariancia como sendo média das variancias do retorno (default)
- single_factor: baseado no Sharpe Factor Model - utiliza o Beta como parametro de achatamento
- constant_correlation: relacioando a matriz de correlação e desvio padrão da variância.

Referências:

Robert Marting: https://reasonabledeviations.com/notes/papers/ledoit_wolf_covariance/

Honey, I Shrunk the Sample Covariance Matrix: https://jpm.pm-research.com/content/30/4/110

Sharpe Factor Model: https://www.researchgate.net/publication/227357145_A_Simplified_Model_for_Portfolio_Analysis

______________________________________________________

Além do Ledoit Wolf a PyPortfolio conta com:
.oracle_approximating()
.shrunk_covariance()

In [130]:
# LW out of sample
lw_cov_f = risk_models.CovarianceShrinkage(carteira_futuro).ledoit_wolf()
lw_cov_f

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.129394,0.064618,0.135939,0.062287
WEGE3.SA,0.064618,0.200819,0.089103,0.054924
BBAS3.SA,0.135939,0.089103,0.233436,0.083245
EGIE3.SA,0.062287,0.054924,0.083245,0.10095


In [131]:
# LW in sample
lw_cov = risk_models.CovarianceShrinkage(carteira_passado).ledoit_wolf()
lw_cov

Unnamed: 0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
ITSA4.SA,0.091443,0.038523,0.103727,0.032889
WEGE3.SA,0.038523,0.085335,0.04583,0.02283
BBAS3.SA,0.103727,0.04583,0.207317,0.047239
EGIE3.SA,0.032889,0.02283,0.047239,0.041649


In [132]:
# MAE Ledoit Wolf
mae_lw = np.sum(np.abs(np.diag(lw_cov)-np.diag(lw_cov_f))/len(lw_cov))
mae_lw

0.059713565179256925