# **Python para o Mercado Financeiro**


**Bibliotecas que podem precisar de instalação**

In [None]:
#!pip install quandl
#!pip install "statsmodels==0.11.1"

# **Módulo 1**

## **Indicadores Macroeconômicos**

> Utilizando a biblioteca Quandl para importação dos dados macroeconômicos



### **Bibliotecas**

In [None]:
import quandl
import pandas as pd 
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from math import ceil

### **Acesso ao Google Drive**

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


### **Configurando acesso a Quandl**

In [None]:
arquivo = open('/content/drive/MyDrive/Colab Notebooks/Portfólio/Macroeconomia/Quandl_Key.txt', 'r')
key = arquivo.read()
arquivo.close()   

In [None]:
quandl.ApiConfig.api_key = key

### **PIB**

> O Produto Interno Bruto (PIB) é um indicador econômico que apresenta a soma de todos os bens e serviços produzidos em uma área geográfica em um determinado período. Sendo assim, ele representa a dinâmica econômica do lugar, a possibilitando a análise do crescimento econômico e também a oportunidade de comparações com outras localidades.


In [None]:
pib = quandl.get('ODA/BRA_NGDPD', start_date = '2000-01-01')
pib.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-12-31,655.435
2001-12-31,559.962
2002-12-31,509.358
2003-12-31,557.681
2004-12-31,668.432


In [None]:
px.line(pib,  x=pib.index, y=pib.values, title='PIB Histórico desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **Taxa Selic**

> ​A Selic é a taxa básica de juros da economia. É o principal instrumento de política monetária utilizado pelo Banco Central (BC) para controlar a inflação. Ela influencia todas as taxas de juros do país, como as taxas de juros dos empréstimos, dos financiamentos e das aplicações financeiras.

> A taxa Selic refere-se à taxa de juros apurada nas operações de empréstimos de um dia entre as instituições financeiras que utilizam títulos públicos federais como garantia. O BC opera no mercado de títulos públicos para que a taxa Selic efetiva esteja em linha com a meta da Selic definida na reunião do Comitê de Política Monetária do BC (Copom).

In [None]:
selic = quandl.get('BCB/432', start_date = '2000-01-01')
selic.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-01,19.0
2000-01-02,19.0
2000-01-03,19.0
2000-01-04,19.0
2000-01-05,19.0


In [None]:
px.line(selic,  x=selic.index, y=selic.values, title='Selic Histórica desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **IPCA**

> O IPCA é o Índice de Preços para o Consumidor Amplo. Esse importante índice é medido mensalmente pelo IBGE para identificar a variação dos preços no comércio. Ele é considerado, pelo Banco Central, o índice brasileiro oficial da inflação ou deflação.

> Ele funciona como um termômetro para a economia brasileira, reunindo informações que ajudam o consumidor a entender o que vai encontrar na hora da compra. E também serve como instrumento de correção de determinadas aplicações financeiras, que têm nele o seu índice de referência.

In [None]:
ipca = quandl.get('BCB/13522', start_date = '2000-01-01')
ipca.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,8.85
2000-02-29,7.86
2000-03-31,6.92
2000-04-30,6.77
2000-05-31,6.47


In [None]:
px.line(ipca,  x=ipca.index, y=ipca.values, title='IPCA Histórico desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **IGPM**

> O Índice Geral de Preços Mercado (IGP-M) é um indicador que mede a variação de preços para reajuste de contratos de aluguéis, energia elétrica e telefonia, por exemplo. Calculado mensalmente pela Fundação Getúlio Vargas, ele sofre influências de outros indicadores e do dólar para seu cálculo. 

> O cálculo do IGP-M tem em conta a variação de preços de bens e serviços, bem como de matérias-primas utilizadas na produção agrícola, industrial e construção civil. Dessa forma, o resultado do IGP-M é a média aritmética ponderada da inflação ao produtor (IPA), consumidor (IPC) e construção civil (INCC). Sendo os pesos, respectivamente, 60%, 30% e 10%.

In [None]:
igpm = quandl.get("BCB/189", start_date = '2000-01-01')
igpm.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,1.24
2000-02-29,0.35
2000-03-31,0.15
2000-04-30,0.23
2000-05-31,0.31


In [None]:
px.line(igpm,  x=igpm.index, y=igpm.values, title='IGPM Histórico desde 01/01/2000', labels={'x':'Data', 'y':'Valor'})

### **Comparando os valores históricos do IPCA, IGPM e Selic**

In [None]:
fig = go.Figure()
# IPCA
fig.add_trace(go.Scatter(x = ipca.index, 
                    y = ipca['Value'], 
                    name='IPCA'))
# Selic
fig.add_trace(go.Scatter(x = selic.index, 
                    y = selic['Value'], 
                    name='Selic'))
# IGPM
fig.add_trace(go.Scatter(x = igpm.index, 
                    y = igpm['Value'], 
                    name='IGPM'))
# Alterando Layout
fig.update_layout(xaxis = dict(title = 'Data'),
                  yaxis = dict(title = 'Valor'),
                  title = 'Comparando os valores históricos do IPCA, IGPM e Selic',
                  legend = dict( bgcolor = "LightSteelBlue"), 
                  legend_orientation = "h")
fig.show()

### **Cesta Básica**

> O Departamento Intersindical de Estatística e Estudos Socieconômicos (Dieese) estabeleceu uma lista de produtos considerados essenciais para que um adulto possa cuidar de sua higiene pessoal e se alimentar de forma adequada. A essa relação de produtos, foi dado o nome de cesta básica.

> O acompanhamento do custo dos itens da Cesta Básica Nacional começou em janeiro de 1959 e continua desde então. Recentemente, a pesquisa é realizada em 18 capitais brasileiras, onde mensalmente revela a evolução de valores de 13 produtos de alimentação, assim como o gasto mensal que uma pessoa teria para compra-los.

> A quantidade de ingredientes da cesta básica no Brasil pode variar de acordo com a região, mas o Dieese estabelece basicamente os seguintes alimentos: leite, feijão, arroz, farinha, batata, tomate, pão francês ou de forma, café em pó, açúcar, óleo ou banha, manteiga e frutas (banana/maçã).

In [None]:
cesta_basica_BH = quandl.get('BCB/7481', start_date = '2000-01-01')
cesta_basica_BH.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,104.3
2000-02-29,107.4
2000-03-31,110.8
2000-04-30,110.28
2000-05-31,103.28


In [None]:
cesta_basica_SP = quandl.get('BCB/7493', start_date = '2000-01-01')
cesta_basica_SP.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2000-01-31,112.22
2000-02-29,110.8
2000-03-31,115.13
2000-04-30,115.92
2000-05-31,111.78


In [None]:
fig = go.Figure()
# Cesta Básica de BH
fig.add_trace(go.Scatter(x = cesta_basica_BH.index, 
                    y = cesta_basica_BH['Value'], 
                    name='Cesta Básica de BH'))
# Cesta Básica de SP
fig.add_trace(go.Scatter(x = cesta_basica_SP.index, 
                    y = cesta_basica_SP['Value'], 
                    name='Cesta Básica de SP'))
# Alterando o Layout
fig.update_layout(xaxis = dict(title = 'Data'),
                  yaxis = dict(title = 'Valor'),
                  title = 'Comparando os valores históricos da Cesta Básica em Belo Horizonte e São Paulo',
                  legend = dict( bgcolor = "LightSteelBlue"), 
                  legend_orientation = "h")
fig.show()

### **Dólar Comercial**

> O dólar comercial faz referências às transações comerciais, por exemplo compra e venda de mercadorias e serviços entre empresas. É aquele utilizado para balizar as grandes movimentações de importação e exportação das empresas brasileiras e também é a cotação considerada nas ações do governo no exterior, como empréstimos (registrados no Banco Central) de brasileiros residentes em outros países.

> O valor é negociado entre bancos e empresas, mas o Banco Central brasileiro impõe um certo controle para não deixar que suba demais o preço (o que descontrola as importações e desvaloriza o real), ou que o câmbio desça demais, o que afeta diretamente as exportações.


In [None]:
dolar = quandl.get('BCB/10813', start_date = '2007-01-01')
dolar.head()

Unnamed: 0_level_0,Value
Date,Unnamed: 1_level_1
2007-01-02,2.1334
2007-01-03,2.1364
2007-01-04,2.1421
2007-01-05,2.1466
2007-01-08,2.1497


In [None]:
px.line(dolar,  x=dolar.index, y=dolar.values, title='Dólar Histórico desde 01/01/2007', labels={'x':'Data', 'y':'Valor'})

## **Risco**

In [None]:
import pandas_datareader as wb

In [None]:
ibov = wb.DataReader('^BVSP', data_source='yahoo', start='2008-01-01')
ibov.head()

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2008-01-02,63906.0,62659.0,63885.0,62815.0,2980200.0,62815.0
2008-01-03,63129.0,62556.0,62814.0,62892.0,1895800.0,62892.0
2008-01-04,63436.0,60574.0,62898.0,61037.0,2613800.0,61037.0
2008-01-07,61505.0,60092.0,61054.0,60772.0,2223400.0,60772.0
2008-01-08,62650.0,60771.0,60771.0,62081.0,3314000.0,62081.0


In [None]:
ibov = wb.DataReader('^BVSP', data_source='yahoo', start='2008-01-01')
ibov.rename(columns = {'Adj Close': "IBOV"}, inplace = True)
ibov.drop(columns = ['High', 'Low', 'Open', 'Close', 'Volume'], axis=1, inplace=True)
ibov.head()

Unnamed: 0_level_0,IBOV
Date,Unnamed: 1_level_1
2008-01-02,62815.0
2008-01-03,62892.0
2008-01-04,61037.0
2008-01-07,60772.0
2008-01-08,62081.0


In [None]:
px.line(ibov,  x=ibov.index, y=ibov.values, title='Valores históricos do IBOVESPA desde 01/01/2008', labels={'x':'Data', 'y':'Valor'})

In [None]:
ibov_retornos = ibov.pct_change()
ibov_retornos.head()

Unnamed: 0_level_0,IBOV
Date,Unnamed: 1_level_1
2008-01-02,
2008-01-03,0.001226
2008-01-04,-0.029495
2008-01-07,-0.004342
2008-01-08,0.02154


In [None]:
px.histogram(ibov_retornos, x='IBOV', nbins=60)

In [None]:
ibov_retornos.std()

IBOV    0.01811
dtype: float64

## **Finanças Básicas**

### **Valor Presente - Quanto vale hoje uma opção de receber um fluxo de caixa futuro**
Qual seria o valor presente de 10000,00 reais para receber daqui a 10 anos sendo que meu custo de oportunidade hoje é de 8%?

In [None]:
# VP = VF/(1+i)^n

n = 10
valor_futuro = 10000
i = 0.08

VP = valor_futuro/(1+i)**n

print(VP)

4631.934880846841


### **Financiar ou comprar a vista?**
Valor do carro 10000,00 - opção 1: pagar à vista, opção 2: financiar em 5 prestações anuais de 3000,00 à uma taxa de 12%a.a.

In [None]:
##PMT * [((1-(1/(1+i)^n))/n)]

op_1 = 10000
n = 5
PMT = 3000
i = 0.12

VP = PMT*(((1-(1/(1+i)**n))/i))

print(VP)

10814.32860703502


### **Perpetuidade ou série infinita**
Ativo que pagará para sempre uma taxa fixa de 9% a.a. e que custa hoje 100000

In [None]:
#Perpetuidade = valor do ativo/taxa

valor_ativo = 100000
taxa = 0.09

VP = valor_ativo/taxa

print(VP)

1111111.1111111112


### **Perpetuidade crescente**
* Série de pagamentos que cresce à uma taxa constante
* Uma ação que paga 4 reais de dividendos anualmente e os dividendos crescem a uma taxa de 1% a.a., qual seria o valor presente dessa ação? Seu custo de oportunidade é de 8%a.a.

In [None]:
## Perpetuidade crescente = Recebimento esperado para o próx ano/(Taxa de desconto - Taxa de crescimento esperada)

taxa_cresc = 0.01
rec_esp = 4*(1+taxa_cresc)
i = 0.08

perp_cresc = rec_esp/(i-taxa_cresc)

print(perp_cresc)

57.71428571428571


# **Módulo 2**

In [None]:
import pandas as pd
import pandas_datareader as wb
import numpy as np
import plotly.express as px
import plotly.graph_objects as go

## **Ativos**

### **Importando dados dos ativos**

In [None]:
tickers = ['BBDC4.SA', 'ITUB4.SA', 'BBAS3.SA', 'SANB3.SA']

In [None]:
def importar_ativos(ativos, data_inicio = None, data_fim = None):
  # Criando o dataframe e preenchendo com dados do primeiro ativos
  df_ativos = pd.DataFrame()
  df_ativos = wb.DataReader(ativos[0], data_source='yahoo', start=data_inicio, end=data_fim)
  df_ativos.drop(columns=['High', 'Low', 'Open', 'Close', 'Volume'], axis=1, inplace=True)
  df_ativos.rename({"Adj Close":str(ativos[0])}, axis=1, inplace=True)
  # Completando o dataframe com dados dos outros ativos
  for i in ativos[1:]:
    df = wb.DataReader(i, data_source='yahoo', start=data_inicio, end=data_fim)
    df.drop(columns=['High', 'Low', 'Open', 'Close', 'Volume'], axis=1, inplace=True)
    df.rename({"Adj Close":str(i)}, axis=1, inplace=True)
    df_ativos = pd.concat([df_ativos, df], join='inner', axis=1)
  # Retornando resultado
  return df_ativos

In [None]:
carteira = importar_ativos(tickers, '2018-01-01')
carteira.head()

Unnamed: 0_level_0,BBDC4.SA,ITUB4.SA,BBAS3.SA,SANB3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2018-01-02,20.790091,25.48287,28.483847,16.119589
2018-01-03,20.885672,25.657097,28.847137,15.965904
2018-01-04,21.228357,26.191376,29.123938,15.667076
2018-01-05,21.348597,26.266874,29.123938,15.684154
2018-01-08,21.342588,26.17976,29.193134,16.338699


### **Plotando séries históricas dos ativos**

In [None]:
def plotar_ativos(df_ativos, ativos):
  fig = go.Figure()
  for i in ativos:
    # Ativos com preços normais
    fig.add_trace(go.Scatter(x = df_ativos.index, 
                        y = df_ativos[i],
                        legendgroup='normal',
                        name=i))
  # Propriedade do Eixo X
  fig.update_xaxes(title_text="Data")
  
  # Propriedade do Eixo Y
  fig.update_yaxes(title_text="Preço")
  fig.update_layout(title = 'Comparando os valores históricos dos ativos',
                    legend = dict(bgcolor = "LightSteelBlue", orientation="v"))
  fig.show()

In [None]:
plotar_ativos(carteira, tickers)

In [None]:
def plotar_ativos_normalizados(df_ativos, ativos):
  fig = make_subplots(rows=2, cols=1, start_cell="top-left")
  for i in ativos:
    # Ativos com preços normais
    fig.add_trace(go.Scatter(x = df_ativos.index, 
                        y = df_ativos[i],
                        legendgroup='normal',
                        name=i),
                        row=1, col=1)
    # Ativos com preços normalizados
    fig.add_trace(go.Scatter(x = df_ativos.index, 
                        y = df_ativos[i]/df_ativos[i][0], 
                        legendgroup='normalizado',
                        name=i + ' Normalizado'),
                        row=2, col=1)
  # Propriedade do Eixo X
  fig.update_xaxes(title_text="Data", row=1, col=1)
  fig.update_xaxes(title_text="Data", row=2, col=1)

  # Propriedade do Eixo Y
  fig.update_yaxes(title_text="Preço", row=1, col=1)
  fig.update_yaxes(title_text="Preço Normalizado", row=2, col=1)
  fig.update_layout(title = 'Comparando os valores históricos dos ativos',
                    legend = dict(bgcolor = "LightSteelBlue", orientation="v"))
  fig.show()

In [None]:
plotar_ativos_normalizados(carteira, tickers)

## **Volatilidade (Retornos)**

### **Calculando os Retornos**

In [None]:
def calcular_retornos(df_ativos):
  df_retornos = df_ativos.pct_change()
  df_retornos.dropna(inplace=True)
  return df_retornos

In [None]:
retornos = calcular_retornos(carteira)
retornos.head()

Unnamed: 0_level_0,BBDC4.SA,ITUB4.SA,BBAS3.SA,SANB3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2018-01-03,0.004597,0.006837,0.012754,-0.009534
2018-01-04,0.016408,0.020824,0.009595,-0.018717
2018-01-05,0.005664,0.002883,0.0,0.00109
2018-01-08,-0.000281,-0.003317,0.002376,0.041733
2018-01-09,-0.009296,-0.01087,-0.009481,-0.031892


### **Plotando os Retornos**

In [None]:
def plotar_retornos(df_retornos, ativos):
  fig = make_subplots(rows=ceil(len(ativos)/2), cols=2, start_cell="top-left")
  linha = 1
  coluna = 1
  for i in ativos:
    fig.add_trace(go.Scatter(x = df_retornos.index, 
                        y = df_retornos[i], 
                        name=i),
                        row=linha, col=coluna)
    fig.update_xaxes(title_text="Data", row=linha, col=coluna)
    fig.update_yaxes(title_text=i, row=linha, col=coluna)
    if coluna == 1:
      coluna = coluna + 1 
    else:
      linha = linha + 1
      coluna = 1

  fig.update_layout(title = 'Retornos dos ativos durante o período',
                   showlegend=False)
  fig.show()

In [None]:
plotar_retornos(retornos, tickers)

### **Plotando Histograma dos Retornos**

In [None]:
def plotar_histogramas_retornos(df_retornos, ativos):
  fig = make_subplots(rows=ceil(len(ativos)/2), cols=2, start_cell="top-left")
  linha = 1
  coluna = 1
  for i in ativos:
    fig.add_trace(go.Histogram(x = df_retornos[i],
                        nbinsx=50,
                        name=i),
                        row=linha, col=coluna)
    fig.update_xaxes(title_text='Retornos', row=linha, col=coluna)
    fig.update_yaxes(title_text=i, row=linha, col=coluna)
    if coluna == 1:
      coluna = coluna + 1 
    else:
      linha = linha + 1
      coluna = 1

  fig.update_layout(title = 'Distribuição dos retornos dos ativos durante o período',
                    showlegend = False)
  fig.show()

In [None]:
plotar_histogramas_retornos(retornos, tickers)

### **Calculando a Volatilidade Diária**

In [None]:
retornos.std()

BBDC4.SA    0.025636
ITUB4.SA    0.022464
BBAS3.SA    0.029028
SANB3.SA    0.032315
dtype: float64

In [None]:
retornos.describe()

Unnamed: 0,BBDC4.SA,ITUB4.SA,BBAS3.SA,SANB3.SA
count,768.0,768.0,768.0,768.0
mean,0.000578,0.000381,0.000635,0.000775
std,0.025636,0.022464,0.029028,0.032315
min,-0.142744,-0.098204,-0.166895,-0.126019
25%,-0.013616,-0.012822,-0.013506,-0.017866
50%,0.0,-0.000285,0.000199,0.0
75%,0.01306,0.013165,0.014366,0.018127
max,0.168669,0.110593,0.171261,0.185751


## **Downside Risk**

> O Downside Risk (DR) é uma estimativa do potencial de um título de sofrer uma queda no valor se as condições de mercado mudarem. Dependendo da medida usada, o risco de queda explica o pior cenário para um investimento ou indica quanto o investidor pode perder.

> Sortino e Van der Meer (1991) argumentam que o DR é uma medida superior de risco. Ele mede a distância média dos retornos abaixo de um ponto de corte, o Retorno Mínimo Aceitável (RMA), e por isso também é conhecido por below-target semideviation (SORTINO; VAN DER MEER, 1991). Portanto, o DR é um tipo de semi-variância, e mede somente a parte indesejável do risco, que é o risco para baixo.

![Downside Risk](https://www.researchgate.net/profile/Roberto_Moro_Visconti2/publication/228231157/figure/fig1/AS:668346659921923@1536357669279/Upside-and-downside-risk-as-a-consequence-of-project-revenues-volatility.png)

In [None]:
def calcular_downside_risk(df_retornos):
  downside_ativos = df_retornos[df_retornos < 0]
  downside_ativos = np.std(downside_ativos)
  return downside_ativos

In [None]:
downside_ativos = calcular_downside_risk(retornos)
downside_ativos

BBDC4.SA    0.017313
ITUB4.SA    0.014751
BBAS3.SA    0.020512
SANB3.SA    0.020141
dtype: float64

## **Janela de Móvel de Tempo**

> Determinar uma janela móvel de tempo, ou seja, determinar a um período de tempo a ser considerado para análise.

### **Volatilidade Móvel dos Retornos**

In [None]:
def calcular_volatilidade_movel(df, janela):
  df_volatilidade_movel = df.rolling(window=janela).std()
  df_volatilidade_movel.dropna(inplace=True)
  return df_volatilidade_movel

In [None]:
df_vol_movel_retornos = calcular_volatilidade_movel(retornos, 252)
plotar_retornos(df_vol_movel_retornos, tickers)

### **Média Móvel dos Retornos**

> Determinar a média móvel dos retornos em uma janela de tempo.

In [None]:
def calcular_media_movel(df, janela):
  df_media_movel = df.rolling(window=janela).mean()
  df_media_movel.dropna(inplace=True)
  return df_media_movel

In [None]:
df_media_movel_retornos = calcular_volatilidade_movel(retornos, 252)
plotar_retornos(df_media_movel_retornos, tickers)

## **Skewness**

> A assimetria se refere a uma distorção ou assimetria que se desvia da curva em sino simétrica, ou distribuição normal, em um conjunto de dados. Se a curva for deslocada para a esquerda ou para a direita, diz-se que está inclinada.

>Além da inclinação positiva e negativa, também se pode dizer que as distribuições têm inclinação zero ou indefinida. Na curva de uma distribuição, os dados do lado direito da curva podem diminuir de forma diferente dos dados do lado esquerdo. Esses afilamentos são conhecidos como "caudas". A inclinação negativa se refere a uma cauda mais longa ou mais larga no lado esquerdo da distribuição, enquanto a inclinação positiva se refere a uma cauda mais longa ou mais grossa à direita.

* Se v>0, então a distribuição tem uma cauda direita, valores acima da média
* Se v<0, então a distribuição tem uma cauda esquerda, valores abaixo da média
* Se v=0, então a distribuição é aproximadamente simétrica.

![Skewness](https://develve.net/files/grafskewness.gif)


In [None]:
from scipy.stats import skew
def calcular_skewness(df_retornos, ativos):
  skewness = {}
  for i in ativos:
    skewness[i] = skew(df_retornos[i])
  return skewness

In [None]:
skewness = calcular_skewness(retornos, tickers)
skewness

{'BBAS3.SA': 0.14852493706961317,
 'BBDC4.SA': 0.2788671311505358,
 'ITUB4.SA': 0.11650030713447594,
 'SANB3.SA': 0.38999678472381355}

## **Curtose**

> Denomina-se Curtose ao grau de “achatamento” de uma distribuição de frequências, geralmente unimodal, medido em relação ao de uma distribuição normal que é tomada como padrão. Muito embora seja comum explicar a curtose como o “grau de achatamento” de uma distribuição de freqüências, o que as medidas de curtose buscam indicar realmente é o grau de concentração de valores da distribuição em torno do centro desta distribuição.

> Numa distribuição unimodal, quanto maior for a concentração de valores em torno do centro da mesma, maior será o valor da sua curtose. Graficamente isto será associado a uma curva com a parte central mais afilada, mostrando um pico de freqüência simples mais destacado, mais
pontiagudo, caracterizando a moda da distribuição de forma mais nítida.

> Dizemos que uma distribuição de freqüências é:

* Leptocúrtica - quando apresenta uma medida de curtose maior que a da distribuição normal.
* Mesocúrtica – quando apresenta uma medida de curtose igual à da distribuição normal.
* Platicúrtica – quando apresenta uma medida de curtose menor que a da distribuição normal.

![Curtose](https://4.bp.blogspot.com/-CeSKUrvUsq4/W-3iepg3IEI/AAAAAAAAFFw/Dh79KCpgcGUk_Ra2WnxhArUJ7t4b1L21QCLcBGAs/s1600/curtose.JPG)


In [None]:
from scipy.stats import kurtosis
def calcular_kurtose(df_retornos, ativos):
  curtose = {}
  for i in ativos:
    curtose[i] = kurtosis(df_retornos[i])
  return curtose

In [None]:
curtose = calcular_kurtose(retornos, tickers)
curtose

{'BBAS3.SA': 7.772601918729324,
 'BBDC4.SA': 6.789817531661859,
 'ITUB4.SA': 2.415460218535305,
 'SANB3.SA': 3.292996666406677}

## **Teste de Shapiro-Wilk**

> Os testes de normalidade Shapiro-Wilk são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal. 


In [None]:
from scipy.stats import shapiro
def calcular_shapiro(df_retornos, ativos):
  print('Resultados da Aplicação do Teste Shapiro-Wilk')
  for i in ativos:
    resultado_shapiro = shapiro(df_retornos[i])
    if resultado_shapiro[1] <= 0.05:
      print('Ativo ' + str(i) + ': Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.')
    else:
      print('Ativo ' + str(i) + ': Hipótese Nula Aceita, ou seja, provém de uma distribuição normal.')

In [None]:
calcular_shapiro(retornos, tickers)

Resultados da Aplicação do Teste Shapiro-Wilk
Ativo BBDC4.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.
Ativo ITUB4.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.
Ativo BBAS3.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.
Ativo SANB3.SA: Hipótese Nula Rejeitada, ou seja, não provém de uma distribuição normal.


## **Value at Risk**

> O VaR, ou Value at Risk, é um indicador de risco que estima a perda potencial máxima de um investimento para um período de tempo, com um determinado intervalo de confiança. Ou seja, através de um cálculo estatístico, o VaR mostra a exposição ao risco financeiro que um ou mais ativos possuem em determinado dia, semana ou mês.


### **VaR Histórico**

> O VaR Não Paramétrico é um cálculo que exclui as hipóteses e estimativas sobre a distribuição do retorno dos ativos. Nesse caso, para calcular as possíveis perdas financeiras que um investimento pode ter, é utilizado como base o rendimento histórico dos próprios retornos.

In [None]:
def calcular_var_historico(df_retornos, ativos, conf):
  var = {}
  for i in ativos:
    var[i] = np.nanpercentile(df_retornos[i], conf)
  return var

In [None]:
var_90 = calcular_var_historico(retornos, tickers, 10)
var_95 = calcular_var_historico(retornos, tickers, 5)
var_99 = calcular_var_historico(retornos, tickers, 1)
print('VaR Histórico')
print('VaR 90')
print(var_90)
print('VaR 95')
print(var_95)
print('VaR 99')
print(var_99)

VaR Histórico
VaR 90
{'BBDC4.SA': -0.025449931716352504, 'ITUB4.SA': -0.02456785008881602, 'BBAS3.SA': -0.028123725927111543, 'SANB3.SA': -0.03489964172212619}
VaR 95
{'BBDC4.SA': -0.034262018645333146, 'ITUB4.SA': -0.035329307473879266, 'BBAS3.SA': -0.037192012732620607, 'SANB3.SA': -0.046468962841212054}
VaR 99
{'BBDC4.SA': -0.07206469950467208, 'ITUB4.SA': -0.054784938205069744, 'BBAS3.SA': -0.07356139118342757, 'SANB3.SA': -0.0859596599318071}


### **VaR Paramétrico**

> O VaR Paramétrico, também chamado de método analítico ou método variância-covariância, é um cálculo que utiliza rentabilidades estimadas e pressupõe que esses dados seguem uma distribuição normal.

In [None]:
from scipy.stats import norm
def calcular_var_parametrico(df_retornos, ativos, conf):
  for i in ativos:
    media_retorno = np.mean(df_retornos[i])
    desvio_padrao = np.std(df_retornos[i])
    var = norm.ppf(conf/100, media_retorno, desvio_padrao)
    print('VaR Paramétrico do ativo ' + str(i) +': ' + str(var))

In [None]:
var_90 = calcular_var_parametrico(retornos, tickers, 10)

VaR Paramétrico do ativo BBDC4.SA: -0.032254386621918235
VaR Paramétrico do ativo ITUB4.SA: -0.02838904270474986
VaR Paramétrico do ativo BBAS3.SA: -0.03654189373711107
VaR Paramétrico do ativo SANB3.SA: -0.040610458399984437


# **Módulo 3**

## **Bibliotecas**

In [None]:
import pandas as pd
import pandas_datareader as wb
import numpy as np
import plotly.express as px
import plotly.graph_objects as go

## **Índice Beta**

> O Índice Beta é um indicador muito utilizado na análise fundamentalista, sendo bastante difundido entre os investidores, que tem como objetivo mensurar a sensibilidade de um ativo em comparação com o índice de referência do mercado.

### **Interpretação do Beta**


>A título de ilustração, um Beta de 1,6, por exemplo, indica que se um índice de mercado qualquer subir 10%, espera-se que o retorno da carteira em questão seja de 16% (1,6x). Da mesma forma, se o índice de mercado vir a cair 10%, entende-se que o retorno da carteira seja de -16%.

### **Importando dados dos ativos**

In [None]:
tickers2 = ['^BVSP', 'ITSA4.SA']
carteira2 = importar_ativos(tickers2, '2018-01-01')
carteira2.head()

Unnamed: 0_level_0,^BVSP,ITSA4.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2018-01-02,77891.0,8.349963
2018-01-03,77995.0,8.448379
2018-01-04,78647.0,8.607349
2018-01-05,79071.0,8.622493
2018-01-08,79379.0,8.614923


### **Calculando os Retornos**

In [None]:
retornos2 = calcular_retornos(carteira2)
retornos2.head()

Unnamed: 0_level_0,^BVSP,ITSA4.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2018-01-03,0.001335,0.011786
2018-01-04,0.00836,0.018817
2018-01-05,0.005391,0.001759
2018-01-08,0.003895,-0.000878
2018-01-09,-0.006488,-0.015817


### **Beta calculado através método Covariância / Variância**

In [None]:
def calcular_beta_cov_var(df_retornos, ativos):
  # 1º Calcular a variância
  var = df_retornos[ativos[0]].var()
  # 2º Matriz de covariância
  cov = df_retornos.cov()
  coef_cov = cov.iloc[0,1]
  # 3º Calcular o Beta
  beta = coef_cov/var
  return beta

In [None]:
beta_cov_var = calcular_beta_cov_var(retornos2, tickers2)
beta_cov_var

0.9360048419609652

### **Beta calculado através da Regressão Linear**

In [None]:
import statsmodels.api as sm

In [None]:
def calcular_beta_regressao(X, Y):
  X = sm.add_constant(X)
  modelo = sm.OLS(Y, X)
  resultado = modelo.fit()
  resultado = resultado.params
  return resultado

In [None]:
# Construindo variáveis X (independente) e Y (dependente)
Y = retornos2['ITSA4.SA']
X = retornos2['^BVSP']

In [None]:
beta_regressao = calcular_beta_regressao(X, Y)
beta_regressao['^BVSP']

0.9360048419609652

### **Rolling Beta**

In [None]:
from statsmodels.regression.rolling import RollingOLS

In [None]:
def calcular_rolling_beta(X, Y):
  modelo = RollingOLS( Y, X, window=60)
  resultado = modelo.fit()
  resultado = resultado.params
  resultado.dropna(inplace=True)
  return resultado

In [None]:
rolling_beta = calcular_rolling_beta(X, Y)

In [None]:
px.line(x = rolling_beta.index, y = rolling_beta['^BVSP'], title = "Rolling Beta", labels={'x':'Data','y':'Beta'})

## **Portfólio e Risco**

### **Importando dados dos ativos**

In [None]:
tickers_portfolio = ['ITSA4.SA', 'WEGE3.SA', 'BBAS3.SA', 'EGIE3.SA']
pesos = np.array([0.25,0.25,0.25,0.25])

In [None]:
df_portfolio = importar_ativos(tickers_portfolio, '2016-01-01')

In [None]:
df_portfolio.head()

Unnamed: 0_level_0,ITSA4.SA,WEGE3.SA,BBAS3.SA,EGIE3.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2016-01-04,3.979911,10.338529,11.411618,18.353394
2016-01-05,4.046243,10.839916,11.451689,18.57255
2016-01-06,4.082425,10.592752,11.451689,18.297195
2016-01-07,4.022124,10.289095,11.179217,17.870111
2016-01-08,4.022124,10.239661,11.179217,17.617228


In [None]:
plotar_ativos_normalizados(df_portfolio, tickers_portfolio)

### **Retornos dos Ativos**

In [None]:
retorno_ativos_portfolio = calcular_retornos(df_portfolio)

In [None]:
plotar_histogramas_retornos(retorno_ativos_portfolio, tickers_portfolio)

### **Retorno Acumulado dos Ativos**

In [None]:
def calcular_retorno_acumulado(df_retornos):
  retorno_acumulado = (1 + df_retornos).cumprod()
  return retorno_acumulado  

In [None]:
retorno_acumulado_ativos = calcular_retorno_acumulado(retorno_ativos_portfolio)
plotar_ativos(retorno_acumulado_ativos, tickers_portfolio)

### **Retorno da Carteira**

In [None]:
def calcular_retorno_carteira(df_retornos, ativos):
  retorno_carteira = pd.DataFrame(columns=['Retorno'])
  retorno_carteira['Retorno'] = (df_retornos * pesos).sum(axis=1)
  return retorno_carteira

In [None]:
retorno_portfolio = calcular_retorno_carteira(retorno_ativos_portfolio, pesos)
px.histogram(x = retorno_portfolio['Retorno'], labels={'x':'Retornos'}, title='Distribuição do retorno da carteira', nbins=60)

### **Retorno Acumulado da Carteira**

In [None]:
def calcular_retorno_acumulado_carteira(df_retornos, pesos):
  retorno_acumulado = calcular_retorno_acumulado(df_retornos)
  retorno_acum_carteira = pd.DataFrame(columns=['Carteira'])
  retorno_acum_carteira['Carteira'] = (retorno_acumulado * pesos).sum(axis=1)
  return retorno_acum_carteira

In [None]:
retorno_acumulado_portfolio = calcular_retorno_acumulado_carteira(retorno_ativos_portfolio, pesos)
px.line(x = retorno_acumulado_portfolio.index, y = retorno_acumulado_portfolio['Carteira'], title='Retorno Acumulado da Carteira de Ativos durante o Período', labels={'x':'Data', 'y':'Retorno Acumulado'})

### **Volatilidade da Carteira**

In [None]:
def calcular_volatilidade_carteira(df_retornos):
  #1º calcular a matriz de covariância
  matriz_cov = df_retornos.cov()
  #Calcular a volatilidade
  vol_carteira = np.sqrt(np.dot(pesos.T, np.dot(matriz_cov, pesos)))
  #Vol Carteira Ano
  vol_carteira_ano = vol_carteira*np.sqrt(252)
  return vol_carteira, vol_carteira_ano

In [None]:
volatilidade_portfolio, volatilidade_portfolio_ano = calcular_volatilidade_carteira(retorno_ativos_portfolio)
print('Volatilidade do Portfólio: ' + str(volatilidade_portfolio))
print('Volatilidade do Portfólio no Ano: ' + str(volatilidade_portfolio_ano))

Volatilidade do Portfólio: 0.01788747237723947
Volatilidade do Portfólio no Ano: 0.28395482096227787


### **IBOV**

In [None]:
ibov = importar_ativos(['^BVSP'], '2016-01-01')
ibov_retornos = calcular_retornos(ibov)
ibov_acumulado = calcular_retorno_acumulado(ibov_retornos)

In [None]:
plotar_ativos(pd.concat([ibov_acumulado, retorno_acumulado_portfolio]), ['^BVSP', 'Carteira'])

### **Beta Carteira**

In [None]:
base = pd.merge(retorno_portfolio, ibov_retornos, how='inner', left_index=True, right_index=True )
Y = base['Retorno']
X = base['^BVSP']
beta_carteira = calcular_beta_regressao(X, Y)
beta_carteira[1]

0.9225707213339509

### **VaR Histórico**

In [None]:
var_95 = calcular_var_historico(retorno_portfolio, ['Retorno'], 5)
var_98 = calcular_var_historico(retorno_portfolio, ['Retorno'], 2)
var_99 = calcular_var_historico(retorno_portfolio, ['Retorno'], 1)
print('VaR Histórico')
print('VaR 95: ' + str(var_95['Retorno']))
print('VaR 98: ' + str(var_98['Retorno']))
print('VaR 99: ' + str(var_99['Retorno']))

VaR Histórico
VaR 95: -0.023351749424317017
VaR 98: -0.036512364846752986
VaR 99: -0.04628995833670303


## **Exercícios**

### **Exercício 1**

> Fazer os quatro momentos para o portfólio (média, desvpad, skewness-assimetria, curtose)

***Média***

In [None]:
# Média e Desvio Padrão dos retornos da carteira
media_portfolio = retorno_portfolio.mean()
desvpad_portfolio = retorno_portfolio.std()
print('Média:\n' + str(media_portfolio))
print('\nDesvio Padrão:\n' + str(desvpad_portfolio))

Média:
Retorno    0.001252
dtype: float64

Desvio Padrão:
Retorno    0.017887
dtype: float64


In [None]:
# Média dos ativos que compõem a carteira
media_ativos_portfolio = retorno_ativos_portfolio.mean()
desvpad_ativos_portfolio = retorno_ativos_portfolio.mean()
print('Média dos Ativos:\n' + str(media_ativos_portfolio))
print('\nDesvio Padrão dos Ativos:\n' + str(desvpad_ativos_portfolio))

Média dos Ativos:
ITSA4.SA    0.000976
WEGE3.SA    0.001919
BBAS3.SA    0.001286
EGIE3.SA    0.000825
dtype: float64

Desvio Padrão dos Ativos:
ITSA4.SA    0.000976
WEGE3.SA    0.001919
BBAS3.SA    0.001286
EGIE3.SA    0.000825
dtype: float64


***Média Móvel***

In [None]:
# Média Móvel dos Retornos da Carteira em uma janela de 60 dias
media_movel_portfolio = calcular_media_movel(retorno_portfolio, 60)
plotar_ativos(media_movel_portfolio, ['Retorno'])

In [None]:
# Média Móvel dos Retornos dos Ativos da Carteira em uma janela de 60 dias
media_movel_ativos_portfolio = calcular_media_movel(retorno_ativos_portfolio, 60)
plotar_retornos(media_movel_ativos_portfolio, tickers_portfolio)

***Skewness***

In [None]:
# Skewness dos ativos
calcular_skewness(retorno_ativos_portfolio, tickers_portfolio)

{'BBAS3.SA': -0.1997498205529962,
 'EGIE3.SA': 0.09671662330827731,
 'ITSA4.SA': -0.1552934629063844,
 'WEGE3.SA': -0.44393051773861286}

In [None]:
# Skewness do portfólio
calcular_skewness(retorno_portfolio, ['Retorno'])

{'Retorno': -0.7360063315930652}

***Curtose***

In [None]:
# Curtose dos ativos
calcular_kurtose(retorno_ativos_portfolio, tickers_portfolio)

{'BBAS3.SA': 8.755076482768143,
 'EGIE3.SA': 4.547217180774274,
 'ITSA4.SA': 3.479810969837419,
 'WEGE3.SA': 9.894684857150617}

In [None]:
# Curtose do portfólio
calcular_kurtose(retorno_portfolio, ['Retorno'])

{'Retorno': 7.605805842783504}

### **Exercício 2**

> Calcular Rolling beta

In [None]:
''' X e Y definidos anteriormente
base = pd.merge(retorno_portfolio, ibov_retornos, how='inner', left_index=True, right_index=True )
Y = base['Retorno']
X = base['^BVSP']''' 

rolling_beta_portfolio = calcular_rolling_beta(X, Y)
px.line(x = rolling_beta_portfolio.index, y = rolling_beta_portfolio['^BVSP'], title = "Rolling Beta", labels={'x':'Data','y':'Beta'})

### **Exercício 3**

>Calcular o VaR Paramétrico

In [None]:
var_parametrico_ativos = calcular_var_parametrico(retorno_ativos_portfolio, tickers_portfolio, 10)

VaR Paramétrico do ativo ITSA4.SA: -0.02523515269528323
VaR Paramétrico do ativo WEGE3.SA: -0.027670441991817424
VaR Paramétrico do ativo BBAS3.SA: -0.03642953073020606
VaR Paramétrico do ativo EGIE3.SA: -0.019413000411476287


In [None]:
var_parametrico_portfolio = calcular_var_parametrico(retorno_portfolio, ['Retorno'], 10)

VaR Paramétrico do ativo Retorno: -0.02166298593419491
