<a href="https://colab.research.google.com/github/maberf/colabs/blob/main/Aula01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<b> <font color = 'crimson'> <font size = "6.75"> Aula 01
    
---

# <font color='blue'> Programa do evento

<b> <font color='blue'> Aula 01 - Analytics descritivo de uma única ação
- Obtenção de dados (séries de preços)
- Cálculo do retorno de uma ação
- Cálculo do risco de uma ação </b>

<br>

Aula 02 - Analytics descritivo de uma carteira de ações
- Cálculo do retorno de uma carteira
- Cálculo do risco de uma carteira

<br>

Aula 03 - Analytics prescritivo de uma carteira de ações (continuação)
- Simulação de retorno vs. risco (introdução à simulação de Monte Carlo)
- Otimização de alocação
    
<br>
    
    
Aula 04 - Derivativos
- Como funciona uma call option (payoff, P&L)
- Simulação de Monte Carlo para o preço do ativo
- Simulação de Monte Carlo para o P&L do derivativo
- Análises gráficas
- Análise de uma estratégia de trading com calls

# <font color='blue'> Interfaces para programar em Python

Uma **IDE** (integrated development environment = ambiente de desenvolvimento integrado) é um aplicativo que fornece diversos recursos aos programadores para o desenvolvimento de seus programas/ projetos.

Para escrever e rodar programas na linguagem Python, há várias IDEs disponíveis no mercado.

- Algumas interfaces são gratuitas, outras pagas,
- Algumas são mais sofisticadas, outras menos,
- Algumas são melhores para certos usos, outras melhores para outros usos (e.g., programação orientada a objeto, desenvolvimento e prototipagem de modelos).

## <font color='Green'> Jupyter Notebook

O Jupyter Notebook é um aplicativo de código aberto (open-source) que permite criar e compartilhar documentos que contêm código (programas), gráficos, equações e texto.

Os usos de um Jupyter Notebook incluem:
- Limpeza e manipulação/ transformação de dados,
- Simulação numérica,
- Otimização,
- Modelagem estocástica (i.e., construção de modelos que incorporam ferramentas de teoria de probabilidade/ estatística),
- Visualização de dados,
- Machine learning (aprendizado de máquina),
- Automatização de atividades,
- etc.


O Jupyter precisa ser instalado localmente na máquina do usuário.

A maneira mais simples de instalar o Jupyter é instalando o Anaconda:

https://www.anaconda.com/products/individual

Um Jupyter notebook é um arquivo do tipo (i.e., com a extensão): **.ipynb**.

Um Jupyter notebook pode ser exportado para vários outros formatos, por exemplo: pdf, html, py

## <font color='Green'> Google Colab

Google Colaboratory = Google Colab.

O Google Colab também é gratuito e funciona de forma análoga ao Jupyter (com algumas vantagens e algumas desvantagens).

https://research.google.com/colaboratory/

Vantagens de usar o Colab:

- Você não precisa instalar nada no seu computador.
- Desempenho: você usa o poder computacional dos servidores do Google em vez de sua própria máquina (muito útil se sua máquina não é tão poderosa, ou se os modelos/programas a serem rodados exigem muita capacidade de processamento - e.g., IA, simulação).
- Arquivo salvo na nuven (Google drive).

# <font color='blue'> Python/ Jupyter basics 0.01

Isso é uma célula que contém um texto

In [None]:
# esta é uma célula com um "programa"
# um programa é uma sequência de comandos a serem executados pelo Python

1 + 1  # isto é um comentário ignorado pelo Python

In [None]:
# esse é um "programa" mais sofisticado que o anterior

a = 4 # 'a' é uma variável - um espaço na memória do computador - em que podemos "guardar coisas"
b = 3
c = a * b

# mostrando o resultado
c

Células podem ter texto

E também equações matemáticas escritas em LaTeX

$\hat{Y_t} = \alpha + \beta \cdot X_t$

$\beta = \dfrac{cov(Y_t, X_t)}{Var(X_t)} = \rho \cdot \dfrac{\sigma_2}{\sigma_1}$

$\alpha = E(Y_t) - \beta \cdot  E(X_t) $

$ \dfrac{\partial V_t}{\partial t}
   + \dfrac{1}{2} \cdot \sigma^{2} \cdot S_t^2 \cdot \dfrac{\partial^2 V_t}{\partial S_t^2}
      + (r - q) \cdot S_t \cdot \dfrac{\partial V_t}{\partial S_t}
      - r \cdot V_t =0  $

$ \dfrac{\partial u}{\partial t}
   = h^2 \cdot \left( \dfrac{\partial^2 u}{\partial x^2}
      + \dfrac{\partial^2 u}{\partial y^2}
      + \dfrac{\partial^2 u}{\partial z^2} \right) $


# <font color='blue'> Alguns conceitos teóricos iniciais

## <font color='Green'> Dados

Registros de eventos e seus atributos (quantitativos ou qualitativos).

## <font color='Green'> Informação

Informação são:

- Dados relacionados a outros conjuntos de dados.
- Dados inseridos dentro de um contexto.

## <font color='Green'> Time series (séries temporais)

Uma série temporal é um conjunto de observações que são registradas e organizadas sequencialmente de acordo com o instante de tempo (data/ horário) em que ocorrem.

Finanças é um campo em que as séries temporais surgem naturalmente a partir da evolução temporal de diversas variáveis de interesse:

- preços de ativos,
- volumes negociados,
- índices (de ações, de preços, de moedas, etc.),
- variáveis econômicas (taxas de juros, taxas de câmbio, PIB, etc.),
- etc.

## <font color='Green'> Panel data (painel de dados)

Panel data (painel/ tabela de dados) é um conjunto de dados multidimensional, enquanto uma série temporal é um painel de dados unidimensional.

As diferentes dimensões de um painel de dados são caracterizadas por atributos que não o tempo, e.g.:
- preço de fechamento,
- preço máximo,
- preço mínimo,
- volume,
- valor de mercado de cada instrumento componente de uma carteira de investimentos,
- valor de mercado da carteira inteira.

**Exemplo - uma planilha de excel.**


# <font color='blue'> Libraries/ packages/ modules (bibliotecas/ pacotes/ módulos)

## <font color='Green'> Algumas bibliotecas essenciais do Python

### Pandas

O **Pandas** é uma biblioteca (i.e., um pacote) escrita para a linguagem de programação Python para manipulação e análise de dados, organizados na forma de séries temporais e/ou painéis (tabelas) de dados.

O nome **Pandas** é derivado do termo **panel data**.

Um **DataFrame** é uma estrutura de dados bidimensional no pacote Pandas, ou seja, os dados são organizados de forma tabular em linhas e colunas.

Um **DataFrame** é o corresppondente do Python a uma ***pasta (sheet) em uma planilha de Excel***.

### NumPy

NumPy, abreviação de **Numerical Python**, é a base da computação numérica em Python.

O NumPy fornece as estruturas de dados, algoritmos e bibliotecas necessários para a maioria das aplicações científicas que envolvem dados numéricos em Python. NumPy contém, entre outras coisas:

- Estruturas matriciais multidimensionais (array objects) rápidas e eficientes
- Funções para realizar operações com matrizes e entre matrizes
- Operações de álgebra linear, transformadas de Fourier e geração de números aleatórios

Para matrizes numéricas, os NumPy arrays são mais eficientes para armazenar e manipular dados do que outras estruturas de dados originais do Python.

### Matplotlib

Matplotlib é a biblioteca do Python mais popular para a produção de gráficos e outras visualizações de dados bidimensionais - embora existam outras bibliotecas de visualização disponíveis em Python.


### Python Package Index - PyPI

O Python Package Index (PyPI) é um repositório de software para a linguagem de programação Python.

O PyPI ajuda você a encontrar e instalar software desenvolvido e compartilhado pela comunidade Python.

Os autores de pacotes usam o PyPI para distribuir seu software.

https://pypi.org/

## <font color='Green'> Instalação de pacotes

Determinados pacotes precisam ser instalados antes de serem importados.

Instalar o pacote 'yfinance':

In [None]:
# pip install yfinance

Instalar o pacote 'plotly':


In [None]:
# pip install plotly

## <font color='Green'> Importação de pacotes

In [4]:
import pandas as pd
import yfinance as yf
import numpy as np

import datetime as dt
from datetime import date, timedelta, datetime

In [5]:
#plot

import matplotlib as plt
import matplotlib.pyplot as plt

import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

import seaborn as sns
sns.set_style('darkgrid')
plt.rc("figure", figsize = (20, 10))
plt.rc("savefig", dpi = 90)
plt.rc("font",family = "sans-serif")
plt.rc("font",size = 14)

# <font color='blue'> Analytics descritivo de uma única ação

## <font color='Green'> DataFrame com séries de preços

### Criação do DataFrame

In [6]:
# série de preços diária da Apple Inc. - open, high, low, close, volume, ajuste (adj close)

# determinando a data inicial da série de preços
data_inicial = date(2017, 4, 1)

# determinando a data final da série de preços
# end_date = dt.datetime(2021, 4, 1)
data_final = datetime.today()

# ticker symbol do ativo que queremos estudar
# 'AAPL'  # Apple Inc.

# criando o DataFrame com as séries de preços
df_acao = yf.download('AAPL', data_inicial, data_final)

# mostrando o resultado
df_acao

[*********************100%***********************]  1 of 1 completed


Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2017-04-03,35.927502,36.029999,35.762501,35.924999,33.451565,79942800
2017-04-04,35.812500,36.222500,35.792500,36.192501,33.700645,79565600
2017-04-05,36.055000,36.365002,35.952499,36.005001,33.526062,110871600
2017-04-06,36.072498,36.130001,35.862499,35.915001,33.442257,84596000
2017-04-07,35.932499,36.044998,35.817501,35.834999,33.367764,66688800
...,...,...,...,...,...,...
2024-10-14,228.699997,231.729996,228.600006,231.300003,231.300003,39882100
2024-10-15,233.610001,237.490005,232.369995,233.850006,233.850006,64751400
2024-10-16,231.600006,232.119995,229.839996,231.779999,231.779999,34082200
2024-10-17,233.429993,233.850006,230.520004,232.149994,232.149994,32993800


In [None]:
# recortando (slicing) o DataFrame - só uma coluna - pandas series
volume = df_acao['Volume']

# mostrando o resultado
volume

# # mostrando o type do objeto do python
# type(volume)

In [None]:
# recortando (slicing) o DataFrame
df_preço_max_min = df_acao.loc[:, ['Close', 'High', 'Low']]

# renomeando colunas
df_preço_max_min = df_preço_max_min.rename(columns = {'Close': 'Preço', 'High': 'Max', 'Low': 'Min'})

# mostrando o resultado
df_preço_max_min

# # mostrando o type do objeto do python
# type(df_preço_max_min)

### Visualização do DataFrame (gráfico das séries de preços)

In [None]:
# plot dos preços Preço, Max e Min de uma única ação
# df_preço_max_min.plot();

# filtrando desde a data '2020-02-05' para não ficar muito longa a série - ruim para visualizar
df_preço_max_min.loc['2020-02-05':, :].plot();

# plotando os volumes negociados em um eixo secundário
volume['2020-02-05':].plot(secondary_y = True, color = "blue", linestyle = '--', lw = 0.6)

# definindo a legenda do eixo secundário
plt.legend(loc = 'lower right');

In [None]:
# um outro pacote de gráficos - apenas para ilustrar (no curso veremos vários pacotes gráficos)

# criando o DataFrames a serem plotados
df_preco_plot = df_preço_max_min.loc['2020-02-05':,'Preço']
df_volume_plot = volume['2020-02-05':]


# criando objeto gráfico
fig =  make_subplots(specs = [[{"secondary_y": True}]])

# criando eixo primário
fig.add_trace(
    go.Scatter(x = df_preco_plot.index, y = df_preco_plot, name = "Preço"), secondary_y = False)

# criando eixo secundário
fig.add_trace(
    go.Scatter(x = df_volume_plot.index, y = df_volume_plot, name = "Volume", line_width = .5), secondary_y = True)

fig.update_layout(title = 'Preço de fechamento e volume de vendas')

# exibindo objeto gráfico
fig.show()

## <font color='Green'> Retornos

### Definição conceitual

O **retorno financeiro** de um ativo durante um determinado intervalo de tempo corresponde a quanto variou, em termos financeiros (i.e., em $), o preço desse ativo.

O **retorno percentual** de um ativo durante um determinado intervalo de tempo corresponde a quanto variou, percentualmente, o preço desse ativo.


###  Definição matemática

Sejam:

$P(t) = P_{t}$ : preço do ativo no instante $t$

$P(t + \Delta t) = P_{t + \Delta t}$ : preço do ativo no instante $t + \Delta t$

O **retorno financeiro** entre $t$ e $t + \Delta t$ corresponde à **variação de preço entre $t$ e $t+\Delta t$:**  

$\Delta P_{t, \ t + \Delta t} = \Delta P_t = P(t + \Delta t) - P(t) = P_{t+\Delta t} - P_{t}$

O **retorno percentual (%)** entre $t$ e $t + \Delta t$ é dado por:

$ret_{t, \ t + \Delta t} = r_t =  \dfrac{\Delta P_t}{P_{t}} = \dfrac{P_{t + \Delta t} - P_{t}}{P_{t}} = \dfrac{P_{t + \Delta t}}{P_{t}} - 1$


### Composição de retornos

**IMPORTANTE: o retorno percentual para um determinado período (entre $t$ e $t+n$) NÃO CORRESPONDE à soma dos retornos percentuais dos sub-períodos que compõem esse período:**

$ret_{t, t+n} \neq ret_{t, t+1} + ret_{t+1, t+2} + \ ... \; + ret_{t+n-1, t+n}$

<br>

**Exemplo:**

$S_t = \$100 \quad \longrightarrow  \quad  \Delta{P_t} = - \$50  \quad \longrightarrow  \quad S_{t+1} = \$50 \quad \longrightarrow  \quad \Delta P_{t+1} = \$25 \quad \longrightarrow  \quad S_{t+2} = \$75 $

<br>

$S_t = \$100 \quad \longrightarrow  \quad ret_{t, t+1}=-50\%  \quad \longrightarrow  \quad S_{t+1} = \$50 \quad \longrightarrow  \quad ret_{t+1, t+2}= 50\%  \quad \longrightarrow  \quad S_{t+2} = \$75$

<br>

<font color='red'> $ ret_{t, t+1} + ret_{t+1, t+2} = -50\% + 50\% = 0\% \quad \neq \quad $ Retorno total $(\%) = ret_{t, t+2} = - 25\%$


**Para obter o retorno percentual no período, podemos, *sim*, somar as variações de preço (i.e., os retornos FINANCEIROS) dos sub-períodos, e então dividir pelo valor inicial:**

<br>

$Ret_{t, t+2} (\$) = \Delta P_t + \Delta P_{t+1} = -\$50 + \$25 = -\$25 $

<br>

$Ret_{t, t+2} (\%) = \dfrac{Ret_{t, t+2} (\$)}{S_t} = \dfrac{(\Delta P_t + \Delta P_{t+1})}{S_t} = \dfrac{S_{t+2} - S_t}{S_t} = \dfrac{S_{t+2}}{S_t} - 1= - 25\%$



###  Cálculo dos retornos entre $t$ e $t+1$ $\left( \Delta t = 1 \text {dia} \right)$

In [None]:
# um exemplo fictício didático
# criando um DataFrame de preços de uma ação
df01 = pd.DataFrame({'Preço': [100, 101, 103, 106, 110, 115, 121, 128, 136]})

# calculando a variação de preço
df01['d_Preço'] = df01['Preço'].diff(periods = 1)

# calculando os retornos a cada período (shift negativo é para trás no tempo, positivo é para frente)
# df01['Ret'] = df01['Preço'].shift(periods = 1)
df01['Ret'] = df01['d_Preço'] / df01['Preço'].shift(periods = 1)

# outra forma de calcular retornos
df01['Ret2'] = (df01['Preço'] / df01['Preço'].shift(periods = 1)) - 1

# outra forma de calcular retornos - pct_change
df01['Ret3 '] = df01['Preço'].pct_change(periods = 1)

# mostrando o resultado
df01

In [None]:
# criando um DataFrame de preços de uma ação
df01 = df_acao.loc[:,['Adj Close']].rename(columns = {'Adj Close': 'Preço'})

# calculando  retornos
df01['Ret'] = df01['Preço'].pct_change(periods = 1)

# mostrando o resultado
df01

### Visualização da série temporal de retornos (%)

In [None]:
# eixo com série de preços
ax1 = df01.loc[:,'Preço'].plot(style = "darkblue", lw = 1.75, figsize = (20,10));
plt.legend(loc = 'best') # definindo a legenda
ax1.set_ylabel('Preço');  # definindo os nomes dos eixos


# eixo com série de retornos
ax2 = df01.loc[:,'Ret'].plot(secondary_y = True, style = "blue", lw = 0.25)
plt.legend(loc = 'lower right') # definindo a legenda
ax2.set_ylabel('Ret')  # definindo os nomes dos eixos


# eixo com série de retornos positivos
rets_positivos = np.maximum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_positivos.plot(secondary_y = True, style ='.', color = 'green', markersize = 5, markevery = 1)


# eixo com série de retornos negativos
rets_negativos = np.minimum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_negativos.plot(secondary_y = True, style ='.', color = 'red', markersize = 5, markevery = 1)


###  Cálculo do retorno entre $t$ e $t+n$

In [None]:
# preço na data mais antiga (primeiro dado da série temporal)
df01['Preço'].iloc[0]

In [None]:
# preço na data mais recente (último dado da série temporal)
df01['Preço'].iloc[-1]

In [None]:
# calculando o retorno da ação entre t e t+n
ret_t_tn = (df01['Preço'].iloc[-1] / df01['Preço'].iloc[0]) - 1
ret_t_tn

In [None]:
# calculando o retorno da ação entre t e t+n
# podemos somar os ganhos financeiros diários e, em seguida, dividir pelo preço inicial da ação

df01['Preço'].diff(periods = 1).sum() / df01['Preço'].iloc[0]

In [None]:
# o retorno em um determinado período NÃO É IGUAL, obviamente, à soma dos retornos dos sub-períodos (soma da coluna Ret)
# subir 100% e depois cair 50% --> retorno = 0% (e não: (+100%) + (-50%) = 50%)
df01['Ret'].sum()

## <font color='Green'> Risco

###  Conceitos fundamentais

**Risco é inevitável:**

"É impossível ganhar os grandes prêmios da vida sem correr riscos" - Theodore Roosevelt

**Definição 01**

Risco é a medida: \
1 - da probabilidade (da chance, frequência) de ocorrência de efeitos adversos, \
2 - da gravidade (severidade) desses efeitos adversos.

Lowrance (Of Acceptable Risk. Science and the determination of safety.)

**Definição 02**

Risco é o conjunto de respostas às 3 seguintes perguntas: \
1 - O que pode dar errado? (cenários de acidente) \
2 - Qual é a probabilidade disso? (probabilidades, frequências) \
3 - Quais são as consequências? (efeitos adversos, resultados, severidade)

Kaplan & Garrick (On The Quantitative Definition of Risk.)

**No caso de investimentos:**

O ***driver* de risco** (i.e., quem é responsável diretamente pelo risco do investimento) é o **comportamento dos retornos** aos quais estamos expostos.

Essa exposição ocorre por possuirmos uma carteira com determinadas posições em determinados instrumentos financeiros.

###  Modelagem de riscos

Qual é a ferramenta matemática que permite descrever o comportamento dos retornos (i.e., modelar os riscos)?

Resposta curta: a distribuição de probabilidade dos retornos.

Essa distribuição será aproximada pelo histograma de frequências do retorno.

**O histograma de retornos mostra como "os retornos estão distribuídos", ou seja:**

**1 - Que valores os retornos assumiram em determinado período? \
2 - Com que frequência cada um desses valores ocorreu?**

In [None]:
# apenas plotando novamente o gráfico anterior para referência

# eixo com série de preços
# "plt.subplot" - 1o argumento: número de linhas, 2o argumento: número de colunas, 3o argumento: posições ocupadas pelo gráfico
plt.subplot(1, 4, (1, 3))
ax1 = df01.loc[:,'Preço'].plot(style = "darkblue", lw = 1.75, figsize = (20, 10));
plt.legend(loc = 'best') # definindo a legenda
ax1.set_ylabel('Preço')  # definindo os nomes dos eixos


# eixo com série de retornos
ax2 = df01.loc[:,'Ret'].plot(secondary_y = True, style = "blue", lw = 0.25)
plt.legend(loc = 'best') # definindo a legenda
# ax2.set_ylabel('Ret')  # definindo os nomes dos eixos


# eixo com série de retornos positivos
rets_positivos = np.maximum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_positivos.plot(secondary_y = True, style ='.', color = 'green', markersize = 5, markevery = 1)


# eixo com série de retornos negativos
rets_negativos = np.minimum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_negativos.plot(secondary_y = True, style ='.', color = 'red', markersize = 5, markevery = 1)


# como é construído um histograma de frequências? - explicar que cada ponto vai em cada bin...
# histograma dos retornos
plt.subplot(1, 4, 4)
histograma = df01.loc[:,'Ret'].hist(bins = 60, orientation = "horizontal");
histograma.set_xlabel("Frequência")
plt.yticks([]);

In [None]:
# calculando algumas métricas estatísticas dada a série temporal de retornos

stats = df01.loc[:,'Ret'].describe(percentiles = [.025, 0.05, 0.1, 0.25, 0.5, 0.75, 0.99])
stats

In [None]:
# como é construído um histograma de frequências - explicar que cada ponto vai em cada bin...
# histograma dos retornos
df01.loc[:,'Ret'].hist(bins = 60);

plt.axvline(x = stats.loc['mean'], color = 'red', lw = 1.5);
plt.axvline(x = stats.loc['50%'], color = 'yellow', lw = 1.5);
plt.axvline(x = stats.loc['2.5%'], color = 'green', lw = 1.5);
plt.axvline(x = stats.loc['5%'], color = 'blue', lw = 1.5);
plt.axvline(x = stats.loc['99%'], color = 'magenta', lw = 1.5);


### Mensuração de riscos - métricas

Existem diversas métricas de risco usadas no mercado - e elas serão exploradas em detalhes em nosso curso:

1 - Desvio padrão dos retornos (considerando certa janela histórica)  \
2 - Semi desvio-padrão \
3 - V@R \
4 - Expected shortfall (conditional value at risk (CVaR), average value at risk (AVaR), expected tail loss (ETL)) \
5 - Drawdown

A mais simples, mais tradicional, é o desvio padrão dos retornos. Nessa aula, vamos seguir com ela...

In [None]:
# calculando o desvio padrão dos retornos considerando uma janela móvel de tamanho 'window'

window = 126
df01.loc[:,'Ret'].rolling(window, min_periods = 1).std()

## <font color='Green'> Gráfico de controle

In [None]:
# apenas plotando novamente o gráfico anterior para referência

# eixo com série de preços
# "plt.subplot" - 1o argumento: número de linhas, 2o argumento: número de colunas, 3o argumento: posições ocupadas pelo gráfico
plt.subplot(1, 5, (1, 4))
ax1 = df01.loc[:,'Preço'].plot(style = "darkblue", lw = 1.75, figsize = (20, 10));
plt.legend(loc = 'best') # definindo a legenda
ax1.set_ylabel('Preço')  # definindo os nomes dos eixos


# eixo com série de retornos
ax2 = df01.loc[:,'Ret'].plot(secondary_y = True, style = "blue", lw = 0.25)
plt.legend(loc = 'best') # definindo a legenda
# ax2.set_ylabel('Ret')  # definindo os nomes dos eixos


# eixo com série de retornos positivos
rets_positivos = np.maximum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_positivos.plot(secondary_y = True, style ='.', color = 'green', markersize = 5, markevery = 1)


# eixo com série de retornos negativos
rets_negativos = np.minimum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_negativos.plot(secondary_y = True, style ='.', color = 'red', markersize = 5, markevery = 1)

# ------------------------------------------------------------------------------------------------------------
# eixos com os desvios-padrão de uma janela móvel "window"
window = 21
sigma = df01.loc[:,'Ret'].rolling(window, min_periods = 1).std()
ax4 = (sigma * 2).shift(periods = 1).plot(secondary_y = True, style = "darkgreen", lw = 1.5)
ax5 = (sigma * -2).shift(periods = 1).plot(secondary_y = True, style = "red", lw = 1.15)


# ------------------------------------------------------------------------------------------------------------
# histograma dos retornos
plt.subplot(1, 5, 5)
histograma = df01.loc[:,'Ret'].hist(bins = 60, orientation = "horizontal");
histograma.set_xlabel("Frequência")
plt.yticks([]);

In [None]:
# apenas plotando novamente o gráfico anterior para referência

# eixo com série de preços
# "plt.subplot" - 1o argumento: número de linhas, 2o argumento: número de colunas, 3o argumento: posições ocupadas pelo gráfico
plt.subplot(1, 5, (1, 4))
ax1 = df01.loc[:,'Preço'].plot(style = "darkblue", lw = 1.75, figsize = (20, 10));
plt.legend(loc = 'best') # definindo a legenda
ax1.set_ylabel('Preço')  # definindo os nomes dos eixos


# eixo com série de retornos
ax2 = df01.loc[:,'Ret'].plot(secondary_y = True, style = "blue", lw = 0.25)
plt.legend(loc = 'best') # definindo a legenda
# ax2.set_ylabel('Ret')  # definindo os nomes dos eixos


# eixo com série de retornos positivos
rets_positivos = np.maximum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_positivos.plot(secondary_y = True, style ='.', color = 'green', markersize = 5, markevery = 1)


# eixo com série de retornos negativos
rets_negativos = np.minimum(df01.loc[:,'Ret'], 0).replace(0, np.nan)
ax02a = rets_negativos.plot(secondary_y = True, style ='.', color = 'red', markersize = 5, markevery = 1)

# ------------------------------------------------------------------------------------------------------------
# eixos com os desvios-padrão de uma janela móvel "window"
window = 21
sigma = df01.loc[:,'Ret'].rolling(window, min_periods = 1).std()
ax4 = (sigma * 2).shift(periods = 1).plot(secondary_y = True, style = "darkgreen", lw = 1.5)
ax5 = (sigma * -2).shift(periods = 1).plot(secondary_y = True, style = "red", lw = 1.15)

# ------------------------------------------------------------------------------------------------------------
# calculando o retorno acumulado em uma janela de tamanho window
window = 10
ret_cum = (1 + df01.loc[:,'Ret']).rolling(window, min_periods = 1).apply(np.prod) - 1
ax6 = ret_cum.plot(secondary_y = True, style = "orange", lw = 0.5)

# calculando o retorno médio em uma janela de tamanho window - lembrando que essa conta está errada!
# ret_medio = df01.loc[:,'Ret'].rolling(window, min_periods = 1).mean()
# ax6 = ret_medio.plot(secondary_y = True, style = "purple", lw = 1.5)

# ------------------------------------------------------------------------------------------------------------
# histograma dos retornos
plt.subplot(1, 5, 5)
histograma = df01.loc[:,'Ret'].hist(bins = 60, orientation = "horizontal");
histograma.set_xlabel("Frequência")
plt.yticks([]);