# Início de trabalho com finanças

## Considerando risco e retorno

Quando realizamos um investimento, ponderamos o lado bom e o lado ruim de tal investimento. Normalmente consideramos o lucro que podemos ter com tal investimento, mas, por outro lado, devemos ponderar a possibilidade de perder algum valor investido, tendo prejuízo! <br><br>

A lógica que se deve ter é, como regra geral, para termos maiores retornos, devemos considerar, em contrapartida, uma maior possibilidade de perda, ou seja, com maior retorno, há maior risco.<br><br>

Vamos tentar um exemplo prático: Hoje, a taxa básica de juros possui uma meta de 2.25%, se investirmos em um título do tesouro que nos remunere a 2.25% a.a., há quem diga que essa remuneração é muito baixa, porém deve-se levar em conta que o risco de um investimento como esse é muito baixo. As vezes, negligenciável. <br><br> 

Por outro lado, podemos investir em ações da empresa X, que pode ter uma valorização projetada de 30% no ano, porém, ao mesmo tempo, deve ser considerado que o risco dessa ação na verdade se depreciar é muito maior do que o risco de o governo não lhe pagar o título! <br><br>

Bem por cima, é assim que funciona a lógica do Risco-Retorno, em breve veremos métodos de cálculo e como colocar essa lógica em prática.

## Retorno

Primeiramente, vamos abordar o conceito de retorno de um investimento: como calcular o retorno de um ativo? <br><br> 

A fórmula de cálculo da Taxa de Retorno Simples (visto muito, do inglês, como *Simple Rate of Return*) de um investimento é:

![image.png](attachment:image.png)

Ou seja, dividimos a diferença entre o preço final da ação (por exemplo), o P1, e o preço inicial, que pagamos pela ação, pelo preço inicial da ação.

Outro fórmula de cálculo bem comum de retorno de um investimento é a Taxa de Retorno Logaritmica, ou, também chamada de Log Retorno (em inglês *Logarithmic Rate of Return*), cuja fórmula é:

![image.png](attachment:image.png)

As duas formas são válidas na hora de você calcular e pontuar o retorno de um ativo, e cada um possui suas vantagens e desvantagens.<br><br>

- A taxa de retorno simples é mais intuitiva, quando alguém faz o cálculo de cabeça, nunca está pensando ou se referindo ao retorno logarítmico de um investimento.
- Porém, quando queremos calcular o retorno de apenas um ativo, e estamos somando retornos ao longo de um período de tempo, devemos usar o Log Retorno, pelo seguinte: se uma ação valorizar (retorno simples) 5% mês passado, e mais 5% esse mês, eu não posso falar que ela se valorizou em 10% desde o mês passado! Pelo retorno simples, eu não posso somar retornos de diferentes períodos de tempo. Porém, pelo Log Retorno, essa conta é válida!
- Portanto, pode ser recomendado utilizar o Log Retorno quando estamos avaliando apenas um ativo ao longo de vários períodos de tempo, porém, se estamos comparando diversos ativos ao longo de um período de tempo apenas, recomenda-se o uso do retorno simples!<br><br>

**Obs:** Uma ressalva importante dessa parte deve ser feita: as fórmulas dão resultado diferente, ou seja, o log retorno de uma ação no mês será diferente do retorno simples da mesma ação no mesmo mês. Portanto, quando estamos calculando qualquer um dos retornos, devemos ser sempre consistentes, devem ser sempre comparados Log Retornos com Log Retornos e Retornos Simples com Retornos simples <br><br>

Logo em seguida mostrarei alguns cálculos em prática, entrarei em mais alguns detalhes, e provavelmente tudo ficará mais claro!

### Colocando o cálculo do retorno na prática:

Abaixo iniciarei importando os módulos utilizados para realizar os cálculos, e explicarei conforme for realizando os passos:

In [1]:
import numpy as np
from pandas_datareader import data as wb
import matplotlib.pyplot as plt
import pandas as pd
import math

  from pandas.util.testing import assert_frame_equal


In [2]:
BR = wb.DataReader('PETR4.SA', data_source='yahoo', start='2020-1-1')

In [3]:
BR.head()

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2020-01-02,30.700001,30.309999,30.51,30.700001,37774500.0,30.697725
2020-01-03,31.24,30.450001,30.879999,30.450001,71595600.0,30.447742
2020-01-06,30.940001,29.950001,30.43,30.809999,81844000.0,30.807716
2020-01-07,30.879999,30.469999,30.82,30.690001,32822000.0,30.687725
2020-01-08,30.77,30.24,30.690001,30.5,48215600.0,30.497738


In [4]:
BR['Retorno Simples'] = (BR['Adj Close']/BR['Adj Close'].shift(1)) - 1

In [5]:
BR

Unnamed: 0_level_0,High,Low,Open,Close,Volume,Adj Close,Retorno Simples
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2020-01-02,30.700001,30.309999,30.510000,30.700001,37774500.0,30.697725,
2020-01-03,31.240000,30.450001,30.879999,30.450001,71595600.0,30.447742,-0.008143
2020-01-06,30.940001,29.950001,30.430000,30.809999,81844000.0,30.807716,0.011823
2020-01-07,30.879999,30.469999,30.820000,30.690001,32822000.0,30.687725,-0.003895
2020-01-08,30.770000,30.240000,30.690001,30.500000,48215600.0,30.497738,-0.006191
...,...,...,...,...,...,...,...
2021-02-25,25.250000,23.100000,25.000000,23.190001,170233000.0,23.190001,-0.049590
2021-02-26,23.420000,21.969999,23.200001,22.240000,159881000.0,22.240000,-0.040966
2021-03-01,23.040001,21.920000,22.799999,22.000000,90330100.0,22.000000,-0.010791
2021-03-02,22.330000,20.670000,21.840000,21.990000,147772300.0,21.990000,-0.000455


O que eu fiz acima foi o seguinte:
- Importei os dados da ação da Petrobras desde o início do ano da API da Yahoo Finance
- Printei as primeiras linhas do DataFrame para verificar a sua estrutura
- Criei uma nova coluna no DataFrame com a informação do retorno simples diário, dividindo o preço do dia pelo preço do dia anterior subtraído de 1. Fiz isso utilizando o método **.shift()** que é um método dos dataframes que permite indicar a quantidade de *lags* que queremos ter quando nos referimos a uma coluna.
- Printei o DataFrame novamente, agora com a coluna de Retorno Simples inserida!

Acima, você deve ter reparado que eu importei o **matplotlib**. Vamos plotar os retornos:

In [None]:
help(pd.DataFrame.plot)

In [None]:
BR['Retorno Simples'].plot(figsize=(10,7))
plt.show()

O gráfico acima nos ajuda a perceber que as variações diárias costumam ser menores do que 10% e que a maior valorização diária foi de 20% e a maior desvalorização foi por volta de 30% (em um dia!).

Outra métrica legal que podemos calcular é o retorno diário médio:

In [None]:
retorno_medio = BR['Retorno Simples'].mean()
print(retorno_medio)

Podemos anualizar esse valor, multiplicando pelo número de dias úteis (quando falamos em aplicações financeiras, adota-se a utilização de 252 du):

In [None]:
retorno_anual = round(retorno_medio*252*100, 3)
print("O retorno anualizado da ação da Petrobras, baseado nos números de 2020 é de {}%!".format(retorno_anual))

Agora, pra essa mesma ação, vamos falar do retorno logaritmico:

In [None]:
BR['Log Retorno'] = np.log(BR['Adj Close'] / BR['Adj Close'].shift(1))
BR.head()

Note que o Log Retorno é levemente diferente do Retorno simples!

E o Log Retorno pode ser facilmente calculado por meio da função **log()**, presente no numpy!

In [None]:
BR['Log Retorno'].plot(figsize=(8, 5))
plt.show

Vamos comparar o log retorno médio com o retorno simples médio:


In [None]:
log_retorno_medio = BR['Log Retorno'].mean()
print('O retorno simples médio dessa ação foi de {}% e o log retorno foi de {}%'.format(round(retorno_medio*100, 5),
                                                                                       round(log_retorno_medio*100, 5)))

Se anualizarmos:

In [None]:
print('O log retorno anualizado dará: {}%'.format(round(log_retorno_medio*252*100, 5)))

Ótimo! Falamos até agora sobre como fazer algumas análises quando estamos olhando para um ativo. Mas e se falássemos de uma carteira de ativos? Vou puxar dados de algumas ações, criando uma carteira hipotética:

In [None]:
tickers = ['PETR4.SA', 'VVAR3.SA', 'BRFS3.SA', 'VALE3.SA']
carteira = pd.DataFrame()
for ticker in tickers:
    carteira[ticker] = wb.DataReader(ticker, data_source='yahoo', start='2019-1-1')['Adj Close']

Criei essa carteira da maneira explicada anteriormente: cria-se uma lista com os tickers desejados, depois voce itera por esses tickers, colocando colunas em um DataFrame vazio, e essas colunas serão o Adj Close dos tickers que eu escolhi.

In [None]:
carteira.info()

In [None]:
carteira

In [None]:
carteira.to_csv('D:/Python/carteira.csv')

In [None]:
carteira.plot(figsize=(15, 6))
plt.show

Veja que pelo gráfico fica difícil compararmos o desempenho de cada ação, visto que partimos de uma base de comparação muito diferente, pelo preço inicial ser tão diferente entre elas. Para isso, podemos utilizar a **normalização**. Abaixo vou normalizar a série a uma base comum (100), fazendo com que todas as ações partam de um mesmo ponto de partida, existem diferentes formas de realizar a normalização, mas não vou me aprofundar muito nisso. <br><br>

Para realizar a normalização, vou utilizar um método do Pandas chamado **.iloc()**, que nos retorna os dados em uma determinada linha (indexada no argumento do método):

In [None]:
carteira.iloc[0]

Agora vamos plotar um gráfico com a série normalizada:

In [None]:
(carteira / carteira.iloc[0] * 100).plot(figsize=(15, 6))
plt.show

Veja como esse gráfico fica tão diferente de interpretar!!

Vamos agora calcular o retorno de um portfolio de ações:

In [None]:
retornos = (carteira/carteira.shift(1)) - 1
retornos

In [None]:
retorno_medio = retornos.mean()
retorno_medio

In [None]:
retorno_medio_anual = retornos.mean()*252

Até agora, o que eu fiz foi criar um dataframe com os retornos diários das acões, após isso, criei uma série com a média dos retornos de cada ação e os anualizei. Baseado pelo que vimos no gráfico normalizado, esperamos que o retorno maior seja da VVAR3. Veja:

In [None]:
retorno_medio_anual

OK, agora vamos seguindo, já sabemos como calculamos o retorno de ativos individuais, mas como fazemos isso quando estamos falando de uma carteira de ativos?<br><br>

Simples, o cálculo do retorno é simplesmente uma média ponderada dos retornos dos ativos individuais! A média é ponderada pela participação de cada ativo na carteira. Em inglês, a participação é chamada de *weight*. Vamos supor que estamos falando de uma carteira em que cada um dos ativos possua a mesma participação:

In [None]:
weights = np.array([0.25, 0.25, 0.25, 0.25])

Vamos utilizar a função de multiplicação de matrizes **dot()** do Numpy:

In [None]:
np.dot(retorno_medio_anual, weights)

Vamos comparar agora, se colocássemos diferentes pesos para as ações, vimos que a as ações da Petrobras não tiveram um bom retorno, portanto, se calculássemos no caso de uma carteira com maior quantidade de PETR4 do que de VVAR3, espera-se um menor retorno e vice-versa. Vejamos:

In [None]:
weights = np.array([0.6, 0.1, 0.15, 0.15])
np.dot(retorno_medio_anual, weights)

In [None]:
weights = np.array([0.1, 0.6, 0.15, 0.15])
np.dot(retorno_medio_anual, weights)

Vamos agora tentar aplicar algo similar utilizando índices de diferentes locais do mundo! Vou continuar importando os dados da API do Yahoo Finance, porém, agora, em vez de trazer o valor para ações, vou trazer o valor de índices. Vamos lá. Abaixo vou trazer o valor para o S&P500 (^GSPC), NASDAQ (^IXIC), German DAX (^GDAXI) e Ibovespa (^BVSP):

In [None]:
indices = ['^GSPC', '^IXIC', '^GDAXI', '^BVSP']
indexes = pd.DataFrame()
for indice in indices:
    indexes[indice] = wb.DataReader(indice, data_source = 'yahoo', start='2019-1-1')['Adj Close']

In [None]:
indexes

In [None]:
indexes.info()

In [None]:
(indexes / indexes.iloc[0] * 100).plot(figsize=(15, 6))
plt.show()

In [None]:
ind_retornos = (indexes / indexes.shift(1)) - 1

In [None]:
ind_retornos

In [None]:
ind_retorno_anual = ind_retornos.mean()
ind_retorno_anual

Veja que tudo que eu fiz acima com os índices foi bem semelhante ao que eu havia feito com as diferentes ações, o único objetivo foi mostrar como isso pode ser feito para diferentes tipos de ativos e derivativos.

O que podemos fazer, que acaba sendo um benchmark interessante, é trazer, junto com tickers de ações, o índice do qual essa ação faz parte! Veja:

In [None]:
tickers2 = ['VVAR3.SA', 'PETR4.SA', '^BVSP']
carteira2= pd.DataFrame()

for t in tickers2:
    carteira2[t] = wb.DataReader(t, 'yahoo', start='1-1-2015', end='1-1-2020')['Adj Close']

In [None]:
carteira2

In [None]:
carteira2.info()

In [None]:
(carteira2 / carteira2.iloc[0] * 100).plot(figsize=(16,8))
plt.show()

In [None]:
retornos2 = (carteira2 / carteira2.shift(1) - 1)
retornos2

In [None]:
retornos2.mean()

In [None]:
retornos2.mean() * 252

A parte de código é bem semelhante ao que eu havia explicado anteriormente, porém o interessante é realizar a análise em si desses dados. Porque lembre-se: <br><br>

O Python e as APIs são uma excelente ferramenta pela qual você consegue extrair e manipular os dados, fazendo diferentes tipos de cálculos. Porém, o Python nunca vai conseguir fazer uma análise por você, isso dificilmente pode ser programado!

# Risco

Agora que vimos um pouco sobre como fazer a análise de uma ação por meio de seu retorno, temos que calcular o outro lado, o lado do risco. Mas como o risco pode ser calculado? <br><br>

O risco de um investimento é calculado pela sua variabilidade! Principalmente utilizaremos o cálculo da variância e desvio padrão. <br><br>

Vou mostrar abaixo como calculamos o risco, exemplificando duas ações do mesmo ramo abaixo!

In [None]:
tickers = ['ITSA4.SA', 'BBDC4.SA']
bancos = pd.DataFrame()
for t in tickers:
    bancos[t] = wb.DataReader(t, 'yahoo',start='2010-1-1', end='2020-1-1')['Adj Close']

In [None]:
bancos

In [None]:
bancos.info()

Uma coisa que você pode ter notado, sempre que eu importo algum DataFrame, eu utilizo esse método **.info()** para dar uma verificada básica nos dados, e veja que, nesse DataFrame, e em alguns outros, eles vem com partes faltantes dos dados que eu puxei, e isso pode ser comum trabalhando com APIs, principalmente as gratuitas. Mas, para efeito de demonstração, ou até mesmo para uma análise pessoal, a falta não é tão significativa e isso mais do que supre a necessidade aqui presente.

In [None]:
(bancos / bancos.iloc[0]*100).plot(figsize=(16,8))
plt.show

Simplesmente pela análise do gráfico, já podemos ter alguma ideia do que as análises seguintes nos dirão. Observando o gráfico consigo ver que o preço da ação do Bradesco obteve maiores retornos mas ao mesmo tempo, também variou mais, veja que em momentos de tendência de queda, a ação do Bradesco caiu mais do que a do Itau, e o mesmo é válido para tendências de melhora. Vamos ver a seguir se essa análise foi correta, a minha previsão é que isso se traduza em um maior retorno médio da ação do Bradesco, mas ao mesmo tempo um maior risco, que será evidênciado pelo seu desvio padrão.

In [None]:
retornos = (bancos/bancos.shift(1)) -1
retornos

In [None]:
retornos.mean()

In [None]:
retornos.mean()*252

Até agora a análise pareceu correta, o retorno do Bradesco foi maior do que o Itaú para o período selecionado.

In [None]:
retornos.std()

In [None]:
#para anualizar desvpad, temos que multiplicar pela raiz quadrada de 252, já que quando anualizamos var, multiplicamos por
# 252 direto
riscos = retornos.std()*(252**0.5) #eleva a 0.5 = tirar raiz quadrada
riscos

Assim como o risco também foi maior! Veja que a lógica do Risco x Retorno se aplicou muito bem neste caso, tivemos ações bem comparáveis, do mesmo setor, e ao analisá-las, vimos que para a ação que trouxe um maior retorno, também tivemos uma maior variabilidade, ou risco, ou volatilidade, como quiser chamar!

In [None]:
type(riscos)

In [None]:
variancias = retornos.var()
variancias * 252

In [None]:
bancos_cov = retornos.cov() *252
bancos_cov

Acima temos uma matriz de covariância, criada pelo método **.cov()**. No qual, na diagonal principal, temos as variâncias de cada ativo, e na diagonal secundária temos a covariância entre os ativos. Essa matriz será utilizada para posteriormente calcular a variância e volatilidade de um portfolio!

In [None]:
retornos.corr()

### Calculando o risco de um portfolio

Agora vamos supor que eu queria calcular a variância do meu portfolio, o que eu posso fazer é utilizar a seguinte fórmula:

![image.png](attachment:image.png)

A medida de risco de um portfolio, depende da volatilidade dos ativos que estão inseridos nele, do peso desses ativos, mas também da covariância entre esses ativos, de forma que se eu tiver um portfolio diversificado no sentido de ter ações com baixa correlação entre si, eu poderei assim ter um portfolio com um menor risco!

Para fazer esse cálculo em Python, utiliza-se a matriz de covariância, calculada acima, e também deve-se ter um array com os respectivos pesos de cada ativo na carteira. <br><br>

Vamos fazer a seguir, como se eu tivesse construído uma carteira com as ações de Bradesco e Itau SA:

In [None]:
pesos_iguais = np.array([0.5, 0.5])
peso_itau = np.array([0.8,0.2])

In [None]:
bancos_variancia = np.dot(pesos_iguais.T, np.dot(bancos_cov, pesos_iguais))
bancos_variancia

O código acima faz o seguinte: por meio do método **.T**, podemos transpor uma matriz, então fazemos a multiplicação da matriz de pesos, transposta, pela matriz resultante da multiplicação entre a matriz de covariância (já anualizada) e a matriz de pesos. O resultado de toda essa multiplicação nos retorna um único número, que no caso é a variância do portfolio!

Acredito que essa imagem, que mostra o cálculo com matrizes) possa elucidar um pouco melhor como funciona o cálculo: <br><br>

![image.png](attachment:image.png)

In [None]:
bancos_volatilidade = bancos_variancia ** 0.5
bancos_volatilidade

Abaixo, vou tentar mostrar que, se tivéssemos alocado mais recursos para ações do Itaú em nosso portfolio, teríamos assim um portfolio menos arriscado. Mas antes, vou criar uma função que facilitará a nossa vida para calcular a variância de um portfolio:

In [None]:
def pfvar(pesos, matriz_cov):
    try:
        variancia = np.dot(pesos.T, np.dot(matriz_cov, pesos))
    except:
        print("Você deve introduzir os seguintes parâmetros, respectivamente: Pesos, como np.array, e matriz_cov, como DataFrame")
    else:
        return variancia

Vamos ver se a função funcionou:

In [None]:
pfvar(pesos_iguais, bancos_cov)

Ok, com a função funcionando, vamos ver se, ao trocarmos o peso da ação do Itaú, se teríamos um portfolio menos arriscado:

In [None]:
pfvar(peso_itau, bancos_cov)

Sim! Isso era inclusive relativamente óbvio, o que você pode tentar fazer é acrescentar mais ações ao portfolio, para assim ter um portfolio mais variado, e verá que o risco tenderá a diminuir, mas o que fará o risco diminuir muito também é acrescentar ações que possuem um menor grau de correlação!

Podemos calcular também o **Risco Sistemático** e o **Risco Idiossincrático** deste portfolio. <br><br>

Caso você não saiba do que é risco sistemático e o que é risco idiossincrático, aqui vai uma breve explicação:

- **O risco sistemático** ou risco não-diversificável é o risco que, em tese, não pode ser eliminado da sua carteira de investimento por meio da diversificação dos ativos da sua carteira. Podemos pensar no exemplo de uma recessão global, ou até mesmo a pandemia da Covid-19 até certa medida, quando quase o mundo inteiro entrou em lockdown e a economia global desacelerou fortemente. Neste caso, ter um portfolio diversificado não iria te ajudar muito, já que praticamente todos os ativos das bolsas globais estavam em forte declínio (claro que existem exceções a regra). <br><br>

- **O risco idiossincrático** ou risco diversificável é o risco de ativos em específico, que podemos tentar mitigar do nosso portfólio por meio da diversificação. Podemos pensar no exemplo no risco de uma indústria na qual uma de suas fábricas pega fogo; neste caso, a empresa sofrerá uma desvalorização, mas ao mesmo tempo, por conta de nosso portfolio ser diversificado, esta desvalorização pode ter seu impacto reduzido pela valorização da ação de uma outra empresa que não tem nada a ver com a que sofreu a desvalorização.

Bom, após ter entendido quais são os dois tipos de risco, vamos partir para o cálculo: