# Variação total e percentual de um ativo de renda variável

## **AVISO LEGAL**

Os ativos que aparecerão neste notebook são meramente ilustrativas e de nenhuma forma representam recomendações de compra.

## Introdução

### Objetivo

A ideia neste notebook é desenvolver um código que retorne um gráfico contendo a variação total e percentual para cada ativo de renda variável dado uma carteira contendo o código do ativo, quantidade comprada, valor da unidade e a data em que a compra foi feita. 

Obs: É possível comprar um mesmo ativo em datas diferentes.

### Definições básicas e generalizações

Definimos a **variação total** de um investimento por

$$ \Delta (t) \equiv A(t) - I(t),$$

onde $A(t)$ é o valor atual do patrimônio em $t$, e $I(t)$ é o valor investido até $t$.

Além disso, definimos a **variação percentual** como

$$ \delta (t) \equiv \frac{A(t) - I(t)}{I(t)} = \frac{A(t)}{I(t)} -1.$$

Essas são as ideias básicas para cumprir o objetivo deste notebook. Feito isso, vamos começar pelo exemplo mais simples e sofisticando-o aos poucos.


#### Ex.1: $q_0$ unidades de um ativo comprados pelo preço (da unidade) $X_0$ em $t_0$

Como $I(t < t_0) = 0$, então não faz sentido fazer um gráfico para $t < t_0$. Daí, para $t > t_0$, $A(t) = q_0 X$, e $I(t) = q_0 X_0$, onde $X = X(t)$ é o preço do ativo em $t$; o que nos leva a 

$$  \Delta (t) = q_0(X - X_0), $$

$$ \delta (t) = \frac{X}{X_0} -1. $$

#### Ex.2: Um mesmo ativo comprado em 2 instantes distintos

Sejam $q_1 = q(t_1)$ e $X_1 = X(t_1)$, com $t_1 > t_0$, e $(q_0,X_0)$ como no exemplo anterior. Logo, para $t_0 < t < t_1$ a variação total continua sendo $\Delta = q_0(X - X_0)$; mas, para $t > t_1$, temos $A(t) = q_0X + q_1X = (q_0 + q_1)X$ e $I(t) = q_0X_0 + q_1X_1$; e assim, definindo a quantidade total $Q$ como

$$ Q \equiv q_0 + q_1,$$

e chamando a média ponderada do preço do ativo comprado nos instantes $t_0$ e $t_1$ de $ \overline{X} $,

$$ \overline{X} \equiv \frac{q_0 X_0 + q_1 X_1}{q_0 + q_1}, $$

segue que

$$ \Delta = (q_0 + q_1)X - (q_0X_0 + q_1X_1)  = Q(X - \overline{X}),$$

$$ \delta = \frac{(q_0 + q_1)X}{q_0 X_0 + q_1 X_1} -1 = \frac{X}{\overline{X}} -1.$$

Portanto,

$$ \Delta (t) = \begin{cases} q_0(X - X_0) & t_0 < t < t_1, \\ Q(X - \overline{X}) & t_1 < t. \end{cases}  $$

$$ \delta (t) = \begin{cases} X X_0^{-1} -1 & t_0 < t < t_1, \\ X \overline{X}^{-1} -1 & t_1 < t. \end{cases} $$

#### Ex.3: Um mesmo ativo comprado em $n$ instantes distintos

Fazendo $n$ compras de um mesmo ativo em instantes distintos, é fácil mostrar que as variações terão a mesma estrutura que no caso anterior.

Chamando a quantidade total até a k-ésima compra ($k < n$) por

$$ Q_k \equiv \sum_{i = 0}^k q_i,$$

e a média ponderada até a k-ésima compra por

$$ \overline{X}_k \equiv \frac{1}{Q_k}\sum_{i = 0}^k q_i X_i, $$

segue que a variação total é

$$ \Delta (t) = \begin{cases} q_0(X - X_0) & t_0 < t < t_1, \\ \vdots \\ Q_k(X - \overline{X}_k) & t_k < t < t_{k+1}, \\ \vdots \\ Q_{n-1}(X - \overline{X}_{n-1}) & t_{n-1} < t, \end{cases} $$

e que a variação percentual é

$$ \delta (t) = \begin{cases} X(X_0)^{-1} -1 & t_0 < t < t_1, \\ \vdots \\ X(\overline{X}_k)^{-1} -1 & t_k < t < t_{k+1}, \\ \vdots \\ X(\overline{X}_{n-1})^{-1} -1 & t_{n-1} < t. \end{cases} $$

## Arquivo de entrada

### Inserindo a carteira manualmente

Para nossas análises neste notebook, assumiremos que toda carteira deva ter 4 colunas, que são "Ativo", "Quantidade", "Compra (R$)", e "Data da Compra", onde a última coluna tem que estar no formato "dd/mm/aaaa" (mais tarde faremos a conversão para o formato americano).

Sendo assim, o código para a criação manual de uma carteira com essas características fica

In [5]:
from pandas import DataFrame

Ativos = []
Quantidades = []
Precos = []
Fechas = []

lampada = True
while lampada:
    Ativos.append(input('\nDigite o código do ativo: '))

    Quantidades.append(int(input('Digite a quantidade comprada: ')))

    Precos.append(float(input('Digite o preço de compra da unidade: ')))

    Fechas.append(input('Digite a data da compra no formato dd/mm/aaaa: '))

    char = input('\nGostaria de inserir mais uma compra na carteira? [s/n]: ')

    if char == 'n':
        lampada = False

        carteira = DataFrame({'Ativo':Ativos,
                             'Quantidade':Quantidades,
                             'Compra (R$)':Precos,
                             'Data da Compra':Fechas})

carteira


Digite o código do ativo:  VALE3
Digite a quantidade comprada:  3
Digite o preço de compra da unidade:  112.49
Digite a data da compra no formato dd/mm/aaaa:  13/05/2021

Gostaria de inserir mais uma compra na carteira? [s/n]:  n


Unnamed: 0,Ativo,Quantidade,Compra (R$),Data da Compra
0,VALE3,3,112.49,13/05/2021


Aqui colocamos as ações da Vale apenas como ilustração.

### Inserindo uma carteira pronta

Para uma carteira pronta em arquivo ```.csv```, contendo as informações mencionadas anteriormente, devemos apenas informar os caracteres de separação de colunas, decimais e o nome do arquivo. Assim, usando o arquivo ```CarteiraTeste.csv``` como exemplo de carteira para realizarmos os gráficos, temos

In [1]:
from pandas import read_csv

arquivo = input('Digite o nome do arquivo incluindo o .csv: ')

separador = input('Digite o caractere que separa as colunas: ')

dec = input('Digite o caractere de decimal: ')

carteira = read_csv(arquivo,
                    sep = separador,
                    decimal = dec)

carteira

Digite o nome do arquivo incluindo o .csv:  CarteiraTeste.csv
Digite o caractere que separa as colunas:  ;
Digite o caractere de decimal:  ,


Unnamed: 0,Ativo,Quantidade,Compra (R$),Data da Compra
0,VALE3,3,112.49,13/05/2021
1,PETR4,8,24.04,05/04/2021
2,ITUB4,2,30.8,25/06/2021
3,VALE3,4,96.09,18/03/2022
4,VALE3,15,77.08,04/01/2022
5,ITUB4,9,22.15,14/07/2022


Aqui reiteramos mais uma vez que, neste notebook, os ativos escolhidos possuem finalidade estritamente ilustrativa. Também vale ressaltar que coloquei ativos comprados mais de uma vez para implementar as fórmulas da variação total e percentual.

### Mudando o formato de data

Como faremos uma requisição API do Yahoo Finanças, devemos transformar nossa string num objeto de data, que é feito com a biblioteca ```datetime``` e usando de novo a função ```read_csv```, mas especificando os parâmetros ```parse_dates``` e ```date_parser```.

In [2]:
from datetime import datetime
from pandas import read_csv

def conversor(fecha):
    return datetime.strptime(fecha, '%d/%m/%Y')

carteira = read_csv(arquivo,
                    sep = separador,
                    decimal = dec,
                    parse_dates = ['Data da Compra'],
                    date_parser = conversor)

carteira

Unnamed: 0,Ativo,Quantidade,Compra (R$),Data da Compra
0,VALE3,3,112.49,2021-05-13
1,PETR4,8,24.04,2021-04-05
2,ITUB4,2,30.8,2021-06-25
3,VALE3,4,96.09,2022-03-18
4,VALE3,15,77.08,2022-01-04
5,ITUB4,9,22.15,2022-07-14


## Processamento dos dados

### Criação das Sub-Carteiras

A ideia desta seção é produzir DataFrame's contendo apenas um tipo de ativo através do objeto inicial ```carteira```. 

Antes disso, vamos ordenar toda a tabela pela ordem cronológica da data de compra, pois desta maneira todas as sub-carteiras estarão ordenadas nesse critério.

In [3]:
carteira.sort_values(by = 'Data da Compra',
                     inplace = True)

carteira

Unnamed: 0,Ativo,Quantidade,Compra (R$),Data da Compra
1,PETR4,8,24.04,2021-04-05
0,VALE3,3,112.49,2021-05-13
2,ITUB4,2,30.8,2021-06-25
4,VALE3,15,77.08,2022-01-04
3,VALE3,4,96.09,2022-03-18
5,ITUB4,9,22.15,2022-07-14


Agora vamos obter uma lista ordenada contendo o nome de todos os ativos que existem na carteira. Dentre as diferentes maneiras de fazer isso, vamos criar um conjunto para retirar os elementos repetidos, e depois criar uma lista em cima desse conjunto.

In [4]:
lista = list( set(carteira['Ativo']) )

lista.sort()

lista

['ITUB4', 'PETR4', 'VALE3']

Agora que temos essa lista, vamos percorrê-la de modo que em cada passo vamos criar uma sub-carteira com o método ```loc``` do pandas.

In [5]:
for nome in lista:
    subcarteira = carteira.loc[ carteira['Ativo'] == nome ]
    
    print(subcarteira,'\n')
    # break

   Ativo  Quantidade  Compra (R$) Data da Compra
2  ITUB4           2        30.80     2021-06-25
5  ITUB4           9        22.15     2022-07-14 

   Ativo  Quantidade  Compra (R$) Data da Compra
1  PETR4           8        24.04     2021-04-05 

   Ativo  Quantidade  Compra (R$) Data da Compra
0  VALE3           3       112.49     2021-05-13
4  VALE3          15        77.08     2022-01-04
3  VALE3           4        96.09     2022-03-18 



### Roteiro para os próximos passos

Boa parte das linhas de comando daqui em diante estarão dentro do laço ```for``` do bloco executado anteriormente, porque devemos, para cada subcarteira,

* Atualizar o valor da média ponderada a cada nova compra do mesmo ativo, o que significa criar uma nova coluna na subcarteira correspondente a $\overline{X}_k$

* Coletar a data mais antiga, que é a primeira pois os dados foram organizados de forma ascendente;

* Usar essa data para fazer uma requisição API do Yahoo Finanças e coletar o histórico do preço do ativo no período da primeira compra até hoje, onde ```hoje = datetime.date.today()```;

* Criar 2 DataFrame's com o mesmo número de linhas da tabela do histórico do preço do ativo, em que um é para os valores da Variação Total ($\Delta (t)$), e outro é para a Variação Percentual ($\delta (t)$). Obs: a cada recompra do mesmo ativo, as fórmulas que determinam essas variações mudam.

* Fazer numa mesma tela um gráfico contendo as duas variações. Para isso é necessário haver 2 eixos y, um na direita e outro na esquerda da tela.

### Médias Ponderadas

Voltando à nossa subcarteira.

In [13]:
for nome in lista:
    subcarteira = carteira.loc[ carteira['Ativo'] == nome ]
    
    print(subcarteira)

    break

   Ativo  Quantidade  Compra (R$) Data da Compra
2  ITUB4           2        30.80     2021-06-25
5  ITUB4           9        22.15     2022-07-14


Vamos resetar os índices para conseguir criar uma nova coluna.

In [14]:
for nome in lista:
    subcarteira = carteira.loc[ carteira['Ativo'] == nome ]
    
    subcarteira = subcarteira.reset_index(drop = True)
    
    print(subcarteira)
    
    break

   Ativo  Quantidade  Compra (R$) Data da Compra
0  ITUB4           2        30.80     2021-06-25
1  ITUB4           9        22.15     2022-07-14


Conforme visto na introdução, precisamos saber o valor da soma até a k-ésima compra, o que pode ser implementado com a função abaixo:

In [9]:
def Soma(subcarteira):
    lista_antiga = list(subcarteira['Quantidade'])
    
    lista_nova = []
    for indice in range(0, len(lista_antiga)):
        if indice == 0:
            lista_nova.append(lista_antiga[indice])
        else:
            lista_nova.append( lista_antiga[indice] + lista_nova[indice - 1] )

    return lista_nova

Feito isso, vamos criar a coluna da k-ésima compra.

In [15]:
for nome in lista:
    subcarteira = carteira.loc[ carteira['Ativo'] == nome ]
    
    subcarteira = subcarteira.reset_index(drop = True)
    
    
    subcarteira['Q_k'] = Soma(subcarteira)

      

    print(subcarteira)
    
    break

   Ativo  Quantidade  Compra (R$) Data da Compra  Q_k
0  ITUB4           2        30.80     2021-06-25    2
1  ITUB4           9        22.15     2022-07-14   11


Sendo assim, o próximo passo é criar uma coluna correspondente à k-ésima média ponderada, que pode ser realizado com a função abaixo:

In [11]:
from numpy import average

def Media(subcarteira):
    resultado = []

    valores = list(subcarteira['Compra (R$)'])
    pesos = list(subcarteira['Quantidade'])

    v_parcial = []
    p_parcial = []

    for indice in range(0, len(valores)): # poderia ser len(pesos) também
        v_parcial.append(valores[indice])
        p_parcial.append(pesos[indice])

        media = average(a = v_parcial,
                        weights = p_parcial)

        resultado.append(media)

    return resultado

Aplicando essa função dentro do laço, temos

In [16]:
for nome in lista:
    subcarteira = carteira.loc[ carteira['Ativo'] == nome ]
    
    subcarteira = subcarteira.reset_index(drop = True)
        
    subcarteira['Q_k'] = Soma(subcarteira)

    subcarteira['X_k'] = Media(subcarteira)
    

    print(subcarteira)
    
    break

   Ativo  Quantidade  Compra (R$) Data da Compra  Q_k        X_k
0  ITUB4           2        30.80     2021-06-25    2  30.800000
1  ITUB4           9        22.15     2022-07-14   11  23.722727


### Requisição API

Uma forma de coletar o histórico de um ativo da bolsa de valores é através da biblioteca ```pandas_datareader```. Em particular, faremos uma requisição API do Yahoo Finanças.

Começaremos criando uma função a fim de que o laço ```for``` não fique muito grande. Além disso, vale ressaltar que no site do Yahoo, as empresas estão listadas na forma 'XXXXY.SA', onde 'XXXXY' é o código listado na B3.

In [6]:
from datetime import date
from pandas_datareader import data as web

hoje = date.today()

def yahoo(ativo,tabela):
    
    fechas = list( tabela['Data da Compra'] )
    PrimeiraCompra = fechas[0]
    
    cotacoes = web.DataReader(ativo + '.SA', 
                               data_source = 'yahoo',
                               start = PrimeiraCompra,
                               end = hoje)
    return cotacoes
    

Agora vamos testar essa função no nosso laço.

In [18]:
for nome in lista:
    subcarteira = carteira.loc[ carteira['Ativo'] == nome ]
    
    subcarteira = subcarteira.reset_index(drop = True)
        
    subcarteira['Q_k'] = Soma(subcarteira)

    subcarteira['X_k'] = Media(subcarteira)
    
    df = yahoo(nome,subcarteira)
    
    #print(subcarteira, '\n')

    print(historico)
    
    break
    #print(subcarteira,'\n')

                 High        Low       Open      Close      Volume  Adj Close
Date                                                                         
2021-06-25  32.130001  30.610001  31.980000  30.799999  38927900.0  30.011982
2021-06-28  30.900000  30.049999  30.840000  30.450001  36032900.0  29.670937
2021-06-29  30.440001  29.830000  30.260000  30.150000  30557500.0  29.378611
2021-06-30  30.270000  29.770000  30.000000  29.799999  22510200.0  29.037569
2021-07-01  29.980000  29.320000  29.790001  29.690001  20278100.0  28.944954
...               ...        ...        ...        ...         ...        ...
2022-08-01  23.850000  23.240000  23.850000  23.469999  25039300.0  23.469999
2022-08-02  23.840000  23.379999  23.629999  23.719999  21401200.0  23.719999
2022-08-03  23.940001  23.540001  23.700001  23.889999  20046500.0  23.889999
2022-08-04  24.570000  23.969999  24.049999  24.469999  33908800.0  24.469999
2022-08-05  25.129999  24.230000  24.490000  24.930000  56500800

Tomaremos o preço de fechamento como o valor base para calcular as variações. Assim, vamos excluir as demais colunas.

In [19]:
df.drop(columns = ['High', 'Low', 'Open', 'Volume', 'Adj Close'],
        inplace = True)

df

Unnamed: 0_level_0,Close
Date,Unnamed: 1_level_1
2021-06-25,30.799999
2021-06-28,30.450001
2021-06-29,30.150000
2021-06-30,29.799999
2021-07-01,29.690001
...,...
2022-08-01,23.469999
2022-08-02,23.719999
2022-08-03,23.889999
2022-08-04,24.469999


Note que executamos a linha de comando acima fora do laço para não correr o risco do nosso IP ser banido por fazer várias vezes uma requisição API. Quando terminarmos as análises, colocaremos todo o bloco de códigos desenvolvido daqui em diante de volta ao laço.

## Cálculo de $\Delta (t)$ e $\delta(t)$ propriamente dito

Com todo o processamento de dados que fizemos anteriormente, estamos agora em condições de calcular as variações total e percentual de cada ativo em nossa carteira. 

Para começar, vejamos como ficou a tabela das cotações e a subcarteira.

In [20]:
print(subcarteira, '\n')

print(df)

   Ativo  Quantidade  Compra (R$) Data da Compra  Q_k        X_k
0  ITUB4           2        30.80     2021-06-25    2  30.800000
1  ITUB4           9        22.15     2022-07-14   11  23.722727 

                Close
Date                 
2021-06-25  30.799999
2021-06-28  30.450001
2021-06-29  30.150000
2021-06-30  29.799999
2021-07-01  29.690001
...               ...
2022-08-01  23.469999
2022-08-02  23.719999
2022-08-03  23.889999
2022-08-04  24.469999
2022-08-05  24.930000

[279 rows x 1 columns]


Note que $Q_k = Q(t_k)$, assim como $\overline{X}_k = \overline{X}(t_k)$, isto é, apenas atualizamos os valores da soma das quantidades (pesos) e da média ponderada no instante $t_k$, em que uma nova compra do mesmo ativo é feita.

Tendo isso em vista, vamos criar duas novas colunas associadas a essas grandezas.

In [22]:
df.index[0]

Timestamp('2021-06-25 00:00:00')