# Projeto 2: Análise CDI

### Desafio:

* Análise de rentabilidade do CDI, pegando dados direto do Banco Central, criando uma calculadora de retorno desde 1994 e avaliando janelas de retornos.

----------------------------------------------


## Questão 1

O fundo mais lucrativo da principal empresa de gestão de ativos de Gotham City segue uma regra simples: o lucro é o juro composto calculado com a taxa de juros SELIC. Seu desafio é criar um programa que calcule uma série que contenha o lucro total, dado um valor inicial de capital em um determinado período de tempo (data de início, data de término) com diferentes frequências (frequência). Sua solução deve seguir as restrições abaixo:

* A data de início deve ser maior ou igual a 1995-01-01.
* A data de término deve ser posterior à data de início.
* A frequência deve ser: dia, mês ou ano.

### Passo a passo:

*   **Passo 1** - Instalar e importar os módulos e bibliotecas.
   
   
*   **Passo 2** - Coletar dados do usuário.
   
   
*   **Passo 3** - Tratar dados coletados.
   
   
*   **Passo 4** - Pegar dados da SELIC do banco central.
   
   
*   **Passo 5** - Calcular retorno do período.
   
-------------------

## Questão 2


Depois de desenvolver sua solução, responda a esta pergunta:

Qual foi o período mais lucrativo de 500 dias corridos desde 2000-01-01 até 2022-03-31? Ou seja, se você tivesse que investir um valor C de capital por 500 dias, qual teria sido o período mais lucrativo desde o início de 2000 até o final de março de 2022? Sua resposta deve ser as datas de início e término do período encontrado.

### Passo a passo:

*   **Passo 1** - Filtrar dados da selic no período da questão. 
   
   
*   **Passo 2** - Calcular rentabilidade das janelas de 500 dias.
   
   
*   **Passo 3** - Criar range de datas na tabela.
   
   
*   **Passo 4** - Pegar o maior retorno da tabela.

# Questão 1

# Passo 1 - Instalar e importar os módulos e bibliotecas

In [17]:
!pip install python-bcb



In [19]:
from datetime import datetime, date
from matplotlib import pyplot as plt
import numpy as np
from bcb import sgs

# Passo 2 - Coletar dados do usuário

In [21]:
capital = float(input("Digite o capital investido: "))
frequencia = input("Digite a frequência do período (Y, M, D): ")
inicio = input("Digite a data inicial maior do que 1995/01/01 no formato YYYY/MM/DD: ")
final = input("Digite a data final no seguinte formato YYYY/MM/DD: ")

Digite o capital investido:  1000
Digite a frequência do período (Y, M, D):  M
Digite a data inicial maior do que 1995/01/01 no formato YYYY/MM/DD:  1996/01/01
Digite a data final no seguinte formato YYYY/MM/DD:  2023/12/31


In [None]:
frequencia

# Passo 3 - Tratar dados coletados

In [23]:
data_inicial = datetime.strptime(inicio, "%Y/%m/%d").date()
data_final = datetime.strptime(final, "%Y/%m/%d").date()

data_inicial

datetime.date(1996, 1, 1)

# Passo 4 - Pegar dados da SELIC do banco central

In [25]:
taxas_selic = sgs.get({"selic": 11}, start = data_inicial, end = data_final)

taxas_selic

Unnamed: 0_level_0,selic
Date,Unnamed: 1_level_1
1996-01-02,0.120000
1996-01-03,0.119667
1996-01-04,0.114667
1996-01-05,0.113667
1996-01-08,0.113667
...,...
2023-12-22,0.043739
2023-12-26,0.043739
2023-12-27,0.043739
2023-12-28,0.043739


In [26]:
taxas_selic = taxas_selic/100

taxas_selic

Unnamed: 0_level_0,selic
Date,Unnamed: 1_level_1
1996-01-02,0.001200
1996-01-03,0.001197
1996-01-04,0.001147
1996-01-05,0.001137
1996-01-08,0.001137
...,...
2023-12-22,0.000437
2023-12-26,0.000437
2023-12-27,0.000437
2023-12-28,0.000437


# Passo 5 - Calcular retorno do período

In [29]:
capital_acumulado = capital * (1 + taxas_selic["selic"]).cumprod() - 1

capital_acumulado

Date
1996-01-02     1000.200000
1996-01-03     1001.398106
1996-01-04     1002.547526
1996-01-05     1003.688228
1996-01-08     1004.830227
                  ...     
2023-12-22    39888.711891
2023-12-26    39906.159252
2023-12-27    39923.614244
2023-12-28    39941.076872
2023-12-29    39958.547137
Name: selic, Length: 7029, dtype: float64

In [33]:
capital_com_frequencia = capital_acumulado.resample(frequencia).last()

capital_com_frequencia

  capital_com_frequencia = capital_acumulado.resample(frequencia).last()


Date
1996-01-31     1024.764965
1996-02-29     1048.885472
1996-03-31     1072.201557
1996-04-30     1094.395862
1996-05-31     1116.443476
                  ...     
2023-08-31    38482.736539
2023-09-30    38857.145487
2023-10-31    39244.781610
2023-11-30    39604.268192
2023-12-31    39958.547137
Freq: ME, Name: selic, Length: 336, dtype: float64

# Questão 2

# Passo 1 - Filtrar dados da selic no período da questão.

In [36]:
data_inicial_2 = date(2000, 1, 1)
data_final_2 = date(2022, 3, 31)

In [38]:
selic_questao_2 = sgs.get({"selic": 11}, start = data_inicial_2, end = data_final_2)/100

selic_questao_2

Unnamed: 0_level_0,selic
Date,Unnamed: 1_level_1
2000-01-03,0.000692
2000-01-04,0.000692
2000-01-05,0.000692
2000-01-06,0.000693
2000-01-07,0.000693
...,...
2022-03-25,0.000437
2022-03-28,0.000437
2022-03-29,0.000437
2022-03-30,0.000437


# Passo 2 - Calcular rentabilidade das janelas de 500 dias

In [41]:
janelas_500_dias = ((1 + selic_questao_2).rolling(window = 500).apply(np.prod) - 1)

janelas_500_dias

Unnamed: 0_level_0,selic
Date,Unnamed: 1_level_1
2000-01-03,
2000-01-04,
2000-01-05,
2000-01-06,
2000-01-07,
...,...
2022-03-25,0.086543
2022-03-28,0.086864
2022-03-29,0.087185
2022-03-30,0.087506


In [43]:
janelas_500_dias = janelas_500_dias.reset_index()

janelas_500_dias

Unnamed: 0,Date,selic
0,2000-01-03,
1,2000-01-04,
2,2000-01-05,
3,2000-01-06,
4,2000-01-07,
...,...,...
5583,2022-03-25,0.086543
5584,2022-03-28,0.086864
5585,2022-03-29,0.087185
5586,2022-03-30,0.087506


# Passo 3 - Criar range de datas na tabela

In [46]:
janelas_500_dias["data_inicial"] = janelas_500_dias["Date"].shift(500)

janelas_500_dias

Unnamed: 0,Date,selic,data_inicial
0,2000-01-03,,NaT
1,2000-01-04,,NaT
2,2000-01-05,,NaT
3,2000-01-06,,NaT
4,2000-01-07,,NaT
...,...,...,...
5583,2022-03-25,0.086543,2020-03-27
5584,2022-03-28,0.086864,2020-03-30
5585,2022-03-29,0.087185,2020-03-31
5586,2022-03-30,0.087506,2020-04-01


In [48]:
janelas_500_dias = janelas_500_dias.dropna()

janelas_500_dias

Unnamed: 0,Date,selic,data_inicial
500,2002-01-02,0.377688,2000-01-03
501,2002-01-03,0.377689,2000-01-04
502,2002-01-04,0.377689,2000-01-05
503,2002-01-07,0.377688,2000-01-06
504,2002-01-08,0.377687,2000-01-07
...,...,...,...
5583,2022-03-25,0.086543,2020-03-27
5584,2022-03-28,0.086864,2020-03-30
5585,2022-03-29,0.087185,2020-03-31
5586,2022-03-30,0.087506,2020-04-01


In [50]:
janelas_500_dias.columns = ["data_final", "retorno_selic_500d", "data_inicial"]

janelas_500_dias

Unnamed: 0,data_final,retorno_selic_500d,data_inicial
500,2002-01-02,0.377688,2000-01-03
501,2002-01-03,0.377689,2000-01-04
502,2002-01-04,0.377689,2000-01-05
503,2002-01-07,0.377688,2000-01-06
504,2002-01-08,0.377687,2000-01-07
...,...,...,...
5583,2022-03-25,0.086543,2020-03-27
5584,2022-03-28,0.086864,2020-03-30
5585,2022-03-29,0.087185,2020-03-31
5586,2022-03-30,0.087506,2020-04-01


# Passo 4 - Pegar o maior retorno da tabela

In [54]:
maior_retorno = janelas_500_dias["retorno_selic_500d"].max()

maior_retorno

0.4669665013674005

In [56]:
gabarito = janelas_500_dias[janelas_500_dias["retorno_selic_500d"] == maior_retorno]

gabarito

Unnamed: 0,data_final,retorno_selic_500d,data_inicial
956,2003-10-22,0.466967,2001-10-26
