<a href="https://colab.research.google.com/github/ohmkas/fundos-de-investimento-/blob/main/Filtragem_de_FIs_conforme_perfil.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Pacotes

In [None]:
! pip install yfinance --upgrade --no-cache-dir
! pip install plotly==4.9.0
! pip install -U kaleido
! pip install psutil
! pip install chart-studio==1.0.0
! pip install seaborn

Collecting yfinance
  Downloading https://files.pythonhosted.org/packages/7a/e8/b9d7104d3a4bf39924799067592d9e59119fcfc900a425a12e80a3123ec8/yfinance-0.1.55.tar.gz
Collecting lxml>=4.5.1
[?25l  Downloading https://files.pythonhosted.org/packages/d2/88/b25778f17e5320c1c58f8c5060fb5b037288e162bd7554c30799e9ea90db/lxml-4.6.2-cp37-cp37m-manylinux1_x86_64.whl (5.5MB)
[K     |████████████████████████████████| 5.5MB 7.8MB/s 
Building wheels for collected packages: yfinance
  Building wheel for yfinance (setup.py) ... [?25l[?25hdone
  Created wheel for yfinance: filename=yfinance-0.1.55-py2.py3-none-any.whl size=22616 sha256=f0d9fe26c6e82816babc9f899d4577df410bde85d18c847199121b38262151dd
  Stored in directory: /tmp/pip-ephem-wheel-cache-eo27n_du/wheels/04/98/cc/2702a4242d60bdc14f48b4557c427ded1fe92aedf257d4565c
Successfully built yfinance
Installing collected packages: lxml, yfinance
  Found existing installation: lxml 4.2.6
    Uninstalling lxml-4.2.6:
      Successfully uninstalled lxml

In [None]:
import numpy as np
import pandas as pd
import plotly.figure_factory as ff
import math
import matplotlib.pyplot as plt
import pandas_datareader.data as web
import yfinance as yf 
yf.pdr_override()
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from pandas.tseries.offsets import BDay
from datetime import date, datetime
from PIL import Image 
import os

In [None]:
def consulta_bc(codigo_bcb): #função que coleta dados do Banco Central
    url = 'http://api.bcb.gov.br/dados/serie/bcdata.sgs.{}/dados?formato=json'.format(codigo_bcb)
    df = pd.read_json(url)
    df['data'] = pd.to_datetime(df['data'], dayfirst=True)
    df.set_index('data', inplace=True)
    return (df)
 
#https://www3.bcb.gov.br/sgspub/consultarvalores/telaCvsSelecionarSeries.paint

# Salvamento 

In [None]:
nome_pasta = 'Invesimento segundo perfil' #local onde será salvo
  
if not os.path.exists("/content/drive/My Drive/"+nome_pasta): #se não existir a pasta  
    os.mkdir("/content/drive/My Drive/"+nome_pasta) #crie a pasta 

caminho = str("/content/drive/My Drive/"+nome_pasta) #salve nessa pasta, nesse caminho

## Base de dados

In [None]:
inicio_analise = '2020-01'

In [None]:
#benchmark's
cdi = consulta_bc(12).loc[inicio_analise:] #coleta o CDI - ativo livre de risco do Brasil
cdi.index = pd.to_datetime(cdi.index) #corrige bug em datas (1)

ibov = web.get_data_yahoo('^BVSP')['Adj Close'].loc[inicio_analise:] #coleta o Ibovespa - indicador renda variável do Brasil
ibov.index = pd.to_datetime(ibov.index)#idem (1)

sep = web.get_data_yahoo('^GSPC')['Adj Close'].loc[inicio_analise:] #Colet o S&P - indicador de renda variável dos EUA
sep.index = pd.to_datetime(sep.index)#idem (1)


#BASE DE DADOS DA CVM

cadastro = pd.read_csv('http://dados.cvm.gov.br/dados/FI/CAD/DADOS/cad_fi.csv', 
                       sep=';', encoding='ISO-8859-1',
                       index_col='CNPJ_FUNDO') #busca o arquivo de cadastro dos FI's da base da CVM


datas = pd.date_range(inicio_analise, date.today(), freq='MS')  #período analisado 
informes = pd.DataFrame() #DataFrame que terá armazenado todos os informes
 
for data in datas:
  try:
    url ='http://dados.cvm.gov.br/dados/FI/DOC/INF_DIARIO/DADOS/inf_diario_fi_{}{:02}.csv'.format(data.year, data.month)
    informe_mensal = pd.read_csv(url, sep=';')    #coleta os dados da base de dados da CVM
  
  except: 
    print("Arquivo {} não encontrado!".format(url))    #se alterarem o URL dos dados, isso será printado
 
  informes = pd.concat([informes, informe_mensal], ignore_index=True) #acumula os informes diários


#******************************************************************************************************  


arrays = [informes['CNPJ_FUNDO'], informes['DT_COMPTC']] #serão agrupados conforme cnpj e data
tuples = list(zip(*arrays)) 
index = pd.MultiIndex.from_tuples(tuples, names=['Fundos', 'Datas']) 
informes.index = index 
informes = informes.drop(columns=['CNPJ_FUNDO', 'DT_COMPTC']) #excluí as colunas que se tornaram indices


#*********************************************************************************************************

#candidatos para investir devem respeitar os critérios seguintes:

#1 - devem possuir patrimônio líquido positivo
#2 - devem ser destinados a investidores em geral

candidatos = informes.xs(str(informes.index[-1][1]),
            level='Datas').sort_values('VL_PATRIM_LIQ',
                                       ascending=False).loc[informes.xs(str(informes.index[-1][1]),
            level='Datas')['NR_COTST'] > 1000] 
#fundos de investimento ordenados pelo patrimônio líquido positivo e pelo número de cotistas superior a mil investidores (investidores em geral)


#************************************************************ correção entre incompatibildiade do comprimento entre candidatos e cadastro


classes = [] #armazenara as classes 
cnpj_equivalente = [] 
for i in candidatos.index: #percorre os cnpj dos candidatos existentes 
  aux = (cadastro.loc[candidatos.index].loc[
                 cadastro.loc[candidatos.index]['SIT'] != 'CANCELADA']['CLASSE'].loc[i]) #coleta apenas fundo de invstimento que nao foram cancelados
  cnpj_equivalente.append(i) #adiciona o cnpj correspondente
  if type(aux) == type('FI'): #se estiver como tipo string, estará no formato correto 
    classes.append(aux) 
  elif type(aux) == type(3.67): #se apresentar float, estára como nan, precisa ser alterado
    classes.append('NÃO INFORMADO')
  else: 
    classes.append(aux.drop_duplicates()[0]) #se apresentar pandas, estará como duplo, pois o loc trouxe mais de um valor

candidatos = pd.concat([candidatos,pd.DataFrame(classes,index=cnpj_equivalente, columns=['CLASSE'])], axis=1)


tipos = [] #armazenara os tipos 
cnpj_equivalente = [] 
for i in candidatos.index: #percorre os cnpj dos candidatos existentes 
  aux = (cadastro.loc[
                 candidatos.index].loc[
                 cadastro.loc[
                 candidatos.index]['SIT'] != 'CANCELADA']['TP_FUNDO'].loc[i]) #coleta apenas fundo de invstimento que nao foram cancelados
  cnpj_equivalente.append(i) #adiciona o cnpj correspondente
  if type(aux) == type('FI'): #idem acima
    tipos.append(aux) 
  elif type(aux) == type(3.67): ##idem acima
    tipos.append('NÃO INFORMADO')
  else: 
    tipos.append(aux.drop_duplicates()[0]) #idem acima

candidatos = pd.concat([candidatos,pd.DataFrame(tipos,index=cnpj_equivalente, columns=['TIPOS'])], axis=1)


qualificado = [] #armazenará o tipo do investidor
cnpj_equivalente = []
for i in candidatos.index: #percorre os cnpj dos candidatos existentes 
  aux = (cadastro.loc[
                 candidatos.index].loc[
                 cadastro.loc[
                 candidatos.index]['SIT'] != 'CANCELADA']['INVEST_QUALIF'].loc[i]) #coleta apenas fundo de invstimento que nao foram cancelados
  cnpj_equivalente.append(i) #adiciona o cnpj correspondente
  if type(aux) == type('N'): #idem acima
    qualificado.append(aux)
  elif type(aux) == type(3.67): ##idem acima
    qualificado.append('NÃO INFORMADO')
  else: 
    qualificado.append(aux.drop_duplicates()[0]) #idem acima

candidatos = pd.concat([candidatos,pd.DataFrame(qualificado,index=cnpj_equivalente, columns=['QUALIFICADO'])], axis=1)


fundos_vl_quota = pd.DataFrame()
for i in candidatos.index:
  fundos_vl_quota[i] = informes.loc[i]['VL_QUOTA'].copy() #busca o valor da cota dos cnpj solicitados
fundos_vl_quota.index = pd.to_datetime(fundos_vl_quota.index)

valor_diario = fundos_vl_quota.pct_change() #informa a variação diária dos ativos
valor_acumulado = (1+valor_diario).cumprod() #informa a rentabilidade acumulada de cada ativo
drawdowns = (1 - valor_acumulado.div(valor_acumulado.cummax()))*-1 #gera o drawdown de cada fundo

criterios = pd.DataFrame()
criterios['Média Diária'] = valor_diario.mean() #calcula a media
criterios['D.P Diário' ] = valor_diario.std() #calcula o desvio padrao
criterios['Rentabilidade Acum'] = valor_acumulado.iloc[-1] #busca o retorno acumulado
criterios['Drawdown Máximo'] = drawdowns.min() #drawdown máximo do período
criterios['Rentabilidade Máxima'] = valor_acumulado.max() #rentabilidade máxima do período
ret_tri = []
dp_tri = []
nenhum_neg = []
for i in valor_diario.columns:
  aux = ((valor_diario[i]+1).rolling(66).apply(np.prod)-1).mean() #calcula a media da rent.
  aux1 = aux = ((valor_diario[i]+1).rolling(66).apply(np.prod)-1).std() #calcula o dp do trimestre
  ret_tri.append(aux)
  dp_tri.append(aux1)
  aux2 = ((valor_diario[i]+1).rolling(66).apply(np.prod)-1).min()
  if aux2 >0:
    nenhum_neg.append('+')
  else: 
    nenhum_neg.append('+-')

criterios['Rentabilidade Trim.'] = ret_tri #concentração dos retornos trimestrais
criterios['D.P Tri'] = dp_tri #desvios padros do trimestre
criterios['Violino'] = nenhum_neg
criterios['CLASSE'] = candidatos['CLASSE'] #classe dos cnpjs escolhidos 
criterios['QUALIFICADO'] = candidatos['QUALIFICADO']
#base de dados finalizada 

criterios.to_csv(caminho+'/criterios_filtragem.csv')

print('Que tipo de investidor você é?')
print('1 para investidor em geral')
print('2 para investidor qualificado')
investidor = input('Digite a numeração correspondente: ')

if investidor == '1':
  investidor = 'N'
  filtro_criterio = criterios.loc[criterios['QUALIFICADO'] == investidor].copy()  #SELECIONA O TIPO DE INVESTIDOR
  print(len(filtro_criterio), '0º filtro')
elif investidor == '2':
  investidor = 'S'
  filtro_criterio = criterios.loc[criterios['QUALIFICADO'] == investidor].copy()
  print(len(filtro_criterio), '0º filtro')

  
print('Você é tolerante a perdas?')
print('1 para não tolerante a perdas (conservador)')
print('2 para tolerante a perdas (sofisticado, arrojado)')
tolerancia = input('Digite a numeração correspondente: ')

if tolerancia == '1': #nao tolerante a perdas
  tolerancia = '+'
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Violino'] == tolerancia]  #somente retornos trimestrais positivos
  print(len(filtro_criterio), '0º filtro')
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Média Diária'] >0] #somente fundos com a média diária positiva
  print(len(filtro_criterio), '1º filtro')
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Rentabilidade Acum'] > 0] #com rentabilidade atual positiva
  print(len(filtro_criterio), '2º filtro')


elif tolerancia == '2': #se tolerante a perdas
  tolerancia = '+-'
  print(len(filtro_criterio), '1º filtro') #pula a seleção do filto do violino, pois seria um comando que puxaria o df completo +- e +
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Média Diária'] >filtro_criterio['Média Diária'].median()] 
  print(len(filtro_criterio), '2º filtro') #somente fundos com a média diária acima da media
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Rentabilidade Acum'] > filtro_criterio['Rentabilidade Acum'].median()*1.2] 
  print(len(filtro_criterio), '3º filtro') #com rentabilidade acumlada 20% superior a media 

print('Quanto a volatilidade, como você se considera?')
print('1 para baixa tolerância (conservador)')
print('2 para média tolerância (sofisticado)')
print('3 para alta tolerância (arrojado)')
volatilidade = input('Digite a numeração correspondente: ')

if volatilidade == '1': #para conservador
  filtro_criterio = filtro_criterio.loc[filtro_criterio['D.P Diário'] <= filtro_criterio['D.P Diário'].mean()*.5] #com baixa volatilidade diaria
  print(len(filtro_criterio), '4º filtro') #desvio padrao deve ser menor 50% menor que a média
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Drawdown Máximo'] <= filtro_criterio['Drawdown Máximo'].mean()*.5]
  print(len(filtro_criterio), '5º filtro') #com drawdown menor que a 50% da média 
  filtro_criterio = filtro_criterio.loc[filtro_criterio['D.P Tri'] <= filtro_criterio['D.P Tri'].median()*.5] #com rent. maxima maior q a mediia
  print(len(filtro_criterio), '6º filtro') #com desvio padrao da rentabilidade trimestral menor que 50% da média


elif volatilidade == '2': #sofisticado/moderado
  filtro_criterio = filtro_criterio.loc[filtro_criterio['D.P Diário'] <= filtro_criterio['D.P Diário'].mean()]
  print(len(filtro_criterio), '4º filtro') #com desvio padrao diario menor que a media 
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Drawdown Máximo'] <= filtro_criterio['Drawdown Máximo'].mean()] 
  print(len(filtro_criterio), '5º filtro') #com o drawdown menor que a media dos fundos
  filtro_criterio = filtro_criterio.loc[filtro_criterio['D.P Tri'] <= filtro_criterio['D.P Tri'].median()] 
  print(len(filtro_criterio), '6º filtro') #com o desvio padrao do retorno trimestral menor que a media


elif volatilidade == '3': #arrojado/agressivo
  filtro_criterio = filtro_criterio.loc[filtro_criterio['D.P Diário'] <= filtro_criterio['D.P Diário'].max()*.8]
  print(len(filtro_criterio), '4º filtro') #com desvio padrao menor que 80% do valor máximo
  filtro_criterio = filtro_criterio.loc[filtro_criterio['Drawdown Máximo'] <= filtro_criterio['Drawdown Máximo'].mean()] 
  print(len(filtro_criterio), '5º filtro') #com drawdown menor que a média
  filtro_criterio = filtro_criterio.loc[filtro_criterio['D.P Tri'] <= filtro_criterio['D.P Tri'].max()*.8] 
  print(len(filtro_criterio), '6º filtro') #com desvio padrao menor que 80% do valor máximo 


#criterios comuns a todos
filtro_criterio = filtro_criterio.loc[filtro_criterio['Rentabilidade Máxima'] >= filtro_criterio['Rentabilidade Máxima'].median()] 
print(len(filtro_criterio), '7º filtro') #com rentabilidade máxima superior a mediana
filtro_criterio = filtro_criterio.loc[filtro_criterio['Rentabilidade Trim.'] >= filtro_criterio['Rentabilidade Trim.'].median()]
print(len(filtro_criterio), '8º filtro') #com rentabilidade trimestral superior a mediana 

filtro_criterio.sort_values(by='Rentabilidade Trim.', ascending=False) #ordena pela rentabilidade trimestral, horizonte minimo de permanencia no fi2

fundos_cnpj = filtro_criterio.index #<<<<<<<<--- inserir sob forma de lista os CNPJ's dos fundos que quer analisar


fundos_vl_total       = pd.DataFrame() #valor total do fundo 
fundos_vl_quota       = pd.DataFrame() #valor da quota do fundo
fundos_vl_pt_liq      = pd.DataFrame() #valor do patrimônio líquido do fundo
fundos_vl_captado     = pd.DataFrame() #valor captado por dia
fundos_vl_resgatado   = pd.DataFrame() #valor resgatado por dia
fundos_vl_cotistas    = pd.DataFrame() #numero de cotistas no dia
 
for i in fundos_cnpj:
  fundos_vl_total[i] = informes.loc[i]['VL_TOTAL'].copy() 
  fundos_vl_quota[i] = informes.loc[i]['VL_QUOTA'].copy()
  fundos_vl_pt_liq[i] = informes.loc[i]['VL_PATRIM_LIQ'].copy()
  fundos_vl_captado[i] = informes.loc[i]['CAPTC_DIA'].copy()
  fundos_vl_resgatado[i] = informes.loc[i]['RESG_DIA'].copy()
  fundos_vl_cotistas[i] = informes.loc[i]['NR_COTST'].copy()


fundos_vl_total = fundos_vl_total.pct_change() #variação diária %
fundos_vl_quota = fundos_vl_quota.pct_change() #variação diária %
fundos_vl_pt_liq = fundos_vl_pt_liq.pct_change() #variação diária %
fundos_vl_captado = fundos_vl_captado.diff() #variação diária unid
fundos_vl_resgatado = fundos_vl_resgatado.diff() #variação diária unid
fundos_vl_cotistas = fundos_vl_cotistas.diff() #variação diária unid

#************************************corrige data para formato datatime
fundos_vl_quota.index = pd.to_datetime(fundos_vl_quota.index) 
fundos_vl_total.index = pd.to_datetime(fundos_vl_total.index)
fundos_vl_pt_liq.index = pd.to_datetime(fundos_vl_pt_liq.index)
fundos_vl_captado.index = pd.to_datetime(fundos_vl_captado.index)
fundos_vl_resgatado.index = pd.to_datetime(fundos_vl_resgatado.index)
fundos_vl_cotistas.index = pd.to_datetime(fundos_vl_cotistas.index)

#*****************************************************************8

fundos_vl_quota['CDI'] = cdi/100 #já vem com var. diaria em %
fundos_vl_quota['Ibovespa'] = ibov.pct_change() #var. dia %
fundos_vl_quota['S&P'] = sep.pct_change() #var. dia %


fundos_diario = {'VL_TOTAL': fundos_vl_total.dropna(),
                    'VL_QUOTA': fundos_vl_quota.dropna(),
                    'VL_PATRIM_LIQ': fundos_vl_pt_liq.dropna(),
                    'CAPTC_DIA':fundos_vl_captado.dropna(),
                    'RESG_DIA':fundos_vl_resgatado.dropna(), 
                    'NR_COTST':fundos_vl_cotistas.dropna()} #reune informações para conveniencia futura

#**********************************************************************************************


fundos_vl_total_acum = (1+fundos_diario['VL_TOTAL']).cumprod()  #acumula os retornos diários
fundos_vl_quota_acum = (1+fundos_diario['VL_QUOTA']).cumprod()
fundos_vl_pt_liq_acum = (1+fundos_diario['VL_PATRIM_LIQ']).cumprod()


fundos_vl_captado_acum = pd.DataFrame()
fundos_vl_resgatado_acum = pd.DataFrame()
fundos_vl_cotistas_acum = pd.DataFrame()

fundos_vl_total_acum = (1+fundos_diario['VL_TOTAL']).cumprod()  #acumula os retornos diários
fundos_vl_quota_acum = (1+fundos_diario['VL_QUOTA']).cumprod()
fundos_vl_pt_liq_acum = (1+fundos_diario['VL_PATRIM_LIQ']).cumprod()

fundos_vl_total_acum.iloc[0] = 1
fundos_vl_quota_acum.iloc[0] = 1
fundos_vl_pt_liq_acum.iloc[0] =1

for i in fundos_cnpj:
  fundos_vl_captado_acum[i] = informes.loc[i]['CAPTC_DIA'].copy()
  fundos_vl_resgatado_acum[i] = informes.loc[i]['RESG_DIA'].copy()
  fundos_vl_cotistas_acum[i] = informes.loc[i]['NR_COTST'].copy()



fundos_acumulado = {'VL_TOTAL': fundos_vl_total_acum.dropna(),
                    'VL_QUOTA': fundos_vl_quota_acum.dropna(),
                    'VL_PATRIM_LIQ': fundos_vl_pt_liq_acum.dropna(),
                    'CAPTC_DIA':fundos_vl_captado_acum.dropna().dropna(),
                    'RESG_DIA': fundos_vl_resgatado_acum.dropna().dropna(), 
                    'NR_COTST': fundos_vl_cotistas_acum.dropna().dropna()} #reune informações para conveniencia futura


informacoes_fundos = {'Diaria': fundos_diario,
                      'Acumulada': fundos_acumulado,
                      }

retornos = pd.DataFrame()
for i in informacoes_fundos['Diaria']['VL_QUOTA']:
  retornos[i] = ((informacoes_fundos['Diaria']['VL_QUOTA'][i]+1).rolling(66).apply(np.prod)-1)
retornos.describe().sort_values(by='mean',axis=1,ascending= False)
#do maior retorno médio mensal para o menor ->>>>>>>>

[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed



Columns (14,17,18,20,22,24,27,37,38) have mixed types.Specify dtype option on import or set low_memory=False.



Que tipo de investidor você é?
1 para investidor em geral
2 para investidor qualificado
Digite a numeração correspondente: 1
1149 0º filtro
Você é tolerante a perdas?
1 para não tolerante a perdas (conservador)
2 para tolerante a perdas (sofisticado, arrojado)
Digite a numeração correspondente: 2
1149 1º filtro
574 2º filtro
77 3º filtro
Quanto a volatilidade, como você se considera?
1 para baixa tolerância (conservador)
2 para média tolerância (sofisticado)
3 para alta tolerância (arrojado)
Digite a numeração correspondente: 2
44 4º filtro
29 5º filtro
15 6º filtro
8 7º filtro
4 8º filtro


Unnamed: 0,19.831.126/0001-36,34.109.625/0001-08,S&P,23.711.486/0001-71,Ibovespa,03.319.016/0001-50,CDI
count,222.0,222.0,222.0,222.0,222.0,222.0,222.0
mean,0.153512,0.136623,0.122346,0.058283,0.057982,0.05731,0.006464
std,0.118662,0.095254,0.127876,0.116347,0.196812,0.116233,0.001911
min,-0.073965,-0.068428,-0.092103,-0.098142,-0.366811,-0.099668,0.004942
25%,0.046483,0.065433,0.038025,-0.034406,-0.022332,-0.035442,0.004942
50%,0.151714,0.136232,0.083998,0.036678,0.080394,0.036244,0.005259
75%,0.229424,0.182856,0.214185,0.097067,0.214573,0.095591,0.007905
max,0.449557,0.45524,0.56291,0.364809,0.434377,0.364317,0.0106


#Dashboard

In [None]:
#padronização das cores nos gráficos
cores = [
                'blueviolet', 'brown', 'burlywood', 'cadetblue',
                'chartreuse', 'chocolate', 'coral', 'cornflowerblue',
                'cornsilk', 'crimson', 'cyan', 'darkblue', 'darkcyan',
                'darkgoldenrod', 'darkgray', 'darkgrey', 'darkgreen',
                'darkkhaki', 'darkmagenta', 'darkolivegreen', 'darkorange',
                'darkorchid', 'darkred', 'darksalmon', 'darkseagreen',
                'darkslateblue', 'darkslategray', 'darkslategrey',
                'darkturquoise', 'darkviolet', 'deeppink', 'deepskyblue',
                'dimgray', 'dimgrey', 'dodgerblue', 'firebrick',
                'floralwhite', 'forestgreen', 'fuchsia', 'gainsboro',
                'ghostwhite', 'gold', 'goldenrod', 'gray', 'grey', 'green',
                'greenyellow', 'honeydew', 'hotpink', 'indianred', 'indigo',
                'ivory', 'khaki', 'lavender', 'lavenderblush', 'lawngreen',
                'lemonchiffon', 'lightblue', 'lightcoral', 'lightcyan',
                'lightgoldenrodyellow', 'lightgray', 'lightgrey' ]

cores_em_uso = []
n=0
for i in informacoes_fundos['Diaria']['VL_QUOTA'].columns.to_list(): #a cada elemento analisado
  cores_em_uso.append(cores[n]) #adicionará uma cor
  n+=1
print(cores_em_uso)
fig = make_subplots(rows=2 ,
                    cols=len(informacoes_fundos['Diaria'].keys()),
                    subplot_titles=("VAR. VL TOTAL", "VAR. VL QUOTA", "VAR. VL PATRIM LQ", "VAR. CAPTAÇÃO", 'VAR. RESGATE', 'VAR. COTISTAS',
                                    "VL TOTAL ACUM.", "Vl QUOTA ACUM.", "VL PATRIM LQ ACUM.", "CAPTAÇÃO ACUM.", 'RESGATE ACUM.', 'COTISTAS ACUM.'))

z=1 #parametro para diferenciar diário de acumulado (t) 
for t in informacoes_fundos.keys(): #percorre os periodos
  c=0 #parametro para manter cores homogêneas
  n=1 #parametro da linha utilizada, deve iniciar em 1 pois é o mínimo para subplot
  
  if t == 'Diaria': #para ocultar as legendas, utilizei essa técnica. Apenas as legendas diárias aparecerão
    for i in informacoes_fundos[t].keys(): #percorre os dados dos informes
      if i == 'VL_QUOTA': #quando chegar no valor da cota
        aux=n  #travar n em aux, pois há cdi, ibovespa e s&p junto
        c=0 #zera o parametro c para retornar a cor inicial 
        for y in informacoes_fundos[t][i].columns: #percorrer todas as colunas da cota
          fig.add_trace(go.Scatter(y=informacoes_fundos[t][i][y], #ativo da vez
                                  x=informacoes_fundos[t][i][y].index, mode="lines", #seu indice respectivo
                                  name=y, #ativo
                                  legendgroup=y, #grupo do ativo
                                  line=dict(color=cores_em_uso[c]), #cor do ativo
                                  ),row=z,col=aux) #parameros evoluem de acordo com a informacao
          c+=1 #segue a sequencia padrao das cores

      
      
      else: #se for diferente de VL_QUOTA, ou seja, todas as outras informações disponíeis
        c=0 #zera a cor para manter homogenidade na sequencia 
        for y in informacoes_fundos[t][i].columns: #percorre a coluna do df da vez (vl_total, patrimonio_liquido, resgate, captação, etc.)
          fig.add_trace(go.Scatter(y=informacoes_fundos[t][i][y],
                                  x=informacoes_fundos[t][i][y].index, mode="lines",
                                  name=y,
                                  legendgroup=y,
                                  showlegend=False,
                                  line=dict(color=cores_em_uso[c])),row=z,col=n)
          c+=1

      n+=1 #percorre a coluna 
    z+=1 # percorre a linha
  
  else: #se nao for variação diaria, entao todas as legendas serao ocultadas
    for i in informacoes_fundos[t].keys(): #percorre os dados dos informes
      if i == 'VL_QUOTA': #quando chegar no valor da cota
        aux=n  #travar n em aux
        c=0
        for y in informacoes_fundos[t][i].columns: #percorrer todas as colunas da cota
          fig.add_trace(go.Scatter(y=informacoes_fundos[t][i][y],
                                  x=informacoes_fundos[t][i][y].index, mode="lines",
                                  name=y,
                                  legendgroup=y,
                                  showlegend=False, #oculta as legendas
                                  line=dict(color=cores_em_uso[c])),row=z,col=aux)
          c+=1

      
      
      else:
        c=0
        for y in informacoes_fundos[t][i].columns:
          fig.add_trace(go.Scatter(y=informacoes_fundos[t][i][y],
                                  x=informacoes_fundos[t][i][y].index, mode="lines",
                                  name=y,
                                  legendgroup=y,
                                  showlegend=False, #oculta as legendas
                                  line=dict(color=cores_em_uso[c]),
                                   ),row=z,col=n)
          c+=1

      n+=1
    z+=1
            
fig.update_layout(
    height=600, 
    width=1300,
    title = 'Informações Gerais',
    template="plotly_white",
    legend_title_text='Comparação entre:',
    legend_orientation="h",
    legend=dict(x=0, y=-.2),
    font=dict(
        family="Times New Roman",
        size=14,
        color="DimGray"
    )
)


fig.show()
fig.write_image(caminho+"/informações_gerais.png")

retornos_pct = pd.DataFrame() #armazena retornos negavitos
for i in informacoes_fundos['Diaria']['VL_QUOTA'].columns: #percorre os ativos existentes
  df = ((informacoes_fundos['Diaria']['VL_QUOTA'][i]+1).rolling(66).apply(np.prod)-1).dropna() #calcula o retorno trimestral
  df = pd.DataFrame(df) #transforma em df 
  retornos_pct[i] = [len(df.loc[df[i] >0][i])/len(df),1-len(df.loc[df[i] >0][i])/len(df)] #somente valores positvos
#valores nulos sao considerados negativos tendo em vista o custo de oportunidade do ativo livre de risco
retornos_pct.index = ['Positivo', 'Negativo']
retornos_pct = retornos_pct.T

fig = go.Figure() #cria gráfico

fig.add_trace(go.Bar(x=retornos_pct.sort_values('Positivo',axis=0, ascending=False).index, 
                     y=retornos_pct.sort_values('Positivo',axis=0, ascending=False)['Positivo'],
                     name='Positivos')) #positivos


fig.add_trace(go.Bar(x=retornos_pct.sort_values('Positivo',axis=0, ascending=False).index, 
                     y=retornos_pct.sort_values('Positivo',axis=0, ascending=False)['Negativo'],
                     name='Negativos')) #negativos


fig.update_layout(
    height=600, 
    width=1300,
    barmode='relative',
    title = 'Porcentagem de retornos trimestrais',
    template="plotly_white",
    legend_title_text='Comparação entre:',
    legend_orientation="h",
    legend=dict(x=0, y=-.2),
    font=dict(
        family="Times New Roman",
        size=14,
        color="DimGray"
    ) #padroniza layout
)
fig.update_yaxes(title_text="Porcentagem (%)",
                  titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 20,
                  color= 'DimGray'
                   ) #padroniza layout

fig.update_xaxes(title_text="Ativo ",
                  titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 20,
                  color= 'DimGray'
                   ) #padroniza layout

fig.show()

fig.write_image(caminho+"/porcentagem_retorno_positivo_versus_negativos.png") #local do salvamento

fig = make_subplots(rows=2 ,
                    cols=1,
                    subplot_titles=('Evolução da rentabilidade do ativo','Drawdown do ativo'))
c=0
for i in informacoes_fundos['Acumulada']['VL_QUOTA'].columns:
  fig.add_trace(go.Scatter(y=informacoes_fundos['Acumulada']['VL_QUOTA'][i],
                           x=informacoes_fundos['Acumulada']['VL_QUOTA'][i].index, 
                           mode="lines+markers", marker=dict(size=5),
                           name=i,
                           legendgroup=i,
                           line=dict(color=cores_em_uso[c])),row=1,col=1)
  c+=1

c=0
for i in informacoes_fundos['Acumulada']['VL_QUOTA'].columns:
  fig.add_trace(go.Scatter(y=informacoes_fundos['Acumulada']['VL_QUOTA'][i].ewm(span=66, adjust=False).mean().dropna(),
                           x=informacoes_fundos['Acumulada']['VL_QUOTA'][i].ewm(span=66, adjust=False).mean().dropna().index, 
                           mode="lines", marker=dict(size=4),
                           name=i,
                           legendgroup=i,
                           showlegend=False,
                           line=dict(color=cores_em_uso[c])),row=1,col=1)
  c+=1

c=0
for i in informacoes_fundos['Acumulada']['VL_QUOTA'].columns:
  fig.add_trace(go.Scatter(y=((1 - informacoes_fundos['Acumulada']['VL_QUOTA'][i].div(informacoes_fundos['Acumulada']['VL_QUOTA'][i].cummax()))*-1).dropna(),
                           x=((1 - informacoes_fundos['Acumulada']['VL_QUOTA'][i].div(informacoes_fundos['Acumulada']['VL_QUOTA'][i].cummax()))*-1).dropna().index, 
                           mode="lines", marker=dict(size=5),
                           name=i,
                           fill='tozeroy',
                           legendgroup=i,
                           showlegend=False,
                           line=dict(color=cores_em_uso[c])),row=2,col=1)
  c+=1


fig.update_layout(
    height=700, 
    width=1300,
    title = 'Evolução acumulada dos ativos',
    template="plotly_white",
    legend_title_text='Comparação entre:',
    legend_orientation="h",
    legend=dict(x=0, y=-.2),
    font=dict(
        family="Times New Roman",
        size=14,
        color="DimGray"
    )
)


fig.update_yaxes(title_text="Rentabilidade (%)",
                  titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 15,
                  color= 'DimGray'
                   ) 

fig.update_xaxes(title_text="Data ",
                  titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 50,
                  color= 'DimGray'
                   ) 

fig.show()

fig.write_image(caminho+"/evolução_dos_ativos.png")

fig = go.Figure()

n=0
for i in informacoes_fundos['Acumulada']['VL_QUOTA'].columns:
  fig.add_trace(go.Indicator(
      value = informacoes_fundos['Acumulada']['VL_QUOTA'][i].ewm(span=66, adjust=False).mean().dropna().iloc[-1],
      delta = {'reference': informacoes_fundos['Acumulada']['VL_QUOTA'][i].ewm(span=66, adjust=False).mean().dropna().iloc[-22]},
      gauge = {
          'axis': {'visible': True}},
      domain = {'row': 0, 'column': n}, title=i[:8],))
  n+=1
  fig.update_layout(
      grid = {'rows': 1, 'columns': len(informacoes_fundos['Acumulada']['VL_QUOTA'].columns), 'pattern': "independent"},
      template = {'data' : {'indicator': [{
          'mode' : "number+delta+gauge"}]
                           }},height=300, width=1300, title='Comparação entre trimestres (Atual - Mês passado)')
fig.show() #comparação entre o o trimestre atual e o trimestre do mês passado

hist_data = []
for i in informacoes_fundos['Diaria']['VL_QUOTA'].columns:
  x1 = ((informacoes_fundos['Diaria']['VL_QUOTA'][i]+1).rolling(66).apply(np.prod)-1).dropna()
  hist_data.append(x1)
 
 
group_labels = informacoes_fundos['Diaria']['VL_QUOTA'].columns 
# Create distplot with custom bin_size
fig = ff.create_distplot(hist_data, group_labels, bin_size=.005, colors = cores_em_uso)

fig.update_layout(
    height=600, 
    width=1300,
    title = 'Frequência dos retornos trimestrais',
    template="plotly_white",
    legend_title_text='Comparação entre:',
    legend_orientation="h",
    xaxis_title='Data',
    yaxis_title="Volume",
    legend=dict(x=0, y=-.2),
    font=dict(
        family="Times New Roman",
        size=14,
        color="DimGray"
    )
)

fig.update_yaxes( titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 20,
                  color= 'DimGray'
                   ) 

fig.update_xaxes( titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 50,
                  color= 'DimGray'
                   ) 

fig.show()

n=0
fig  =  make_subplots ( rows = 1 ,  cols = len(informacoes_fundos['Diaria']['VL_QUOTA'].columns) ,  shared_yaxes = True )
c=1
for i in informacoes_fundos['Diaria']['VL_QUOTA'].columns:
  fig.add_trace(go.Violin(y=((informacoes_fundos['Diaria']['VL_QUOTA'][i]+1).rolling(66).apply(np.prod)-1).dropna(), box_visible=True, line_color='black',
                                 meanline_visible=True, fillcolor=cores_em_uso[n], opacity=0.6, name=i,
                                x0=i,), row=1, col=c)
  c=c+1

  fig.update_layout(yaxis_zeroline=False)
  fig.update_layout(
    height=600, 
    width=1300,
    template="plotly_white",
    title='Concentração dos retornos',
    legend_title_text='Comparação entre:',
    legend_orientation="h",
    legend=dict(x=0, y=-.2),
    yaxis_title="Rentabilidade (%)",
    font=dict(
        family="Times New Roman",
        size=14,
        color="DimGray"
    )
)
  n=n+1


fig.update_yaxes( titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 20,
                  color= 'DimGray'
                   ) 



fig.show()  

amostra_aleatoria = pd.DataFrame() #armazenará a amostra 
for y in fundos_cnpj:
  valores = [] #lista de valores armazenados
  i=0 #variável controle 
  while i <1000000:
    aux = (informacoes_fundos['Diaria']['VL_QUOTA'][y].dropna().sample(66))
    aux = (((aux+1).rolling(66).apply(np.prod))-1).dropna().to_list()[0]
    valores.append(aux)
    i=i+1
  amostra_aleatoria[y] = valores

for i in amostra_aleatoria.columns:  
  x = amostra_aleatoria[i].rolling(66).mean()

  fig = go.Figure(data=[go.Histogram(x=x)]) 
# Create distplot with custom bin_size
  fig.update_layout(
      title = 'Frequencia do retorno Trimestral do ativo: '+str(i),
      height=500, 
      width=1300,
      template="plotly_white",
      legend_title_text='Comparação entre:',
      legend_orientation="h",
      legend=dict(x=0, y=-.2),
      xaxis_title='Data',
      yaxis_title="Volume",
        
      font=dict(
          family="Times New Roman",
          size=14,
          color="DimGray"
      )

  )

  fig.update_yaxes( titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 20,
                  color= 'DimGray'
                   ) 

  fig.update_xaxes( titlefont_size = 16,
                  tickfont_size=14,
                  nticks = 50,
                  color= 'DimGray'
                   ) 
  fig.show()


  maximos_minimos = pd.DataFrame()
for i in amostra_aleatoria.columns:
  df_vez = amostra_aleatoria.sort_values(by =i ,ascending=False).copy()
  ret_min = df_vez.iloc[int(len(df_vez)*.1):int(len(df_vez)*.9)].median()[i] - (2* df_vez.iloc[int(len(df_vez)*.1):int(len(df_vez)*.9)].std()[i])
  ret_max = df_vez.iloc[int(len(df_vez)*.1):int(len(df_vez)*.9)].median()[i] + (2* df_vez.iloc[int(len(df_vez)*.1):int(len(df_vez)*.9)].std()[i])
  maximos_minimos[i] = [ret_min,ret_max]
maximos_minimos.index = ['Mínimo esperado','Máximo esperado']
maximos_minimos