# Cotas de Fundos CVM

## Importando Bibliotecas

In [None]:
import pandas as pd
import requests
import zipfile
from validate_docbr import CPF, CNPJ
from datetime import date

## Funções

In [None]:
#Tratamento de erros
def cnpj_e_valido(cnpj):
    if len(cnpj) == 14:
        validate_cnpj = CNPJ()
        return validate_cnpj.validate(cnpj)
    else:
        raise ValueError("CNPJ inválido: ", cnpj)
    
def cnpj_in_tbl(cnpj):
    if cnpj in fundos_2023.values:
        return True
    else:
        raise ValueError("CNPJ não encontrado na tabela", cnpj)            

## Request dos dados (Site CVM)

In [None]:
#Importando ano e mes atuais
anomes_atual = date.today()
anomes_atual = str(anomes_atual).replace('-', '')[:6]

#lista meses do ano
meses_ano = []
for mes in range(1, (int(anomes_atual[4:6])+1)):
    meses_ano.append(mes)

#Novo df
fundos_2023 = pd.DataFrame()

In [None]:
#leitura zip(csv) internet
for mes in range(1, (len(meses_ano)+1)):
    url = f'https://dados.cvm.gov.br/dados/FI/DOC/INF_DIARIO/DADOS/inf_diario_fi_{anomes_atual[:5]}{mes}.zip'
    df = pd.read_csv(url, sep = ";", encoding= "ISO-8859-1")
    fundos_2023 = fundos_2023.append(df)

#### Download Zip - Opcional caso queira baixar a base de algum mês

In [None]:
# #download zip
# year = '2023'
# month = '01'
# link = f'https://dados.cvm.gov.br/dados/FI/DOC/INF_DIARIO/DADOS/inf_diario_fi_{year}{month}.zip'
# download = requests.get(url)

# with open(f"inf_diario_fi_{year}{month}.zip", "wb") as arquivo_cvm:
#     arquivo_cvm.write(download.content)

# arquivo_zip = zipfile.ZipFile(f"inf_diario_fi_{year}{month}.zip")

In [None]:
# dados_fundos = pd.read_csv(arquivo_zip.open(arquivo_zip.namelist()[0]), sep = ";", encoding= "ISO-8859-1")

#### DataFrame Nomes

In [None]:
#Nome dos fundos
dados_cadastro = pd.read_csv("https://dados.cvm.gov.br/dados/FI/CAD/DADOS/cad_fi.csv", sep= ";", encoding= "ISO-8859-1")
dados_cadastro = dados_cadastro[["CNPJ_FUNDO", "DENOM_SOCIAL"]]
dados_cadastro = dados_cadastro.drop_duplicates()

dados_cadastro

## DataFrame Fundos

In [None]:
fundos_2023.head()

In [None]:
fundos_2023 = fundos_2023[['DT_COMPTC', 'CNPJ_FUNDO', 'VL_QUOTA']]
fundos_2023 = fundos_2023.sort_values('DT_COMPTC', axis=0, ascending= True)

In [None]:
fundos_2023.tail()

#### Pesquisar Fundos (CNPJ)

In [None]:
#Pesquisar fundos por CNPJ
lista_cnpj = []
pesquisa = True

while pesquisa == True:
        cnpj = str(input('Digite o CNPJ(somente números) que deseja procurar ou pressione Enter para finalizar a pesquisa: '))
        if cnpj == '':
                pesquisa = False
                print('Você não digitou nenhum mais CNPJ. Pesquisa finalizada.')
        else:
                cnpj_e_valido(cnpj)
                cnpj = CNPJ().mask(cnpj)
                cnpj_in_tbl(cnpj)
                print(cnpj)
                lista_cnpj.append(cnpj)
                
       

        

In [None]:
fundos_filtro = pd.DataFrame()
for cnpj in range(0, len(lista_cnpj)):
    df_pesquisa = fundos_2023.loc[fundos_2023['CNPJ_FUNDO'] == lista_cnpj[cnpj]]
    fundos_filtro = fundos_filtro.append(df_pesquisa)

In [None]:
fundos_filtro

In [None]:
#Opcional - DF com nomes

# fundos_filtro_nome = pd.merge(fundos_filtro, dados_cadastro, how='left',
#                        left_on=['CNPJ_FUNDO'], right_on=['CNPJ_FUNDO'])
# fundos_filtro_nome

In [None]:
# fundo_nome = fundos_filtro_nome.drop_duplicates(['CNPJ_FUNDO'])
# fundo_nome[['CNPJ_FUNDO', 'DENOM_SOCIAL']]

#### Fundos Aleatórios

In [None]:
#Amostra aleatória de fundos
amostra= int(input('Digite quantos fundos deseja selecionar: '))
cnpj_nao_repete = fundos_2023.drop_duplicates()
fundos_aleatorios = list(cnpj_nao_repete['CNPJ_FUNDO'].sample(n=amostra))
fundos_filtro_aleatorios = pd.DataFrame()
for cnpj in range(0, len(fundos_aleatorios)):
    df_pesquisa = fundos_2023.loc[fundos_2023['CNPJ_FUNDO'] == fundos_aleatorios[cnpj]]
    fundos_filtro_aleatorios = fundos_filtro_aleatorios.append(df_pesquisa)
fundos_filtro_aleatorios

In [None]:
check_fundos = [fundos_filtro_aleatorios['CNPJ_FUNDO'].unique()]
check_fundos

## Exportar para excel

In [None]:
data_atual = date.today()
anomes = (str(data_atual).replace('-', ''))[:6]
nome_excel = f'fundos_filtro{anomes}.xlsx'

excel_export = fundos_filtro.copy()
excel_export['CNPJ_FUNDO']=  excel_export['CNPJ_FUNDO'].str.replace('[.,/,-]', '')

In [None]:
#Novo excel
excel_export.to_excel(f'{nome_excel}.xlsx')

In [None]:
#Adicionar dados a um excel existente

excel = pd.read_excel('excel')
excel.append(fundos_filtro)