In [None]:
import io, zipfile, requests
import pandas as pd

def load_zip_csvs(url_zip: str) -> dict:
    """
    Baixa um .zip de url_zip e devolve um dicionário {nome_arquivo_csv: DataFrame}.
    Tenta ler CSVs com separador ';' e encoding latin1 (padrão CVM).
    """
    r = requests.get(url_zip, timeout=120)
    r.raise_for_status()
    z = zipfile.ZipFile(io.BytesIO(r.content))

    dfs = {}
    for name in z.namelist():
        if name.lower().endswith(".csv"):
            try:
                df = pd.read_csv(z.open(name), sep=";", encoding="latin1", dtype=str)
            except UnicodeDecodeError:
                df = pd.read_csv(z.open(name), sep=";", encoding="utf-8", dtype=str)
            dfs[name] = df
    return dfs

# ===== use =====
# URL do recurso (página):
page_url = "https://dados.cvm.gov.br/dataset/fii-doc-inf_mensal/resource/4389403c-945d-4c2c-9175-b2bd0a9aebf0"

# URL de download direto do arquivo (truque do CKAN):
zip_url = page_url.rstrip("/") + "/download"

dfs = load_zip_csvs(zip_url)

print("Arquivos no ZIP:", list(dfs.keys()))
# Exemplo: concatenar tudo num único DF, guardando o nome do arquivo de origem
df_all = pd.concat([d.assign(_arquivo=k) for k, d in dfs.items()], ignore_index=True)
df_all.head()


Arquivos no ZIP: ['inf_mensal_fii_ativo_passivo_2024.csv', 'inf_mensal_fii_complemento_2024.csv', 'inf_mensal_fii_geral_2024.csv']


Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,Versao,Total_Necessidades_Liquidez,Disponibilidades,Titulos_Publicos,Titulos_Privados,Fundos_Renda_Fixa,Total_Investido,Direitos_Bens_Imoveis,...,Complemento,Bairro,Cidade,Estado,CEP,Telefone1,Telefone2,Telefone3,Site,Email
0,00.332.266/0001-31,2024-01-01,1,10100284.67,655992.79,0,0,9444291.88,527941600,527941600,...,,,,,,,,,,
1,00.332.266/0001-31,2024-02-01,1,9972241.05,205473.32,0,0,9766767.73,527941600,527941600,...,,,,,,,,,,
2,00.332.266/0001-31,2024-03-01,1,8205910.12,2438104.05,0,0,5767806.07,527941600,527941600,...,,,,,,,,,,
3,00.332.266/0001-31,2024-04-01,1,8034489.98,322678.85,0,0,7711811.13,527941600,527941600,...,,,,,,,,,,
4,00.332.266/0001-31,2024-05-01,1,9162986.41,1769620.0,0,0,7393366.41,527941600,527941600,...,,,,,,,,,,


In [None]:
dfs.keys()

dict_keys(['inf_mensal_fii_ativo_passivo_2024.csv', 'inf_mensal_fii_complemento_2024.csv', 'inf_mensal_fii_geral_2024.csv'])

In [None]:
df_balanco = dfs['inf_mensal_fii_ativo_passivo_2024.csv']
df_balanco.head()

Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,Versao,Total_Necessidades_Liquidez,Disponibilidades,Titulos_Publicos,Titulos_Privados,Fundos_Renda_Fixa,Total_Investido,Direitos_Bens_Imoveis,...,Taxa_Administracao_Pagar,Taxa_Performance_Pagar,Obrigacoes_Aquisicao_Imoveis,Adiantamento_Venda_Imoveis,Adiantamento_Alugueis,Obrigacoes_Securitizacao_Recebiveis,Instrumentos_Financeiros_Derivativos,Provisoes_Contigencias,Outros_Valores_Pagar,Total_Passivo
0,00.332.266/0001-31,2024-01-01,1,10100284.67,655992.79,0,0,9444291.88,527941600,527941600,...,105112.97,0,0,0,650002.6,0,0,0,4123262.09,7997634.84
1,00.332.266/0001-31,2024-02-01,1,9972241.05,205473.32,0,0,9766767.73,527941600,527941600,...,105937.62,0,0,0,650002.6,0,0,0,4148900.35,7855284.01
2,00.332.266/0001-31,2024-03-01,1,8205910.12,2438104.05,0,0,5767806.07,527941600,527941600,...,105937.62,0,0,0,650002.6,0,0,0,3575421.91,6330051.27
3,00.332.266/0001-31,2024-04-01,1,8034489.98,322678.85,0,0,7711811.13,527941600,527941600,...,105937.63,0,0,0,650002.6,0,0,0,3590331.67,6065604.17
4,00.332.266/0001-31,2024-05-01,1,9162986.41,1769620.0,0,0,7393366.41,527941600,527941600,...,105937.63,0,0,0,650002.6,0,0,0,3704538.48,6039318.8


In [None]:
df_balanco.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 11957 entries, 0 to 11956
Data columns (total 52 columns):
 #   Column                                     Non-Null Count  Dtype 
---  ------                                     --------------  ----- 
 0   CNPJ_Fundo_Classe                          11957 non-null  object
 1   Data_Referencia                            11957 non-null  object
 2   Versao                                     11957 non-null  object
 3   Total_Necessidades_Liquidez                11957 non-null  object
 4   Disponibilidades                           11888 non-null  object
 5   Titulos_Publicos                           10110 non-null  object
 6   Titulos_Privados                           9728 non-null   object
 7   Fundos_Renda_Fixa                          11363 non-null  object
 8   Total_Investido                            11957 non-null  object
 9   Direitos_Bens_Imoveis                      11957 non-null  object
 10  Terrenos                          

In [None]:
df_tratado = df_balanco[['CNPJ_Fundo_Classe', 'Data_Referencia', 'Versao','Obrigacoes_Aquisicao_Imoveis', 'Obrigacoes_Securitizacao_Recebiveis', 'Instrumentos_Financeiros_Derivativos', 'Outros_Valores_Pagar']]
df_tratado['Passivo Financeiro'] = df_tratado['Obrigacoes_Aquisicao_Imoveis'].astype(float) + df_tratado['Obrigacoes_Securitizacao_Recebiveis'].astype(float) + df_tratado['Instrumentos_Financeiros_Derivativos'].astype(float) + df_tratado['Outros_Valores_Pagar'].astype(float)
df_tratado.head()

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_tratado['Passivo Financeiro'] = df_tratado['Obrigacoes_Aquisicao_Imoveis'].astype(float) + df_tratado['Obrigacoes_Securitizacao_Recebiveis'].astype(float) + df_tratado['Instrumentos_Financeiros_Derivativos'].astype(float) + df_tratado['Outros_Valores_Pagar'].astype(float)


Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,Versao,Obrigacoes_Aquisicao_Imoveis,Obrigacoes_Securitizacao_Recebiveis,Instrumentos_Financeiros_Derivativos,Outros_Valores_Pagar,Passivo Financeiro
0,00.332.266/0001-31,2024-01-01,1,0,0,0,4123262.09,4123262.09
1,00.332.266/0001-31,2024-02-01,1,0,0,0,4148900.35,4148900.35
2,00.332.266/0001-31,2024-03-01,1,0,0,0,3575421.91,3575421.91
3,00.332.266/0001-31,2024-04-01,1,0,0,0,3590331.67,3590331.67
4,00.332.266/0001-31,2024-05-01,1,0,0,0,3704538.48,3704538.48


In [None]:
df_ativo = dfs['inf_mensal_fii_complemento_2024.csv']
df_ativo_resumido = df_ativo[['CNPJ_Fundo_Classe', 'Data_Referencia', 'Versao', 'Valor_Ativo']]
df_ativo_resumido.head()

Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,Versao,Valor_Ativo
0,00.332.266/0001-31,2024-01-01,1,544330044.22
1,00.332.266/0001-31,2024-02-01,1,543161340.95
2,00.332.266/0001-31,2024-03-01,1,541837679.95
3,00.332.266/0001-31,2024-04-01,1,542032595.61
4,00.332.266/0001-31,2024-05-01,1,543088456.25


In [None]:
df_agrupado = df_tratado.merge(df_ativo_resumido, on=['CNPJ_Fundo_Classe', 'Data_Referencia', 'Versao'])
df_agrupado['Valor_Ativo'] = df_agrupado['Valor_Ativo'].astype(float)
df_agrupado.head()

Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,Versao,Obrigacoes_Aquisicao_Imoveis,Obrigacoes_Securitizacao_Recebiveis,Instrumentos_Financeiros_Derivativos,Outros_Valores_Pagar,Passivo Financeiro,Valor_Ativo
0,00.332.266/0001-31,2024-01-01,1,0,0,0,4123262.09,4123262.09,544330000.0
1,00.332.266/0001-31,2024-02-01,1,0,0,0,4148900.35,4148900.35,543161300.0
2,00.332.266/0001-31,2024-03-01,1,0,0,0,3575421.91,3575421.91,541837700.0
3,00.332.266/0001-31,2024-04-01,1,0,0,0,3590331.67,3590331.67,542032600.0
4,00.332.266/0001-31,2024-05-01,1,0,0,0,3704538.48,3704538.48,543088500.0


In [None]:
df_agrupado.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 11957 entries, 0 to 11956
Data columns (total 9 columns):
 #   Column                                Non-Null Count  Dtype  
---  ------                                --------------  -----  
 0   CNPJ_Fundo_Classe                     11957 non-null  object 
 1   Data_Referencia                       11957 non-null  object 
 2   Versao                                11957 non-null  object 
 3   Obrigacoes_Aquisicao_Imoveis          10135 non-null  object 
 4   Obrigacoes_Securitizacao_Recebiveis   9984 non-null   object 
 5   Instrumentos_Financeiros_Derivativos  9612 non-null   object 
 6   Outros_Valores_Pagar                  11922 non-null  object 
 7   Passivo Financeiro                    9608 non-null   float64
 8   Valor_Ativo                           11957 non-null  float64
dtypes: float64(2), object(7)
memory usage: 840.9+ KB


In [None]:
df_por_fundo = df_agrupado.groupby(['CNPJ_Fundo_Classe'], as_index=False).agg(
    Passivo_Financeiro=('Passivo Financeiro', 'sum'),
    Valor_Ativo=('Valor_Ativo', 'sum')
)

In [None]:
df_por_fundo['Alavancagem'] = df_por_fundo['Passivo_Financeiro']/df_por_fundo['Valor_Ativo']
df_por_fundo.head()

Unnamed: 0,CNPJ_Fundo_Classe,Passivo_Financeiro,Valor_Ativo,Alavancagem
0,00.332.266/0001-31,51328280.0,6461135000.0,0.007944
1,00.613.094/0001-74,2583513000.0,2364211000.0,1.092759
2,00.762.723/0001-28,16766080.0,1286324000.0,0.013034
3,00.868.235/0001-08,26576190.0,1399432000.0,0.018991
4,01.201.140/0001-90,3583614.0,5857945000.0,0.000612


In [None]:
df_por_fundo.to_csv("alavancagem_2024.csv")

In [None]:
df_ativos = dfs['inf_trimestral_fii_ativo_2024.csv']
df_ativos['Data_Referencia'] = pd.to_datetime(df_ativos['Data_Referencia'])

filtro = (
    (df_ativos['CNPJ_Fundo_Classe'] == '36.642.293/0001-58') &
    (df_ativos['Data_Referencia'] == pd.Timestamp('2024-03-31'))
)
df_filtrado = df_ativos.loc[filtro]


In [None]:
df_filtrado

Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,Versao,Tipo,Emissor,CNPJ_Emissor,Emissao,Serie,Codigo_Acao,Nome_Ativo,Data_Vencimento,Quantidade,Valor
23107,36.642.293/0001-58,2024-03-31,1,CRI/CRA,OPEA SECURITIZADORA S.A.,2773542000122,200.0,1.0,,,,2037.0,2012469.74
23108,36.642.293/0001-58,2024-03-31,1,CRI/CRA,OPEA SECURITIZADORA S.A.,2773542000122,1.0,478.0,,,,10000.0,9592983.15
23109,36.642.293/0001-58,2024-03-31,1,CRI/CRA,TRUE SECURITIZADORA S.A.,12130744000100,256.0,1.0,,,,11000.0,10372357.22
23110,36.642.293/0001-58,2024-03-31,1,CRI/CRA,OPEA SECURITIZADORA S.A.,2773542000122,1.0,371.0,,,,11750.0,11136602.26
23111,36.642.293/0001-58,2024-03-31,1,CRI/CRA,VIRGO COMPANHIA DE SECURITIZACAO,8769451000108,4.0,315.0,,,,14687.0,15866817.18
23112,36.642.293/0001-58,2024-03-31,1,Outras Cotas de FI,ITAU SOBERANO RF SIMPLES LP FICFI,6175696000173,,,,,,466870.92,30906277.8
23113,36.642.293/0001-58,2024-03-31,1,CRI/CRA,TRUE SECURITIZADORA S.A.,12130744000100,157.0,1.0,,,,10000.0,7979878.32
23114,36.642.293/0001-58,2024-03-31,1,CRI/CRA,TRUE SECURITIZADORA S.A.,12130744000100,1.0,484.0,,,,12035.0,6469660.45
23115,36.642.293/0001-58,2024-03-31,1,CRI/CRA,VIRGO COMPANHIA DE SECURITIZACAO,8769451000108,4.0,47.0,,,,3090.0,1159451.11
23116,36.642.293/0001-58,2024-03-31,1,CRI/CRA,OPEA SECURITIZADORA S.A.,2773542000122,109.0,1.0,,,,3456.0,3408086.48


In [None]:
df_resumo = (
    df_filtrado
    .groupby(["CNPJ_Fundo_Classe", "Data_Referencia"], as_index=False)
    .agg(QTD_Ativos=("CNPJ_Fundo_Classe", "count"))
)

df_resumo.head()

Unnamed: 0,CNPJ_Fundo_Classe,Data_Referencia,QTD_Ativos
0,36.642.293/0001-58,2024-03-31,56


In [None]:
df_resumo.to_csv("ativos_2020.csv")