In [15]:
import requests
import zipfile
import io
import os
import pandas as pd

def baixar_zip_cvm(tipo:str, ano:int) -> io.BytesIO:
    url_base = f"https://dados.cvm.gov.br/dados/CIA_ABERTA/DOC/{tipo.upper()}/DADOS/{tipo.lower()}_cia_aberta_{ano}.zip"

    if tipo.lower() not in ['dfp', 'cia']:
        raise ValueError("Tipo deve ser 'dfp' ou 'cia'")

    response = requests.get(url_base)
    response.raise_for_status()
    return io.BytesIO(response.content)

def listar_csvs_zip(zip_bytes:io.BytesIO) -> list:
    """Lista os CSVs dentro de um arquivo zip."""
    with zipfile.ZipFile(zip_bytes, 'r') as zip_ref:
        return [name for name in zip_ref.namelist() if name.endswith('.csv')]

In [2]:
def extrair_csv(zip_bytes: io.BytesIO) -> None:
    """Extrai todos os CSVs do zip e salva na pasta 'arquivos'."""
    # Criar pasta 'arquivos' se não existir
    pasta_arquivos = os.path.join(os.getcwd(), 'arquivos')
    os.makedirs(pasta_arquivos, exist_ok=True)
    
    with zipfile.ZipFile(zip_bytes, 'r') as file_zip:
        # Extrair todos os arquivos para a pasta 'arquivos'
        file_zip.extractall(pasta_arquivos)
        print(f"Arquivos extraídos para: {pasta_arquivos}")

In [None]:
if __name__ == "__main__":
    tipo = 'dfp'
    ano = 2024
    zip_bytes = baixar_zip_cvm(tipo, ano)
    extrair_csv(zip_bytes)

In [None]:
pasta_arquivos = os.path.join(os.getcwd(), 'arquivos')
# for arq in os.listdir(pasta_arquivos):
#     print(arq)
# pd.read_csv(pasta_arquivos)
df = pd.read_csv(os.path.join(pasta_arquivos, os.listdir(pasta_arquivos)[3]), sep=';', encoding='latin1')
df_filtered = df[(df['ORDEM_EXERC'] != 'PENÚLTIMO') & (df['CD_CVM'] == 1023)]
df_filtered
