In [1]:
import io
import json
import zipfile

import httpx
from rich import print as rprint
from tqdm import tqdm

# API

In [2]:
class CamaraAPI:
    def __init__(self) -> None:
        self.base_url = "https://dadosabertos.camara.leg.br/api/v2"

    def request(self, endpoint: str) -> dict:
        response = httpx.get(f"{self.base_url}/{endpoint}")
        return response.json()

    def get_deputados(self) -> dict:
        return self.request("deputados").get("dados", {})

    def get_despesas(self, id_: int, year: int = 2022) -> dict:
        return self.request(f"deputados/{id_}/despesas?ano={year}")

In [3]:
despesas = []

api = CamaraAPI()

deputados = api.get_deputados()
for deputado in tqdm(deputados):
    id_ = deputado["id"]
    despesas_deputado = api.get_despesas(id_=id_, year=2022)
    despesas.extend(despesas_deputado["dados"])
rprint(len(despesas))

100%|██████████| 512/512 [01:37<00:00,  5.25it/s]


In [4]:
rprint(deputados[0])

In [5]:
rprint(despesas[0])

# URL

In [6]:
def get_despesas(url: str) -> dict[str, list[dict[str, list]]]:
    response = httpx.get(url=url)
    zip_content = response.content

    with zipfile.ZipFile(io.BytesIO(zip_content)) as zip_file:
        with zip_file.open(zip_file.namelist()[0]) as json_file:
            json_content = json_file.read().decode("utf-8")

    return json.loads(json_content).get("dados")


url = "https://www.camara.leg.br/cotas/Ano-2022.json.zip"
despesas = get_despesas(url=url)
rprint(len(despesas))

In [7]:
rprint(despesas[0])