In [1]:
import pandas as pd
import requests
import sqlite3
import os
import time

## Conexão com o Banco de Dados

In [2]:
db_path = os.path.abspath("../datasets/data.db")
conn = sqlite3.connect(db_path)
cursor = conn.cursor()

## Criação das tabelas

In [3]:
conn.execute("PRAGMA foreign_keys = ON;")

cursor = conn.cursor()

cursor.executescript(
    """
    CREATE TABLE IF NOT EXISTS deputados_56_detalhes (
        id INTEGER NOT NULL PRIMARY KEY,
        nomeCivil TEXT NOT NULL,
        cpf TEXT NOT NULL,
        dataNascimento TEXT,
        dataFalecimento TEXT,
        escolaridade TEXT,
        profissoes TEXT,
        redeSocial TEXT -- Salvar lista como uma str separada por ;
    );

    CREATE TABLE IF NOT EXISTS partidos (
        id INTEGER NOT NULL PRIMARY KEY,
        sigla TEXT NOT NULL UNIQUE,
        nome TEXT NOT NULL,
        urlLogo TEXT,
        uri TEXT NOT NULL
    );

    CREATE TABLE IF NOT EXISTS deputados_56 (
        id INTEGER NOT NULL PRIMARY KEY,
        nome TEXT NOT NULL,
        siglaUf TEXT NOT NULL,
        siglaPartido TEXT NOT NULL,
        urlFoto TEXT NOT NULL,
        uri TEXT NOT NULL,
        FOREIGN KEY (id) REFERENCES deputados_56_detalhes(id) ON DELETE CASCADE
    );

    CREATE TABLE IF NOT EXISTS despesas (
        id_deputado INTEGER NOT NULL,
        ano INTEGER NOT NULL,
        mes INTEGER NOT NULL,
        tipoDespesa TEXT NOT NULL,
        codDocumento INTEGER NOT NULL,
        tipoDocumento TEXT NOT NULL,
        codTipoDocumento INTEGER NOT NULL,
        dataDocumento TEXT NOT NULL,
        numDocumento TEXT NOT NULL,
        valorDocumento REAL NOT NULL,
        valorLiquido REAL NOT NULL,
        urlDocumento TEXT,
        nomeFornecedor TEXT NOT NULL,
        cnpjCpfFornecedor TEXT NOT NULL,
        codLote INTEGER NOT NULL,
        FOREIGN KEY (id_deputado) REFERENCES deputados_56_detalhes(id) ON DELETE CASCADE
    );
    """
)

conn.commit()
conn.close()

## 1) Deputados entre 01/01/2022 - 31/12/2022

In [4]:
base_url = "https://dadosabertos.camara.leg.br/api/v2/deputados"
params = {
    "dataInicio": "2022-01-01",
    "dataFim": "2022-12-31",
    "ordem": "ASC",
    "ordenarPor": "siglaUF"
}


try:
    response = requests.get(base_url, params=params)
    response.raise_for_status()
    data = response.json()

    if "dados" in data and data["dados"]:
        deputados = pd.DataFrame(data["dados"])
        deputados = deputados[["id", "nome", "siglaUf", "siglaPartido", "urlFoto", "uri"]]

        with sqlite3.connect(db_path) as conn:
            deputados.to_sql("deputados_56", conn, if_exists="replace", index=False)
            conn.commit()
            
            print(f"Salvos dados do deputado {deputados['nome']}")
            time.sleep(0.5)
            
    else:
        print("Nenhum dado encontrado.")

    url = None
    if "links" in data:
        for link in data["links"]:
            if link.get("rel") == "next":
                url = link.get("href")
                break

except requests.RequestException as e:
    print(f"Erro na requisição: {e}")

Salvos dados do deputado 0            PERPÉTUA ALMEIDA
1               Antônia Lúcia
2               Flaviano Melo
3                Leo de Brito
4                   Alan Rick
                ...          
828    Carlos Henrique Gaguim
829         Vicentinho Júnior
830               Tiago Dimas
831    Carlos Henrique Gaguim
832                Eli Borges
Name: nome, Length: 833, dtype: object


## 2) Detalhes de cada Deputado

In [5]:
# Função para converter listas de redes sociais para string
def convert_rede_social(rede_social):
    if isinstance(rede_social, list):
        return '; '.join(rede_social)
    return rede_social

In [6]:
try:
    with sqlite3.connect(db_path) as conn:
        cursor = conn.cursor()
        cursor.execute("SELECT id, uri FROM deputados_56")
        uris = cursor.fetchall()

        for id, uri in uris:
            response = requests.get(uri)
            response.raise_for_status()
            data = response.json()
                

            if "dados" in data and data["dados"]:
                dados = data["dados"]
                detalhes = {
                    "id": id,
                    "nomeCivil": dados.get("nomeCivil", ""),
                    "cpf": dados.get("cpf", ""),
                    "dataNascimento": dados.get("dataNascimento", ""),
                    "dataFalecimento": dados.get("dataFalecimento", ""),
                    "escolaridade": dados.get("escolaridade", ""),
                    "profissoes": dados.get("profissoes", ""),
                    "redeSocial": convert_rede_social(dados.get("redeSocial", ""))
                }
                
                
                
                # Verificando se o deputado já está na tabela
                cursor.execute("SELECT id FROM deputados_56_detalhes WHERE id = ?", (id,))
                result = cursor.fetchone()
                
                
                if not result:
                    cursor.execute(
                        """
                        INSERT INTO deputados_56_detalhes (id, nomeCivil, cpf, dataNascimento, dataFalecimento, escolaridade, profissoes, redeSocial)
                        VALUES (:id, :nomeCivil, :cpf, :dataNascimento, :dataFalecimento, :escolaridade, :profissoes, :redeSocial)
                        """,
                        detalhes
                    )
                    cursor.execute("CREATE INDEX IF NOT EXISTS idx_deputados_56_detalhes_id ON deputados_56_detalhes(id)")
                    conn.commit()
            
                time.sleep(0.5)
                print(f"Descrição do Deputado {detalhes['id']} inserido com sucesso")

            else:
                print("Nenhum dado encontrado para a URI:", uri)

except requests.RequestException as e:
    print(f"Erro na requisição: {e}")

except sqlite3.Error as e:
    print(f"Erro no banco de dados: {e}")

Descrição do Deputado 73943 inserido com sucesso
Descrição do Deputado 123756 inserido com sucesso
Descrição do Deputado 141434 inserido com sucesso
Descrição do Deputado 178825 inserido com sucesso
Descrição do Deputado 178836 inserido com sucesso
Descrição do Deputado 178839 inserido com sucesso
Descrição do Deputado 204434 inserido com sucesso
Descrição do Deputado 204435 inserido com sucesso
Descrição do Deputado 204471 inserido com sucesso
Descrição do Deputado 178836 inserido com sucesso
Descrição do Deputado 204471 inserido com sucesso
Descrição do Deputado 204471 inserido com sucesso
Descrição do Deputado 204434 inserido com sucesso
Descrição do Deputado 123756 inserido com sucesso
Descrição do Deputado 123756 inserido com sucesso
Descrição do Deputado 160541 inserido com sucesso
Descrição do Deputado 171617 inserido com sucesso
Descrição do Deputado 178843 inserido com sucesso
Descrição do Deputado 178844 inserido com sucesso
Descrição do Deputado 194260 inserido com sucesso
D

### 2.1) Inserindo profissão de cada Deputado

In [7]:
with sqlite3.connect(db_path) as conn:
    for id, uri in uris:
        try:
            response = requests.get(f"https://dadosabertos.camara.leg.br/api/v2/deputados/{id}/profissoes")
            response.raise_for_status()
            data = response.json()
                            
            if "dados" in data and data["dados"]:
                profissao = data["dados"][0]["titulo"]
                        
                conn.execute("UPDATE deputados_56_detalhes SET profissoes = ? WHERE id = ?", (profissao, id))
                conn.commit()
                
                time.sleep(0.5)
                print("Profissão inserida com sucesso:", id, profissao)
            
        except requests.RequestException as e:
            print(f"Erro na requisição: {e}") 

Profissão inserida com sucesso: 73943 Bancária
Profissão inserida com sucesso: 123756 Economista
Profissão inserida com sucesso: 141434 Engenheiro
Profissão inserida com sucesso: 178825 Advogado
Profissão inserida com sucesso: 178836 Jornalista
Profissão inserida com sucesso: 178839 Médica
Profissão inserida com sucesso: 204434 Procuradora de justiça
Profissão inserida com sucesso: 204435 Professor
Profissão inserida com sucesso: 204471 Jornalista
Profissão inserida com sucesso: 178836 Jornalista
Profissão inserida com sucesso: 204471 Jornalista
Profissão inserida com sucesso: 204471 Jornalista
Profissão inserida com sucesso: 204434 Procuradora de justiça
Profissão inserida com sucesso: 123756 Economista
Profissão inserida com sucesso: 123756 Economista
Profissão inserida com sucesso: 160541 Empresário
Profissão inserida com sucesso: 171617 Eletricista
Profissão inserida com sucesso: 178843 Advogado
Profissão inserida com sucesso: 178844 Advogado
Profissão inserida com sucesso: 194260 

##  4) Detalhes do partido referente ao(s) Deputado(s)

In [8]:
url = "https://dadosabertos.camara.leg.br/api/v2/partidos?dataInicio=2022-01-01&dataFim=2022-12-31&ordem=ASC&ordenarPor=sigla"

todos_partidos = []


while url:  
    response = requests.get(url)

    if response.status_code == 200:
        data = response.json()
        
        for partido in data["dados"]:
            partido_info = {
                "id": partido.get("id", ""),
                "sigla": partido.get("sigla", ""),
                "nome": partido.get("nome", ""),
                "urlLogo": partido.get("urlLogo", ""),
                "uri": partido.get("uri", "")
            }
            todos_partidos.append(partido_info)

        url = None  
        for link in data["links"]: 
            if link.get("rel") == "next":  
                url = link.get("href")
                break  

        time.sleep(0.5)


    else:
        print(f"Erro na requisição ({response.status_code})")
        break


if todos_partidos:
    df_final = pd.DataFrame(todos_partidos)

    with sqlite3.connect(db_path) as conn:
        df_final.to_sql("partidos", conn, if_exists="replace", index=False)

    print("✅ Dados dos partidos armazenados com sucesso no banco de dados!")
else:
    print("❌ Nenhum dado foi coletado.")

✅ Dados dos partidos armazenados com sucesso no banco de dados!


### 4.1) Consultando uri dos partidos e atualizando urlLogo

In [9]:
conn = sqlite3.connect(db_path)
cursor = conn.cursor()

cursor.execute("SELECT id, uri FROM partidos")
partidos = cursor.fetchall()

for id, uri in partidos:
    response = requests.get(uri)
    response.raise_for_status()
    data = response.json()

    if "dados" in data and data["dados"]:
        partido = data["dados"]
        url_logo = partido.get("urlLogo", "")

        cursor.execute("UPDATE partidos SET urlLogo = ? WHERE id = ?", (url_logo, id))
        conn.commit()

        print("URL da logo atualizada com sucesso:", id)

    else:
        print("Nenhum dado encontrado para a URI:", uri)

URL da logo atualizada com sucesso: 36898
URL da logo atualizada com sucesso: 37905
URL da logo atualizada com sucesso: 36769
URL da logo atualizada com sucesso: 36899
URL da logo atualizada com sucesso: 37901
URL da logo atualizada com sucesso: 37907
URL da logo atualizada com sucesso: 36779
URL da logo atualizada com sucesso: 36786
URL da logo atualizada com sucesso: 37906
URL da logo atualizada com sucesso: 36896
URL da logo atualizada com sucesso: 37903
URL da logo atualizada com sucesso: 36813
URL da logo atualizada com sucesso: 36814
URL da logo atualizada com sucesso: 36763
URL da logo atualizada com sucesso: 36832
URL da logo atualizada com sucesso: 36833
URL da logo atualizada com sucesso: 36834
URL da logo atualizada com sucesso: 36835
URL da logo atualizada com sucesso: 36837
URL da logo atualizada com sucesso: 36839
URL da logo atualizada com sucesso: 36844
URL da logo atualizada com sucesso: 36845
URL da logo atualizada com sucesso: 36851
URL da logo atualizada com sucesso

## 5) Despesas de cada Deputado

In [10]:
with sqlite3.connect(db_path) as conn:
    deputados = pd.read_sql_query("SELECT id FROM deputados_56", conn)

deputados_ids = deputados["id"].unique()
despesas_nao_encontradas = []

for deputado in deputados_ids:
    url_despesas = (
        f"https://dadosabertos.camara.leg.br/api/v2/deputados/{deputado}/despesas?"
        f"idLegislatura=56&ano=2022&itens=100&ordem=ASC&ordenarPor=dataDocumento"
    )
    
    while url_despesas:  
        try:
            response = requests.get(url_despesas)
            response.raise_for_status()
            data = response.json()
            
            if "dados" in data and data["dados"]:  
                despesas = pd.DataFrame(data["dados"])

                
                if not despesas.empty:
                    despesas["id_deputado"] = deputado  # Adicionar o ID do deputado
                    despesas = despesas[[
                        "id_deputado", "ano", "mes", "tipoDespesa", "codDocumento", "tipoDocumento",
                        "codTipoDocumento", "dataDocumento", "numDocumento", "valorDocumento",
                        "valorLiquido", "urlDocumento", "nomeFornecedor", "cnpjCpfFornecedor", "codLote"
                    ]]

        
                    with sqlite3.connect(db_path) as conn:
                        despesas.to_sql("despesas", conn, if_exists="append", index=False)
                        
                    time.sleep(0.5)  

            else:
                break


            url_despesas = None
            for link in data.get("links", []):
                if link.get("rel") == "next":
                    url_despesas = link.get("href")
                    break

        except requests.RequestException as e:
            print(f"Erro de requisição para deputado {deputado}: {e}")
            despesas_nao_encontradas.append(deputado)
            break
        except Exception as e:
            print(f"Erro inesperado ao processar deputado {deputado}: {e}")
            despesas_nao_encontradas.append(deputado)
            break


if despesas_nao_encontradas:
    print("Deputados com falha na requisição de despesas:", despesas_nao_encontradas)