# Projeto de captura de dados dos e-democracia
O projeto e-democracia da câmara dos deputados possui uma base extensa de audiências públicas e outras interações entre o legislativo e a comunidade brasileira. Visando a disponibilidade de dados para pesquisa e proteção desses dados em caso do projeto ser descontinuado, foi construido esse código de captura de dados e tabulação do formato Json para Csv.


## Bibliotecas utilizadas

In [2]:
import pandas as pd
import requests
from oauth2client.service_account import ServiceAccountCredentials
import pygsheets
from datetime import date
from urllib.request import urlopen
import json
from bs4 import BeautifulSoup
from tqdm import tqdm

### Captura de mensagens do e-democracia
Hoje o link de captura dos dados em api pública é o https://edemocracia.camara.leg.br/audiencias/api/message/?page=

Para realizar a captura se faz necessário verificar qual a última página da pesquisa, hoje é a de 556

In [3]:
# O valor da última pagina deve ser colocado no segundo campo 
paginas = [*range(1,557)]

In [4]:
df1 = pd.DataFrame()
for pag in tqdm(paginas):
    response = urlopen(f"https://edemocracia.camara.leg.br/audiencias/api/message/?page={pag}")
    json_data = response.read().decode('utf-8', 'replace')
    d = json.loads(json_data)
    message = pd.DataFrame(d['results'])
    df1 = pd.concat([df1,message], ignore_index=True)

 13%|█▎        | 74/556 [02:54<22:17,  2.78s/it]

In [None]:
from pathlib import Path  
filepath = Path('DadosEdemocracia/mensagens.csv')  
filepath.parent.mkdir(parents=True, exist_ok=True)  
df1.to_csv(filepath) 

### Captura de audiências do e-democracia
Hoje o link de captura dos dados em api pública é o https://edemocracia.camara.leg.br/audiencias/api/room/?page=

Para realizar a captura se faz necessário verificar qual a última página da pesquisa, hoje é a de 25

In [None]:
paginas = [*range(1,25)]

In [None]:
df2 = pd.DataFrame()
for pag in tqdm(paginas):
    response = urlopen(f"https://edemocracia.camara.leg.br/audiencias/api/room/?page={pag}")
    json_data = response.read().decode('utf-8', 'replace')
    d = json.loads(json_data)
    room = pd.DataFrame(d['results'])
    df2 = pd.concat([df2,room], ignore_index=True)

100%|██████████| 24/24 [01:54<00:00,  4.78s/it]


In [None]:
from pathlib import Path  
filepath = Path('DadosEdemocracia/audiencias.csv')  
filepath.parent.mkdir(parents=True, exist_ok=True)  
df2.to_csv(filepath) 

### Captura de usuarios do e-democracia
Hoje o link de captura dos dados em api pública é o https://edemocracia.camara.leg.br/audiencias/api/user/?page=

Para realizar a captura se faz necessário verificar qual a última página da pesquisa, hoje é a de 937

In [None]:
paginas = [*range(1,938)]

In [None]:
df = pd.DataFrame()
for pag in tqdm(paginas):
    response = urlopen(f"https://edemocracia.camara.leg.br/audiencias/api/user/?page={pag}")
    json_data = response.read().decode('utf-8', 'replace')
    d = json.loads(json_data)
    usuarios = pd.DataFrame(d['results'])
    df = pd.concat([df,usuarios], ignore_index=True)

100%|██████████| 937/937 [26:46<00:00,  1.71s/it]


In [None]:
from pathlib import Path  
filepath = Path('DadosEdemocracia/usuarios.csv')  
filepath.parent.mkdir(parents=True, exist_ok=True)  
df.to_csv(filepath) 