**Usando a nova API da Câmara dos Deputados**
---------------------------

Toda a documentação se encontra em [https://dadosabertos.camara.leg.br/swagger/api.html

Vamos inicialmente mostrar o nome e identificador de cada deputado

In [4]:
import requests
url = 'https://dadosabertos.camara.leg.br/api/v2/deputados'
resp = requests.get(url).json()
for d in resp['dados']:
    if d['siglaUf'] == 'RJ':
      print (d['nome'], d['id'], 
         d['siglaUf'], d['siglaPartido'])

Alessandro Molon 160511 RJ PSB
Alexandre Serfiotis 178833 RJ PSD
Altineu Côrtes 178937 RJ PL
Aureo Ribeiro 160512 RJ SOLIDARIEDADE
Benedita da Silva 73701 RJ PT
Carlos Jordy 204460 RJ PSL
Chico D'Angelo 141439 RJ PDT
Chiquinho Brazão 204476 RJ AVANTE
Chris Tonietto 204462 RJ PSL
Christino Aureo 204440 RJ PP
Clarissa Garotinho 178939 RJ PROS
Daniel Silveira 204454 RJ PSL
Daniela do Waguinho 204459 RJ MDB
David Miranda 205548 RJ PSOL
Delegado Antônio Furtado 204451 RJ PSL
Dr. Luiz Antonio Teixeira Jr. 204450 RJ PP
Felício Laterça 204477 RJ PSL
Flordelis 204447 RJ PSD
Gelson Azevedo 115746 RJ PL
Glauber Braga 152605 RJ PSOL
Gurgel 204442 RJ PSL
Gutemberg Reis 204456 RJ MDB
Helio Lopes 204444 RJ PSL
Hugo Leal 141450 RJ PSD
Jandira Feghali 74848 RJ PCdoB
Jorge Braz 205550 RJ REPUBLICANOS
Juninho do Pneu 204457 RJ DEM
Lourival Gomes 196358 RJ PSL
Luiz Antônio Corrêa 204448 RJ PL
Luiz Lima 204455 RJ PSL
Major Fabiana 204458 RJ PSL
Marcelo Calero 204433 RJ CIDADANIA
Marcelo Freixo 76874 RJ PSO

**Exercício**

Além do nome e identificador, mostre também o partido e UF de cada Deputado

In [None]:
import requests
url = 'https://dadosabertos.camara.leg.br/api/v2/deputados'
resp = requests.get(url).json()
for d in resp['dados']:
  print (d['email'])

Na url da Câmara, no bloco dos Deputados, coloque **aplication/json** no Response Content Type. Você irá notar que existem mais informações que as descritas inicialmente. Por exemplo, vamos baixar todas as fotos, no diretório onde você iniciou o jupyter notebook, dos deputados de São Paulo. Aqui começamos a usar uma condição **if** sendo que o bloco de instruções será executado apenas quando aquela condição resultar True

In [3]:
import requests
url = 'https://dadosabertos.camara.leg.br/api/v2/deputados'
resp = requests.get(url).json()
for d in resp['dados']:
  if d['siglaPartido'] == 'PT':
    nome = d['nome'].lower()
    print (f'Gravando: {nome}')
    f = open(nome + '.jpg', 'wb')
    foto = requests.get(d['urlFoto']).content
    f.write(foto)
    f.close()

Gravando: afonso florence
Gravando: airton faleiro
Gravando: alencar santana braga
Gravando: alexandre padilha
Gravando: arlindo chinaglia
Gravando: benedita da silva
Gravando: beto faro
Gravando: bohn gass
Gravando: carlos veras
Gravando: carlos zarattini
Gravando: célio moura
Gravando: enio verri
Gravando: erika kokay
Gravando: frei anastacio ribeiro
Gravando: gleisi hoffmann
Gravando: helder salomão
Gravando: henrique fontana
Gravando: joão daniel
Gravando: jorge solla
Gravando: josé airton félix cirilo
Gravando: josé guimarães
Gravando: josé ricardo
Gravando: joseildo ramos
Gravando: leo de brito
Gravando: leonardo monteiro
Gravando: luizianne lins
Gravando: marcon
Gravando: margarida salomão
Gravando: maria do rosário
Gravando: marília arraes
Gravando: merlong solano
Gravando: natália bonavides
Gravando: nilto tatto
Gravando: odair cunha
Gravando: padre joão
Gravando: patrus ananias
Gravando: paulão
Gravando: paulo guedes
Gravando: paulo pimenta
Gravando: paulo teixeira
Gravando: 

Note que o print tem uma string que começa com f. Quando fazemos isso, dentro da string, tudo o que aparece em chaves, é substituído pelo valor calculado

Vamos acessar o valor total gasto por um Deputado Federal, com sua quota parlamentar, registrado na API da Câmara. A Deputada Tábata Amaral tem identificador 204534. Usando o link de descrição da API verificamos que podemos fornecer mais de um ano. Fazendo testes, verificamos que o número máximo de itens é 100. Estas páginas irão aumentar ao longo do tempo. Verificamos novamente que, caso solicitada uma página maior, o item 'dado' volta vazio. Cada página tem uma URL de acesso, para seus itens. Existe um operador em Python, chamado range, que vai de um número até uma unidade a menos do segundo. Desta forma range(1, 100) nos gera o intervado de 1 até 99. No campo valorLiquido temos o gasto efetuado. Observe que a API nos retorna uma string, para poder somar, devemos converter o valor para float, antes de somar a uma variável total. Para imprimir com somente duas casas decimais, irei usar .2f 
Uma forma mais completa seria consultar o rótulo links, num primeiro acesso, e verificar a última página atual. Para simplificar este curso, para iniciantes, iremos fazer acessos desnecessários.

In [5]:
import requests
total = 0
for pag in range(1, 100):
  u = f'https://dadosabertos.camara.leg.br/api/v2/deputados/178939/despesas?ano=2019&ano=2020&ordem=ASC&ordenarPor=ano&pagina={pag}&itens=100'
  r = requests.get(u).json()
  for gasto in r['dados']:
    total = total + float(gasto['valorLiquido'])

print (f'Gasto em 2019 e 2020: R$ {total:.2f}')

Gasto em 2019 e 2020: R$ 355826.56


**Exercício**

Calcule o valor gasto por outros Deputados Federais, substituindo o identificador


Outra análise interessante é saber quem são os fornecedores que mais receberam desta quota. Usamos um dicionário para guardar estes dados, se o fornecedor não está ainda na base, crio e inicializo com aquele valor, caso já exista somo com o total acumulado. Cada item de um dicionário é um par, quero colocar em ordem do segundo elemento, que referencio por um entre colchetes, lembre que o primeiro é zero. Abaixo os fornecedores da deputada Tábata Amaral em ordem descrescente de valor recebido acumulado, até o momento.

In [6]:
import requests
total = 0
fornecedores = {}
cnpjCpfFornecedores = {}
for pag in range(1, 100):
  u = f'https://dadosabertos.camara.leg.br/api/v2/deputados/178939/despesas?ano=2019&ano=2020&ordem=ASC&ordenarPor=ano&pagina={pag}&itens=100'
  r = requests.get(u).json()
  for gasto in r['dados']:
    valor = float(gasto['valorLiquido'])
    total = total + valor
    nome = gasto['nomeFornecedor']
    cnpjCpf = gasto['cnpjCpfFornecedor']
    if cnpjCpf not in cnpjCpfFornecedores:
      cnpjCpfFornecedores[cnpjCpf] = valor
      fornecedores[cnpjCpf] = nome
    else:
      cnpjCpfFornecedores[cnpjCpf] = cnpjCpfFornecedores[cnpjCpf] + valor

print (f'Total retornado API Câmara: R$ {total:.2f}')
def chave(f): return f[1]
maiores = sorted(cnpjCpfFornecedores.items(), key=chave, reverse=True)
for cnpjcpf, valor in maiores[:50]:
    print (cnpjcpf, fornecedores[cnpjcpf], f'R$ {valor:.2f}')


Total retornado API Câmara: R$ 355826.56
02012862000160 Cia Aérea - TAM R$ 203006.11
06928794000134 LGA Comunicação R$ 70000.00
12842700000102 OMEGA LOCADORA DE VEÍCULOS LTDA ME R$ 36000.00
05931710000159 Grupo Brasil DPE Design Producoes e Eventos LTDA R$ 10000.00
01079210004509 UNIDAS LOCADORA DE VEÍCULOS R$ 7943.44
27510280000134 LGA Analise e Conteudo LTDA R$ 7000.00
07575651000159 Cia Aérea - GOL R$ 3666.16
00000000000001 CELULAR FUNCIONAL R$ 3533.25
07319323000191 PANTANAL VEÍCULOS LTDA R$ 3200.00
02558157000162 Telefônia Brasil S/A - VIVO R$ 1518.15
01815580000138 TECNODIGITAL COMUNICACAO VISUAL LTDA R$ 978.00
08202116000115 AUTO POSTO AEROPORTO LTDA R$ 800.00
12132854000100 WMS COMERCIO DE ARTIGOS DE PAPELARIA LTDA-ME R$ 693.60
00306597003112 CASCOL COMBUSTIVEIS PARA VEICULOS LTDA R$ 508.00
19156367000127 Gnz Comercio De Alimentos Eireli - Epp R$ 482.00
33469172001644 SERVICO NACIONAL DE APRENDIZAGEM COMERCIAL SENAC R$ 463.15
04208323000126 GUSTAVO GONCALVES DE OLIVEIRA PAIVA R

Observe que para totalizar corretamente temos que agrupar razões sociais. 

**Exercício**

Verifique os maiores fornecedores de outros Deputados Federais

Como podemos descobrir Dados de Deputados nas Legislaturas passadas? Por exemplo, do Deputado Jair Bolsonaro? Encontrando a Biografia do Deputado (https://www.camara.leg.br/deputados/74847/biografia), após pesquisar no Google, obtemos na URL o seu identificador. Como saber as Legislaturas? Pela biografia, sabemos as Datas de Início de sua atividade politica na Câmara, na API da Câmara chegamos que isso engloba as Legislaturas de 49 a 55. Na API podemos colocar os anos de 2016 a 2019. Podemos tentar trazer o máximo de itens por página, porém você irá descobrir, numa tentativa e erro, que o máximo é de 100 itens. No final do JSON de retorno, outra informação importante é de que temos páginas de 1 até 16, o que implica usar range(1, 17), pois range termina no número anterior ao segundo parâmetro fornecido. Pelo final do JSON retornado, você sabe como construir a requisição de cada página.

In [None]:
import requests
sair = 'o a à e os às as de da do ao na no nos nas não são nº em que com aos dos das pelo sobre por para pela entre contra'.split()
keywords = []
sumarios = []
for pag in range (1,17):
  url = f'https://dadosabertos.camara.leg.br/api/v2/deputados/74847/discursos?idLegislatura=49&idLegislatura=50&idLegislatura=51&idLegislatura=52&idLegislatura=53&idLegislatura=54&idLegislatura=55&dataInicio=1990-01-01&dataFim=2019-12-31&ordenarPor=dataHoraInicio&ordem=ASC&pagina={pag}&itens=100'
  resp = requests.get(url).json()
  for d in resp['dados']:
    s = d['sumario'].lower()
    s = ''.join(e for e in s if e not in ".,'()-")
    s = s.split()
    s = [w for w in s if w not in sair]
    sumarios.extend(s)
    if not d['keywords']: continue
    s = d['keywords'].lower()
    s = ''.join(e for e in s if e not in ".,'()-")
    s = s.split()
    s = [w for w in s if w not in sair]
    keywords.extend(s)

from collections import Counter
keywords = Counter(keywords)
sumarios = Counter(sumarios)
print (keywords.most_common(100))
print (sumarios.most_common(100))

Explicações: estamos removendo sinais especiais, split() quebra a string pelo espaço ou sinal de pular linha, split(',') separa por vírgula, a função extend faz algo parecido com append, enquanto append inclui um único elemento no final da lista, extend inclui vários. A função Counter vai contabilizar o número de vezes em que aparece um elemento na lista, criando um dicionário. No final vamos mostrar os 100 termos que mais aparecem nas Keywords do nosso presidente e também nos sumários. 

In [None]:
texto = 'batatinha, quando, nasce, esparrama, pelo, chão'
texto = texto.split(',')
texto

In [None]:
texto = [x.strip() for x in texto]
texto

Expressões entre colchetes criam novas listas segundo o critério que está dentro, no caso acima, vamos fazer x.strip() para todo x dentro da lista texto

**Exercício**

Repita o processo acima para outro Deputado Federal

Existem inúmeras APIs, podemos ver o que o Google completaria, dada uma expressão inicial

In [None]:
from requests import get
url = "http://suggestqueries.google.com/complete/search?client=firefox&q=Jair Bolsonaro é"
resp = get(url).json()
resp

**Exercício**

Coloque outras frases a serem completadas para testar