# Análise dos dados da API de deputados

Análise dos dados obtidos por meio da API da Câmara com dados de deputados



In [None]:
# Importando as bibliotecas
import pandas as pd
import requests

# URL de acesso aos dados via api
url = 'https://dadosabertos.camara.leg.br/api/v2/deputados?itens=100'

# Pandas consegue ler JSON diretamente
# df = pd.read_json(url)
# ISSO NUNCA FUNCIONA
# Vamos ter que requisitar o arquivo, transformar em lista, pegar apenas o elemento desejado e transformar em DF

# Obtendo os dados
resposta = requests.get(url)

# Criando o DataFrame
df = pd.DataFrame(resposta.json()['dados'])

df.head()

In [None]:
df.count()

Por padrão, a API retorna apenas 100 deputados por vez.

Então precisamos fazer novas requisições para obter os demais deputados

In [None]:
# Como obter os links para as próximas páginas
resposta.json()['links'][1]['href']

In [None]:
# Separar os links da resposta
for item in resposta.json()['links']:    
    if item['rel'] == 'self':
        atual = item['href']
    elif item['rel'] == 'last':
        ultimo = item['href']
    elif item['rel'] == 'next':
        proximo = item['href']

# Enquanto a pagina atual for diferente da ultima pagina
while atual != ultimo:
    # Requisita os dados
    resposta = requests.get(proximo)
    # Adiciona no df
    df = df.append(pd.DataFrame(resposta.json()['dados']))
    
    # Separar os links da resposta
    for item in resposta.json()['links']:
        if item['rel'] == 'self':
            atual = item['href']
        elif item['rel'] == 'last':
            ultimo = item['href']
        elif item['rel'] == 'next':
            proximo = item['href']
        
df.count()

In [None]:
df.head()

In [None]:
# Quantos partidos?
df.groupby('siglaUf').siglaPartido.value_counts()

In [None]:
# Aprendendo a usar query
# Podemos filtrar o DataFrame de acordo com algum critério
# No caso vamos pegar apenas os deputados do DEM e contar a quantidade por UF
df.query('siglaPartido == "DEM"').siglaUf.value_counts()

In [None]:
# Usando query para restringir a busca no DataFrame
# Agora vamos filtrar os deputados do DEM que são de São Paulo, e vamos mostrar seus nomes
df.query('siglaPartido == "DEM" and siglaUf == "SP"').nome