![alt text](../../figs/logoLEFT.png "CLDF") | CÂMARA LEGISLATIVA DO DISTRITO FEDERAL | ![alt text](../../figs/logoRIGHT.png "CLDF")
--- | :---: | ---
| **COORDENADORIA DE MODERNIZAÇÃO E INFORMÁTICA - CMI** | 
| **OFICINA ASI/LABHINOVA** | 
| **ANÁLISE EXPLORATÓRIA DE DADOS ABERTOS USANDO PYTHON** | 

# Acessando Dados Abertos por meio de uma API

## Exemplo de fonte de dados abertos por meio de uma API:

Por exemplo, o Portal da Transparência do Governo Federal fornece dados abertos através de uma API que pode ser acessada no site: 

http://www.transparencia.gov.br/swagger-ui.html

O exemplo de dados em formato JSON foi obtido dessa API em:

http://www.transparencia.gov.br/swagger-ui.html#!/Bolsa32Fam237lia/bolsaFamiliaPorMunicipioUsingGET    

Nesse momento, o instrutor deve mostrar alguns exemplos de requisições feitas à API direto no browser como por exemplo a requisição abaixo que foi usada nos slides para apresentar o formato de dados JSON: 

http://www.transparencia.gov.br/api-de-dados/bolsa-familia-por-municipio?mesAno=202001&codigoIbge=5300108&pagina=1

## Importante entender algumas coisas:

#### 1 - De onde descobrirmos o código para o Distrito Federal? 
Isso é fornecido pelo próprio site do IBGE em: https://www.ibge.gov.br/explica/codigos-dos-municipios.php#DF

#### 2 - Importante salientar que a API pede a data no formato YYYYMM 
Então pedimos a data 202001 que significa que queremos os dados relativo ao mês de janeiro de 2020.
O instrutor pode mostrar outras requisições JSON em tempo real mudando as datas ou mesmo pedindo dados de outros municípios.

Por exemplo, alguns códigos de municípios:
    - Pirenópolis - 5217302 
    - Cocalzinho de Goiás - 5205513
    - Caldas Novas - 5204508

E alguns exemplos de requisições para esses municípios:

http://www.transparencia.gov.br/api-de-dados/bolsa-familia-por-municipio?mesAno=202001&codigoIbge=5217302&pagina=1

http://www.transparencia.gov.br/api-de-dados/bolsa-familia-por-municipio?mesAno=202001&codigoIbge=5205513&pagina=1

http://www.transparencia.gov.br/api-de-dados/bolsa-familia-por-municipio?mesAno=202001&codigoIbge=5204508&pagina=1

# Ok, mas e agora como faço isso por meio de código python?

#### Primeiro vamos precisar importar algumas bilbiotecas que farão o trabalho duro pra gente:

In [1]:
from urllib.request import Request, urlopen
import json
print('Bibliotecas importadas!')

Bibliotecas importadas!


#### Se você não executou o código da célula acima, execute! Do contrário, os códigos abaixo não vão funcionar! Clique na célula acima e clique no comando "Run" ou pressione "SHIFT + ENTER" no teclado.

#### Em seguida, vamos programar um pouquinho. 
O código abaixo define uma função que poderemos usar em seguida.
O que ela faz é criar uma função que faz a requisição JSON e devolve o objeto JSON para você.
Você passa como os parâmetros strMesAno e strCodIBGE e ela devolve o objeto JSON.

In [2]:
siteApi = 'http://www.transparencia.gov.br/api-de-dados'

def getJsonData(strMesAno,strCodIBGE):
    method='bolsa-familia-por-municipio?mesAno={0}&codigoIbge={1}&pagina={2}'.format(strMesAno,strCodIBGE,1)
    req = Request(siteApi + '/' + method, headers={'User-Agent': 'Mozilla/5.0'})
    JSON = urlopen(req).read()
    return json.loads(JSON)

print('Função criada!')

Função criada!


#### Agora vamos usar a função! 

Por exemplo, vamos pegar os dados de Pirenopolis de Dezembro de 2018. 
Que tal? 

In [3]:
dadosBolsaFamiliaPiri = getJsonData(201812,5217302)

#### Agora vamos dar uma olhada no conteúdo da variável dadosBolsaFamiliaPiri:

In [4]:
dadosBolsaFamiliaPiri

[{'id': 66610001,
  'dataReferencia': '01/12/2018',
  'municipio': {'codigoIBGE': '5217302',
   'nomeIBGE': 'PIRENÓPOLIS',
   'nomeIBGEsemAcento': 'PIRENOPOLIS',
   'pais': 'BRASIL',
   'uf': {'sigla': 'GO', 'nome': 'GOIÁS'}},
  'tipo': {'id': 1,
   'descricao': 'Bolsa Família',
   'descricaoDetalhada': 'Bolsa Família'},
  'valor': 161577.0,
  'quantidadeBeneficiados': 1240}]

#### De exercício, quero que pegue os dados de Cocalzinho de Goiás de janeiro de 2020. 

Consegue fazer isso sozinho?
Use a célula a seguir para fazer isso. Vou deixar parte do comando pronto para você:

In [5]:
dadosBolsaFamiliaCocalzinho = getJsonData(?,?)
dadosBolsaFamiliaCocalzinho

SyntaxError: invalid syntax (<ipython-input-5-869648d8cdb6>, line 1)

#### Nesse momento o instrutor deveria ensinar como acessar uma determinada informação do objeto JSON fornecido.

Por exemplo: O campo "valor":

In [6]:
print(dadosBolsaFamiliaPiri[0]['valor'])

161577.0


Outro exemplo: O campo "município":

In [7]:
print(dadosBolsaFamiliaPiri[0]['municipio'])

{'codigoIBGE': '5217302', 'nomeIBGE': 'PIRENÓPOLIS', 'nomeIBGEsemAcento': 'PIRENOPOLIS', 'pais': 'BRASIL', 'uf': {'sigla': 'GO', 'nome': 'GOIÁS'}}


E dentro do municipio, o campo "nomeIBGE":

In [8]:
print(dadosBolsaFamiliaPiri[0]['municipio']['nomeIBGE'])

PIRENÓPOLIS


# Legal, mas e se eu quiser obter vários dados? 

## Aí temos que programar! 

#### Mas para facilitar o andamento da oficina, nós já criamos o programa que faz uma requisição para cada mês de cada ano desde 2013 até 2020 para Brasília e gerou um arquivo CSV com esses dados! 

#### Dessa forma, na próxima etapa da oficina, vamos aprender a ler esse arquivo CSV (processo idêntico para se ler qualquer arquivo desse tipo) e, em seguida, poderemos fazer algumas análises nesses dados.

# Quando o instrutor autorizar, você vai seguir esse link aqui:

## [Explorando dados de um arquivo csv](../csv/csv.ipynb)