<a href="https://colab.research.google.com/github/alexlana0/ibge-indicators/blob/main/ex01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# API Pública: IBGE

## Documentação:

https://servicodados.ibge.gov.br/api/docs/paises#api-acervo

Endpoint base:

https://servicodados.ibge.gov.br/api/v1/paises/{paises}/indicadores/{indicadores}

## Objetivo

Para esse exercício eu decidi usar a API Pública do IBGE para buscar informações sobre as mulheres de 15 anos ou mais economicamente ativas no Brasil

## Configuração do ambiente

Criarei um diretório para cada exercício. Em cada diretório, configuro um ambiente virtual e gero o arquivo requirements.txt.

### Criando o ambiente

In [None]:
python3 -m venv venv

### Instalando dependências

In [None]:
pip install requests

### Ativando o ambiente

In [None]:
source venv/bin/activate

### Conferindo se o ambiente está ativo

In [None]:
which python

### Gerando arquivo requirements.txt

In [None]:
pip freeze > requirements.txt

- Esse comando gera um arquivo de texto com uma lista de todos os pacotes instalados nesse ambiente virtual, e suas versões exatas;
- Esse arquivo pode ser usado para instalar exatamente os mesmos pacotes em outro ambiente virtual, evitando qualquer tipo de conflito (caso houvesse versionamento do projeto, por exemplo);
- Para instalar os pacotes listados em outro venv, basta:

In [None]:
pip install -r requirements.txt

### Desativando o ambiente

In [None]:
deactivate

## Criando ***.gitignore***

In [None]:
touch .gitignore

Conteúdo do .gitignore, nesse caso:

In [None]:
.venv/ #ignora o ambiente virtual
__pycache__/ #ignora pasta de cachê que o python cria
*.pyc #ignora qualquer arquivo do tipo .pyc (bytecode) gerado pela máquina ao rodar o codigo

## Prática

### 1. Primeira requisição de teste usando python

In [1]:
import requests

identifier = 'BR'
indicator = '77822'
url = f'https://servicodados.ibge.gov.br/api/v1/paises/{identifier}/indicadores/{indicator}'

response = requests.get(url)
if response.status_code == 200:
  print('success!')
else:
  print('faillure')

success!


### 2. Acessando os dados do JSON



In [2]:
response = requests.get(url)
response.encoding = 'utf-8'
print(response.text)

[{"id":77822,"indicador":"Economia - Mulheres de 15 anos ou mais de idade economicamente ativas","unidade":{"id":"%","classe":"N","multiplicador":1},"series":[{"pais":{"id":"BR","nome":"Brasil"},"serie":[{"-":null},{"1990":"44.95"},{"1990-1995":null},{"1995":"50.24"},{"1995-2000":null},{"1999-2001":null},{"2000":null},{"2000-2002":null},{"2000-2005":null},{"2001":"54.39"},{"2001-2003":null},{"2002":"55.91"},{"2002-2004":null},{"2003":"56.02"},{"2003-2005":null},{"2004":"56.95"},{"2004-2006":null},{"2005":"58.11"},{"2005-2007":null},{"2005-2010":null},{"2006":"57.83"},{"2006-2008":null},{"2007":"57.58"},{"2007-2009":null},{"2008":"57.21"},{"2008-2010":null},{"2009":"57.71"},{"2009-2011":null},{"2010":null},{"2010-2012":null},{"2010-2015":null},{"2011":"54.69"},{"2011-2013":null},{"2012":"52.47"},{"2012-2014":null},{"2013":"52.45"},{"2013-2015":null},{"2014":"52.38"},{"2014-2016":null},{"2015":"53.03"},{"2015-2017":null},{"2015-2020":null},{"2016":"53.28"},{"2016-2018":null},{"2017":"54.

### 3. Transformando a resposta uma estrutura

In [3]:
response = requests.get(url)
data = response.json()
print(type(data))
print(len(data))
print(type(data[0]))
print(data[0].keys())

<class 'list'>
1
<class 'dict'>
dict_keys(['id', 'indicador', 'unidade', 'series'])


### 4. Acessando chaves de interesse

In [4]:
print(data[0]['indicador'])

Economia - Mulheres de 15 anos ou mais de idade economicamente ativas


### 5. Entendendo os tipos da estrutura

- **list** = estrutura ordenada, acessada por *indice numérico* (como um array)
  - pode ter valores repetidos
  - "lista": [ ]
- **dict** = tipo de dado que armazena informações em pares de chave-valor
  - acessada pela **chave**
  - cada chave é única
  - "dicionario": { }

In [5]:
print(type(data)) #lista de dicionarios com apenas 1 dicionario
print(type(data[0])) #o primeiro dicionario da lista
print(type(data[0]['unidade'])) #um dicionário com 3 chaves
print(type(data[0]['series']))  #uma lista com 1 dicionario
print(type(data[0]['series'][0])) #um dicionario com 1 lista e 1 dicionario
print(type(data[0]['series'][0]['pais'])) #um dicionario com 2 chaves
print(type(data[0]['series'][0]['serie'])) #uma lista com 57 dicionarios
print(len(data[0]['series'][0]['serie']))
print(type(data[0]['series'][0]['pais']['nome'])) #o tipo da chave 'nome'
print(data[0]['series'][0]['pais']['nome']) #o conteudo da chave 'nome'

<class 'list'>
<class 'dict'>
<class 'dict'>
<class 'list'>
<class 'dict'>
<class 'dict'>
<class 'list'>
57
<class 'str'>
Brasil


### 6. Manipulando string

In [6]:
print(data[0]["indicador"])
indicator_list = data[0]["indicador"].split("-")
print(indicator_list[0])
print(indicator_list[1])

Economia - Mulheres de 15 anos ou mais de idade economicamente ativas
Economia 
 Mulheres de 15 anos ou mais de idade economicamente ativas


### 7. Percorrendo uma lista

In [7]:
serie = data[0]["series"][0]["pais"]
for item in serie:
  print(item)

id
nome


### 8. Manipulando elementos da lista/dicionário

In [8]:
serie = data[0]["series"][0]["serie"]
for item in serie: #percorre a lista de dicionarios
  for chave in item: #percorre cada dicionário, acessando suas chaves
    ano = chave #declara a variável ano e dá a ela o valor da chave
    print(ano)

-
1990
1990-1995
1995
1995-2000
1999-2001
2000
2000-2002
2000-2005
2001
2001-2003
2002
2002-2004
2003
2003-2005
2004
2004-2006
2005
2005-2007
2005-2010
2006
2006-2008
2007
2007-2009
2008
2008-2010
2009
2009-2011
2010
2010-2012
2010-2015
2011
2011-2013
2012
2012-2014
2013
2013-2015
2014
2014-2016
2015
2015-2017
2015-2020
2016
2016-2018
2017
2017-2019
2018
2018-2020
2019
2019-2021
2020
2020-2022
2021
2021-2023
2022
2022-2024
2023


In [9]:
serie = data[0]["series"][0]["serie"]
for item in serie:
  for chave in item: #item é o dicionario atual
    ano = chave #ano é a chave atual desse dicionario
    valor = item[ano] #acessando o valor correspondente a essa chave
    print(valor)

None
44.95
None
50.24
None
None
None
None
None
54.39
None
55.91
None
56.02
None
56.95
None
58.11
None
None
57.83
None
57.58
None
57.21
None
57.71
None
None
None
None
54.69
None
52.47
None
52.45
None
52.38
None
53.03
None
None
53.28
None
54.15
None
54.43
None
55.20
None
50.25
None
52.37
None
53.75
None
53.10


### 9. Filtrando dados

In [10]:
for item in serie:
  for chave in item: #item é o dicionario atual
    ano = chave #ano é a chave atual desse dicionario
    valor = item[ano] #acessando o valor correspondente a essa chave
    if valor is None:
      continue
    else:
      print(valor)

44.95
50.24
54.39
55.91
56.02
56.95
58.11
57.83
57.58
57.21
57.71
54.69
52.47
52.45
52.38
53.03
53.28
54.15
54.43
55.20
50.25
52.37
53.75
53.10


# Conceitos aprendidos



* Como criar um ambiente virtual (venv) na raiz do meu projeto;
* Diferença de listas e dicionários e como manipulá-los
* Fitragem básica de dados
* Métodos e funções da biblioteca `requests`


