# Obtaining data from IBGE

In [7]:
import pandas as pd
from pysus.online_data import IBGE

import ipywidgets as widgets
%matplotlib inline

ModuleNotFoundError: No module named '_readdbc'

## Listing Subject Areas
IBGE makes available data from a number of surveys on different subjects. We can find out what is available, before downloading data.

In [8]:
pd.read_json("https://servicodados.ibge.gov.br/api/v3/agregados?")

URLError: <urlopen error [SSL: UNSAFE_LEGACY_RENEGOTIATION_DISABLED] unsafe legacy renegotiation disabled (_ssl.c:997)>

In [None]:
ag = IBGE.list_agregados()
ag

In [None]:
ag = IBGE.list_agregados()
ag

Let's look at the datasets (called "agregados") available within the category of "Censo Demografico".

In [4]:
pd.DataFrame(ag[ag.id=='CM'].agregados.iloc[0])

AttributeError: 'NoneType' object has no attribute 'id'

Again for population projections

In [4]:
pd.DataFrame(ag[ag.id=='XE'].agregados.iloc[0])

Unnamed: 0,id,nome
0,7362,Esperança de vida ao nascer e Taxa de mortalid...
1,7360,Indicadores implícitos na projeção da população
2,7358,"População, por sexo e idade"
3,7365,"Proporção de pessoas, por grupo de idade"
4,7363,"Taxa específica de fecundidade, por grupo de i..."


### Downloading data
Before downloading the data, it may be useful to look at the metadata of the dataset we are interested in.

In [6]:
opts= [(r.nome, int(r.id)) for r in pd.DataFrame(ag[ag.id=='CM'].agregados.iloc[0]).itertuples()]
ds = widgets.Dropdown(
    options=opts,
    value=475,
    description='Number:',
)
display(ds)
IBGE.metadados(ds.value)

Dropdown(description='Number:', index=18, options=(('Chefes de domicílios particulares permanentes por grupos …

{'id': 475,
 'nome': 'População residente por grupos de idade, sexo e situação',
 'URL': 'http://sidra.ibge.gov.br/tabela/475',
 'pesquisa': 'Contagem da População ',
 'assunto': 'Pessoas',
 'periodicidade': {'frequencia': 'anual', 'inicio': 1996, 'fim': 1996},
 'nivelTerritorial': {'Administrativo': ['N102',
   'N1',
   'N10',
   'N2',
   'N8',
   'N9',
   'N6',
   'N3'],
  'Especial': [],
  'IBGE': []},
 'variaveis': [{'id': 93,
   'nome': 'População residente',
   'unidade': 'Pessoas',
   'sumarizacao': []},
  {'id': 1000093,
   'nome': 'População residente - percentual do total geral',
   'unidade': '%',
   'sumarizacao': []}],
 'classificacoes': [{'id': 58,
   'nome': 'Grupo de idade',
   'sumarizacao': {'status': True, 'excecao': []},
   'categorias': [{'id': 0, 'nome': 'Total', 'unidade': None, 'nivel': 0},
    {'id': 1140, 'nome': '0 a 4 anos', 'unidade': None, 'nivel': 1},
    {'id': 1141, 'nome': '5 a 9 anos', 'unidade': None, 'nivel': 1},
    {'id': 1142, 'nome': '10 a 14 an

In [7]:
IBGE.lista_periodos(475)

Unnamed: 0,id,literals
0,1996,[1996]


In [8]:
IBGE.localidades_por_agregado(475, nivel='N3')

Unnamed: 0,id,nome,nivel
0,11,Rondônia,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
1,12,Acre,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
2,13,Amazonas,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
3,14,Roraima,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
4,15,Pará,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
5,16,Amapá,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
6,17,Tocantins,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
7,21,Maranhão,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
8,22,Piauí,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
9,23,Ceará,"{'id': 'N3', 'nome': 'Unidade da Federação'}"


To actually download the data after chosing the dataset, we can use the `FetchData` class, which will fetch the data and make it available both in JSON format and Dataframe as exemplified below.

In [19]:
ds = IBGE.FetchData(475,periodos=1996,variavel=93,localidades='N3[all]',
                              classificacao='58[all]|2[4,5]|1[all]',view='flat')
ds.JSON[0]

Fetching https://servicodados.ibge.gov.br/api/v3/agregados/475/periodos/1996/variaveis/93?localidades=N3[all]&classificacao=58[all]|2[4,5]|1[all]&view=flat


{'NC': 'Nível Territorial (Código)',
 'NN': 'Nível Territorial',
 'D1C': 'Unidade da Federação (Código)',
 'D1N': 'Unidade da Federação',
 'D2C': 'Ano (Código)',
 'D2N': 'Ano',
 'D3C': 'Variável (Código)',
 'D3N': 'Variável',
 'D4C': 'Grupo de idade (Código)',
 'D4N': 'Grupo de idade',
 'D5C': 'Sexo (Código)',
 'D5N': 'Sexo',
 'D6C': 'Situação do domicílio (Código)',
 'D6N': 'Situação do domicílio',
 'MC': 'Unidade de Medida (Código)',
 'MN': 'Unidade de Medida',
 'V': 'Valor'}

In [17]:
ds.to_dataframe()

Unnamed: 0,NC,NN,D1C,D1N,D2C,D2N,D3C,D3N,D4C,D4N,D5C,D5N,D6C,D6N,MC,MN,V
0,Nível Territorial (Código),Nível Territorial,Unidade da Federação (Código),Unidade da Federação,Ano (Código),Ano,Variável (Código),Variável,Grupo de idade (Código),Grupo de idade,Sexo (Código),Sexo,Situação do domicílio (Código),Situação do domicílio,Unidade de Medida (Código),Unidade de Medida,Valor
1,3,Unidade da Federação,11,Rondônia,1996,1996,93,População residente,0,Total,4,Homens,0,Total,45,Pessoas,633594
2,3,Unidade da Federação,11,Rondônia,1996,1996,93,População residente,0,Total,4,Homens,1,Urbana,45,Pessoas,380119
3,3,Unidade da Federação,11,Rondônia,1996,1996,93,População residente,0,Total,4,Homens,2,Rural,45,Pessoas,253475
4,3,Unidade da Federação,11,Rondônia,1996,1996,93,População residente,0,Total,5,Mulheres,0,Total,45,Pessoas,595712
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2750,3,Unidade da Federação,53,Distrito Federal,1996,1996,93,População residente,3245,Idade ignorada,4,Homens,1,Urbana,45,Pessoas,1073
2751,3,Unidade da Federação,53,Distrito Federal,1996,1996,93,População residente,3245,Idade ignorada,4,Homens,2,Rural,45,Pessoas,94
2752,3,Unidade da Federação,53,Distrito Federal,1996,1996,93,População residente,3245,Idade ignorada,5,Mulheres,0,Total,45,Pessoas,1381
2753,3,Unidade da Federação,53,Distrito Federal,1996,1996,93,População residente,3245,Idade ignorada,5,Mulheres,1,Urbana,45,Pessoas,1286


## Using the SIDRA endpoint
IBGE also has a simpler API at https://api.sidra.ibge.gov.br that PySUS also gives access through a simple function. Below we have table 200, which is a sample from the resident population. classification `2` is sex, of which I am fetching all categories: `total`, `Homens`, and `Mulheres`. Terrotorial level 6 is municipality.

In [4]:
df = IBGE.get_sidra_table(200,territorial_level=6,classification=2, categories='all')
df

Requesting data from https://apisidra.ibge.gov.br/values/t/200/n6/all/c2/all


Unnamed: 0,NC,NN,D1C,D1N,D2C,D2N,D3C,D3N,D4C,D4N,D5C,D5N,D6C,D6N,MC,MN,V
0,Nível Territorial (Código),Nível Territorial,Município (Código),Município,Sexo (Código),Sexo,Ano (Código),Ano,Variável (Código),Variável,Situação do domicílio (Código),Situação do domicílio,Grupo de idade (Código),Grupo de idade,Unidade de Medida (Código),Unidade de Medida,Valor
1,6,Município,1100015,Alta Floresta D'Oeste - RO,0,Total,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,24392
2,6,Município,1100015,Alta Floresta D'Oeste - RO,4,Homens,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,12656
3,6,Município,1100015,Alta Floresta D'Oeste - RO,5,Mulheres,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,11736
4,6,Município,1100023,Ariquemes - RO,0,Total,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,90353
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
16691,6,Município,5222302,Vila Propício - GO,4,Homens,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,2689
16692,6,Município,5222302,Vila Propício - GO,5,Mulheres,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,2456
16693,6,Município,5300108,Brasília - DF,0,Total,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,2570160
16694,6,Município,5300108,Brasília - DF,4,Homens,2010,2010,93,População residente,0,Total,0,Total,45,Pessoas,1228880


Suppose we just wanted a single municipality, `Balneário Rincão (SC)`: Unfortunately for this one there is no data available, thus the `...` in the column `Valor`. Try another one.

In [11]:
single = IBGE.get_sidra_table(200,territorial_level=6, geocode=4220000,period='last',classification=2, categories='all')
single

Requesting data from https://apisidra.ibge.gov.br/values/t/200/n6/4220000/p/last/c2/all


Unnamed: 0,NC,NN,D1C,D1N,D2C,D2N,D3C,D3N,D4C,D4N,D5C,D5N,D6C,D6N,MC,MN,V
0,Nível Territorial (Código),Nível Territorial,Município (Código),Município,Ano (Código),Ano,Sexo (Código),Sexo,Variável (Código),Variável,Situação do domicílio (Código),Situação do domicílio,Grupo de idade (Código),Grupo de idade,Unidade de Medida (Código),Unidade de Medida,Valor
1,6,Município,4220000,Balneário Rincão (SC),2010,2010,0,Total,93,População residente,0,Total,0,Total,45,Pessoas,...
2,6,Município,4220000,Balneário Rincão (SC),2010,2010,4,Homens,93,População residente,0,Total,0,Total,45,Pessoas,...
3,6,Município,4220000,Balneário Rincão (SC),2010,2010,5,Mulheres,93,População residente,0,Total,0,Total,45,Pessoas,...
