# Obtaining data from IBGE

In [3]:
from pysus.demography import stats
import pandas as pd
%pylab inline

Populating the interactive namespace from numpy and matplotlib


## Listing Subject Areas
IBGE makes available data from a number of surveys on different subjects. We can find out what is available, before downloading data.

In [4]:
ag = stats.list_agregados()
ag

Unnamed: 0,id,nome,agregados
0,CL,Cadastro Central de Empresas,"[{'id': '1732', 'nome': 'Dados gerais das empr..."
1,CA,Censo Agropecuário,"[{'id': '1278', 'nome': 'Agroindústria rural n..."
2,ME,"Censo Comum do Mercosul, Bolívia e Chile","[{'id': '2059', 'nome': 'Domicílios e Populaçã..."
3,CD,Censo Demográfico,"[{'id': '1301', 'nome': 'Área e Densidade demo..."
4,CM,Contagem da População,"[{'id': '479', 'nome': 'Chefes de domicílios p..."
...,...,...,...
57,VS,Produção da Extração Vegetal e da Silvicultura,"[{'id': '5930', 'nome': 'Área total existente ..."
58,PO,Produção de Ovos de Galinha,"[{'id': '915', 'nome': 'Número de informantes,..."
59,IO,Produto Interno Bruto dos Municípios,"[{'id': '599', 'nome': 'Índice de Gini do prod..."
60,XE,Projeção da População,"[{'id': '7362', 'nome': 'Esperança de vida ao ..."


Let's look at the datasets (called "agregados") available within the category of "Censo Demografico".

In [5]:
pd.DataFrame(ag[ag.id=='CD'].agregados.iloc[0])

Unnamed: 0,id,nome
0,1301,Área e Densidade demográfica da unidade territ...
1,617,Brasileiros natos por unidade da federação de ...
2,2149,Brasileiros natos por unidade da federação de ...
3,164,Chefes de domicílios particulares permanentes ...
4,171,Chefes de domicílios particulares permanentes ...
...,...,...
911,241,Valor do rendimento nominal médio mensal dos d...
912,3283,Valor do rendimento nominal médio mensal e Val...
913,3282,Valor do rendimento nominal médio mensal e Val...
914,3527,Valor do rendimento nominal médio mensal e Val...


Again for population projections

In [6]:
pd.DataFrame(ag[ag.id=='XE'].agregados.iloc[0])

Unnamed: 0,id,nome
0,7362,Esperança de vida ao nascer e Taxa de mortalid...
1,7360,Indicadores implícitos na projeção da população
2,7358,"População, por sexo e idade"
3,7365,"Proporção de pessoas, por grupo de idade"
4,7363,"Taxa específica de fecundidade, por grupo de i..."


### Downloading data
Before downloading the data, it may be useful to look at the metadata of the dataset we are interested in.

In [7]:
stats.metadados(7358)

{'id': 7358,
 'nome': 'População, por sexo e idade',
 'URL': 'http://sidra.ibge.gov.br/tabela/7358',
 'pesquisa': 'Projeção da População',
 'assunto': 'Geral',
 'periodicidade': {'frequencia': 'anual', 'inicio': 2018, 'fim': 2018},
 'nivelTerritorial': {'Administrativo': ['N1', 'N2', 'N3'],
  'Especial': [],
  'IBGE': []},
 'variaveis': [{'id': 606,
   'nome': 'População',
   'unidade': 'Pessoas',
   'sumarizacao': []}],
 'classificacoes': [{'id': 2,
   'nome': 'Sexo',
   'sumarizacao': {'status': True, 'excecao': []},
   'categorias': [{'id': 6794, 'nome': 'Total', 'unidade': None, 'nivel': 0},
    {'id': 4, 'nome': 'Homens', 'unidade': None, 'nivel': 1},
    {'id': 5, 'nome': 'Mulheres', 'unidade': None, 'nivel': 1}]},
  {'id': 287,
   'nome': 'Idade',
   'sumarizacao': {'status': True, 'excecao': []},
   'categorias': [{'id': 100362, 'nome': 'Total', 'unidade': None, 'nivel': 0},
    {'id': 93070, 'nome': '0 a 4 anos', 'unidade': None, 'nivel': 1},
    {'id': 49111, 'nome': '0 ano',

In [8]:
stats.lista_periodos(7358)

Unnamed: 0,id,literals
0,2018,[2018]


In [14]:
stats.localidades_por_agregado(7358, nivel='N3')

Unnamed: 0,id,nome,nivel
0,11,Rondônia,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
1,12,Acre,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
2,13,Amazonas,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
3,14,Roraima,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
4,15,Pará,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
5,16,Amapá,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
6,17,Tocantins,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
7,21,Maranhão,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
8,22,Piauí,"{'id': 'N3', 'nome': 'Unidade da Federação'}"
9,23,Ceará,"{'id': 'N3', 'nome': 'Unidade da Federação'}"


In [30]:
df = stats.variaveis_agregado(7358,periodos=2018,variavel=606,localidades='N3[all]', 
                              classificacao='2[4,5]|287[93070,93084,93085,93086,93087,93088,93089]', view='flat')
df

Unnamed: 0,NC,NN,D1C,D1N,D2C,D2N,D3C,D3N,D4C,D4N,D5C,D5N,D6C,D6N,MC,MN,V
0,Nível Territorial (Código),Nível Territorial,Unidade da Federação (Código),Unidade da Federação,Ano (Código),Ano,Variável (Código),Variável,Sexo (Código),Sexo,Idade (Código),Idade,Ano (Código),Ano,Unidade de Medida (Código),Unidade de Medida,Valor
1,3,Unidade da Federação,11,Rondônia,2018,2018,606,População,4,Homens,93070,0 a 4 anos,0,,45,Pessoas,..
2,3,Unidade da Federação,11,Rondônia,2018,2018,606,População,4,Homens,93084,5 a 9 anos,0,,45,Pessoas,..
3,3,Unidade da Federação,11,Rondônia,2018,2018,606,População,4,Homens,93085,10 a 14 anos,0,,45,Pessoas,..
4,3,Unidade da Federação,11,Rondônia,2018,2018,606,População,4,Homens,93086,15 a 19 anos,0,,45,Pessoas,..
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
374,3,Unidade da Federação,53,Distrito Federal,2018,2018,606,População,5,Mulheres,93085,10 a 14 anos,0,,45,Pessoas,..
375,3,Unidade da Federação,53,Distrito Federal,2018,2018,606,População,5,Mulheres,93086,15 a 19 anos,0,,45,Pessoas,..
376,3,Unidade da Federação,53,Distrito Federal,2018,2018,606,População,5,Mulheres,93087,20 a 24 anos,0,,45,Pessoas,..
377,3,Unidade da Federação,53,Distrito Federal,2018,2018,606,População,5,Mulheres,93088,25 a 29 anos,0,,45,Pessoas,..
