# Análise da população brasileira
by: Lorena Pereira

### Qual o perfil da população do nosso país? E do nosso estado?

Com dados do censo de 2010, disponível pelo SIDRA [Sistema IBGE de Recuperação Automática](https://sidra.ibge.gov.br/home/pms/brasil)
vamos extrair informações sobre características gerais da população como gênero, cor/raça, situação do domicílio, idade e unidade da federação.

A partir desses dados será que a gente responder as perguntas anteriores?

Fonte dos dados: https://sidra.ibge.gov.br/tabela/3175

In [44]:
%matplotlib inline

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt

### Mas primeiro: Quem é Pandas e o que ele faz?

Pandas é uma biblioteca open source que proporciona alta performace no tratamento e manipulação de estrutura de dados.
Principais conceitos e funções:
- Series
- DataFrame - Conjunto de Series
- Read - pd.read()
- ...

In [123]:
populacao = pd.read_csv('data/populacao/populacao_genero_cor_2010.csv', delimiter=';', header=2)
populacao

Unnamed: 0,Unidade da Federação,Sexo,Idade,Ano,Cor ou raça,Situação do domicílio,Unnamed: 6
0,Rondônia,Homens,0 a 4 anos,2010.0,Branca,Urbana,18720
1,Rondônia,Homens,0 a 4 anos,2010.0,Branca,Rural,6024
2,Rondônia,Homens,0 a 4 anos,2010.0,Preta,Urbana,1755
3,Rondônia,Homens,0 a 4 anos,2010.0,Preta,Rural,580
4,Rondônia,Homens,0 a 4 anos,2010.0,Amarela,Urbana,643
5,Rondônia,Homens,0 a 4 anos,2010.0,Amarela,Rural,162
6,Rondônia,Homens,0 a 4 anos,2010.0,Parda,Urbana,26827
7,Rondônia,Homens,0 a 4 anos,2010.0,Parda,Rural,9230
8,Rondônia,Homens,0 a 4 anos,2010.0,Indígena,Urbana,116
9,Rondônia,Homens,0 a 4 anos,2010.0,Indígena,Rural,793


In [124]:
populacao = populacao[:57672]

In [125]:
populacao.columns

Index(['Unidade da Federação', 'Sexo', 'Idade', 'Ano', 'Cor ou raça',
       'Situação do domicílio', 'Unnamed: 6'],
      dtype='object')

In [141]:
populacao.rename(columns={'Unnamed: 6': "Quantidade", 'Unidade da Federação': "Estado"}, inplace=True)

In [137]:
populacao[:5]

Unnamed: 0,Unidade da Federação,Sexo,Idade,Ano,Cor ou raça,Situação do domicílio,Quantidade
0,Rondônia,Homens,0 a 4 anos,2010.0,Branca,Urbana,18720
1,Rondônia,Homens,0 a 4 anos,2010.0,Branca,Rural,6024
2,Rondônia,Homens,0 a 4 anos,2010.0,Preta,Urbana,1755
3,Rondônia,Homens,0 a 4 anos,2010.0,Preta,Rural,580
4,Rondônia,Homens,0 a 4 anos,2010.0,Amarela,Urbana,643


In [131]:
populacao = populacao.replace('-', 0)

In [133]:
populacao['Quantidade'] = pd.to_numeric(populacao['Quantidade'])
populacao['Ano'] = pd.to_datetime(populacao['Ano'])

In [152]:
populacao.dtypes

Estado                    object
Sexo                      object
Idade                     object
Ano                      float64
Cor ou raça               object
Situação do domicílio     object
Quantidade                 int64
dtype: object

In [153]:
populacao.groupby('Sexo').sum()

Unnamed: 0_level_0,Ano,Quantidade
Sexo,Unnamed: 1_level_1,Unnamed: 2_level_1
Homens,57960360.0,93406990
Mulheres,57960360.0,97348809


In [154]:
populacao.groupby(['Sexo', 'Cor ou raça']).sum()

Unnamed: 0_level_0,Unnamed: 1_level_0,Ano,Quantidade
Sexo,Cor ou raça,Unnamed: 2_level_1,Unnamed: 3_level_1
Homens,Amarela,9660060.0,951404
Homens,Branca,9660060.0,43652488
Homens,Indígena,9660060.0,409907
Homens,Parda,9660060.0,40861864
Homens,Preta,9660060.0,7526611
Homens,Sem declaração,9660060.0,4716
Mulheres,Amarela,9660060.0,1132884
Mulheres,Branca,9660060.0,47399158
Mulheres,Indígena,9660060.0,408056
Mulheres,Parda,9660060.0,41415469
