# Livro para consulta:
- https://jakevdp.github.io/PythonDataScienceHandbook/03.08-aggregation-and-grouping.html
- https://jakevdp.github.io/PythonDataScienceHandbook/03.09-pivot-tables.html
    

# 1. Importando bibliotecas <a name="import"></a>

<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [1]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

%matplotlib inline

# 2. Carregando o dataframe SINASC <a name="read"></a>
<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [2]:
sinasc_raw = pd.read_csv('SINASC_RO_2019.csv')
sinasc_raw.head()

Unnamed: 0,ORIGEM,CODESTAB,CODMUNNASC,LOCNASC,IDADEMAE,ESTCIVMAE,ESCMAE,CODOCUPMAE,QTDFILVIVO,QTDFILMORT,...,KOTELCHUCK,CONTADOR,munResStatus,munResTipo,munResNome,munResUf,munResLat,munResLon,munResAlt,munResArea
0,1,2679477.0,110001,1,19,5.0,8 a 11 anos,,0.0,0.0,...,5,1,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
1,1,2679477.0,110001,1,29,2.0,8 a 11 anos,999992.0,1.0,0.0,...,5,2,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
2,1,2679477.0,110001,1,37,9.0,8 a 11 anos,513205.0,2.0,0.0,...,5,3,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
3,1,2516500.0,110001,1,30,5.0,12 anos ou mais,231205.0,0.0,0.0,...,4,4,ATIVO,MUNIC,Alto Alegre dos Parecis,Rondônia,-12.13178,-61.85308,397.0,3958.273
4,1,2516500.0,110001,1,30,2.0,8 a 11 anos,999992.0,1.0,0.0,...,5,5,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025


# Tarefa 1

### 1. Idade media das mães e dos pais por município (coluna munResNome)


In [3]:
sinasc_raw.columns

Index(['ORIGEM', 'CODESTAB', 'CODMUNNASC', 'LOCNASC', 'IDADEMAE', 'ESTCIVMAE',
       'ESCMAE', 'CODOCUPMAE', 'QTDFILVIVO', 'QTDFILMORT', 'CODMUNRES',
       'GESTACAO', 'GRAVIDEZ', 'PARTO', 'CONSULTAS', 'DTNASC', 'HORANASC',
       'SEXO', 'APGAR1', 'APGAR5', 'RACACOR', 'PESO', 'IDANOMAL', 'DTCADASTRO',
       'CODANOMAL', 'NUMEROLOTE', 'VERSAOSIST', 'DTRECEBIM', 'DIFDATA',
       'DTRECORIGA', 'NATURALMAE', 'CODMUNNATU', 'CODUFNATU', 'ESCMAE2010',
       'SERIESCMAE', 'DTNASCMAE', 'RACACORMAE', 'QTDGESTANT', 'QTDPARTNOR',
       'QTDPARTCES', 'IDADEPAI', 'DTULTMENST', 'SEMAGESTAC', 'TPMETESTIM',
       'CONSPRENAT', 'MESPRENAT', 'TPAPRESENT', 'STTRABPART', 'STCESPARTO',
       'TPNASCASSI', 'TPFUNCRESP', 'TPDOCRESP', 'DTDECLARAC', 'ESCMAEAGR1',
       'STDNEPIDEM', 'STDNNOVA', 'CODPAISRES', 'TPROBSON', 'PARIDADE',
       'KOTELCHUCK', 'CONTADOR', 'munResStatus', 'munResTipo', 'munResNome',
       'munResUf', 'munResLat', 'munResLon', 'munResAlt', 'munResArea'],
      dtype='object')

In [4]:
sinasc_raw.groupby('munResNome').agg({'IDADEPAI':'mean', 'IDADEMAE':'mean'}) #podemos usar reset_index ou não

Unnamed: 0_level_0,IDADEPAI,IDADEMAE
munResNome,Unnamed: 1_level_1,Unnamed: 2_level_1
Alta Floresta D'Oeste,29.548701,25.991826
Alto Alegre dos Parecis,29.179104,24.844156
Alto Paraíso,28.833333,24.960177
Alvorada D'Oeste,30.757282,25.770732
Ariquemes,32.466667,25.607866
Buritis,30.8125,25.559177
Cabixi,34.333333,26.0375
Cacaulândia,36.333333,25.546667
Cacoal,30.931854,26.890102
Campo Novo de Rondônia,30.5,24.825301


### 2. Peso médio dos bebes por sexo que nasceram no dia do seu aniversário por faixas de escolaridade mae
Ex: Você, aluna(o), nasceu no dia 10/01, então você precisa filtrar o conjunto de dados nessa data e calcular o peso médio dos bebês de cada sexo por faixa de escolaridade da mãe.

In [5]:
sinasc_raw['DTNASC'].head()

0    2019-02-19
1    2019-02-21
2    2019-02-25
3    2019-03-20
4    2019-03-23
Name: DTNASC, dtype: object

In [6]:
sinasc_niver = sinasc_raw[sinasc_raw['DTNASC']=='2019-06-09']
sinasc_niver.groupby(['ESCMAE', 'SEXO'])['PESO'].mean()

ESCMAE           SEXO     
12 anos ou mais  Feminino     3002.500000
                 Masculino    3310.000000
4 a 7 anos       Masculino    3398.571429
8 a 11 anos      Feminino     3172.416667
                 Masculino    3138.736842
Name: PESO, dtype: float64

### 3. Qual o municipio que nasceu menos bebe em 2019?
    - qual a idade media, maxima, minima das maes nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?

In [7]:
sinasc_raw['munResNome'].value_counts().sort_values(ascending=True)

munResNome
Município ignorado - RO         1
Castanheiras                   32
Pimenteiras do Oeste           40
Primavera de Rondônia          43
Parecis                        44
Rio Crespo                     50
São Felipe D'Oeste             54
Teixeirópolis                  64
Cacaulândia                    75
Cabixi                         80
Vale do Paraíso                81
Ministro Andreazza             84
Vale do Anari                  93
Theobroma                      97
Novo Horizonte do Oeste        98
Santa Luzia D'Oeste            99
Nova União                    104
Itapuã do Oeste               109
Governador Jorge Teixeira     112
Corumbiara                    127
Alto Alegre dos Parecis       154
Chupinguaia                   162
Mirante da Serra              164
Campo Novo de Rondônia        166
Seringueiras                  168
Urupá                         170
Monte Negro                   199
Alvorada D'Oeste              205
Cujubim                       205
Col

In [8]:
sinasc_mun = sinasc_raw[['munResNome', 'IDADEMAE', 'IDADEPAI']]
sinasc_mun.groupby('munResNome').agg(['min', 'mean', 'max']).loc['Castanheiras']

IDADEMAE  min     17.000000
          mean    27.281250
          max     39.000000
IDADEPAI  min     17.000000
          mean    30.392857
          max     43.000000
Name: Castanheiras, dtype: float64

### 4. Qual o municipio que nasceu mais bebe no mês de março?
    - qual a quantidade de filhos vivos media, maxima, minima nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?



In [9]:
sinasc_raw['munResNome'].value_counts()

munResNome
Porto Velho                  8437
Ji-Paraná                    2182
Ariquemes                    1729
Vilhena                      1590
Cacoal                       1374
Rolim de Moura                927
Jaru                          881
Guajará-Mirim                 781
Ouro Preto do Oeste           631
Pimenta Bueno                 616
Buritis                       583
Machadinho D'Oeste            500
Espigão D'Oeste               450
Nova Mamoré                   432
Alta Floresta D'Oeste         367
São Miguel do Guaporé         353
Candeias do Jamari            337
Presidente Médici             304
São Francisco do Guaporé      303
Nova Brasilândia D'Oeste      261
Cerejeiras                    237
Costa Marques                 233
Alto Paraíso                  226
Colorado do Oeste             214
Alvorada D'Oeste              205
Cujubim                       205
Monte Negro                   199
Urupá                         170
Seringueiras                  168
Cam

In [10]:
sinasc_mun = sinasc_raw[['munResNome', 'IDADEMAE', 'IDADEPAI', 'QTDFILVIVO']]
#quantidade min, média e max de filhos vivos em Porto Velho
sinasc_mun.groupby('munResNome')['QTDFILVIVO'].agg(['min', 'mean', 'max']).loc['Porto Velho']

min      0.000000
mean     1.167236
max     12.000000
Name: Porto Velho, dtype: float64

In [11]:
#quantidade min, média e max das idades dos pais em Porto Velho
sinasc_mun.groupby('munResNome')[['IDADEMAE', 'IDADEPAI']].agg(['min', 'mean', 'max']).loc['Porto Velho']

IDADEMAE  min     12.000000
          mean    26.312670
          max     47.000000
IDADEPAI  min     16.000000
          mean    32.352679
          max     65.000000
Name: Porto Velho, dtype: float64

### Analise as respostas encontradas, tire algum insight delas, conte pra gente algo encontrado nos dados. Algo que você julgue relevante e novo pra você.

Exemplo:
- Ah, descobri que a idade mediana das mulheres que deram a luz no ano de 2019 dos municipios x é maior que y.

In [12]:
#Trabalhando com esse agrupamento observei que teve uma mãe de 53 anos em Cerejeiras! Impressionante!
sinasc_mun = sinasc_raw[['munResNome', 'IDADEMAE', 'IDADEPAI']]
sinasc_mun.groupby('munResNome').agg(['min', 'mean', 'max'])

Unnamed: 0_level_0,IDADEMAE,IDADEMAE,IDADEMAE,IDADEPAI,IDADEPAI,IDADEPAI
Unnamed: 0_level_1,min,mean,max,min,mean,max
munResNome,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
Alta Floresta D'Oeste,14,25.991826,53,17.0,29.548701,58.0
Alto Alegre dos Parecis,14,24.844156,41,16.0,29.179104,50.0
Alto Paraíso,11,24.960177,42,21.0,28.833333,49.0
Alvorada D'Oeste,15,25.770732,44,17.0,30.757282,52.0
Ariquemes,13,25.607866,44,20.0,32.466667,51.0
Buritis,14,25.559177,44,18.0,30.8125,49.0
Cabixi,13,26.0375,39,19.0,34.333333,47.0
Cacaulândia,16,25.546667,42,28.0,36.333333,50.0
Cacoal,14,26.890102,47,17.0,30.931854,66.0
Campo Novo de Rondônia,13,24.825301,40,21.0,30.5,40.0
