# Livro para consulta:
- https://jakevdp.github.io/PythonDataScienceHandbook/03.08-aggregation-and-grouping.html
- https://jakevdp.github.io/PythonDataScienceHandbook/03.09-pivot-tables.html
    

# 1. Importando bibliotecas <a name="import"></a>

<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [140]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from datetime import datetime

%matplotlib inline

# 2. Carregando o dataframe SINASC <a name="read"></a>
<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [7]:
sinasc_raw = pd.read_csv('SINASC_RO_2019.csv')
sinasc_raw.head()

Unnamed: 0,ORIGEM,CODESTAB,CODMUNNASC,LOCNASC,IDADEMAE,ESTCIVMAE,ESCMAE,CODOCUPMAE,QTDFILVIVO,QTDFILMORT,...,KOTELCHUCK,CONTADOR,munResStatus,munResTipo,munResNome,munResUf,munResLat,munResLon,munResAlt,munResArea
0,1,2679477.0,110001,1,19,5.0,8 a 11 anos,,0.0,0.0,...,5,1,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
1,1,2679477.0,110001,1,29,2.0,8 a 11 anos,999992.0,1.0,0.0,...,5,2,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
2,1,2679477.0,110001,1,37,9.0,8 a 11 anos,513205.0,2.0,0.0,...,5,3,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
3,1,2516500.0,110001,1,30,5.0,12 anos ou mais,231205.0,0.0,0.0,...,4,4,ATIVO,MUNIC,Alto Alegre dos Parecis,Rondônia,-12.13178,-61.85308,397.0,3958.273
4,1,2516500.0,110001,1,30,2.0,8 a 11 anos,999992.0,1.0,0.0,...,5,5,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025


# Tarefa 1

### 1. Idade media das mães e dos pais por município (coluna munResNome)


In [8]:
idade_media = sinasc_raw[['munResNome', 'IDADEMAE', 'IDADEPAI']]
idade_media.groupby(['munResNome']).mean()

Unnamed: 0_level_0,IDADEMAE,IDADEPAI
munResNome,Unnamed: 1_level_1,Unnamed: 2_level_1
Alta Floresta D'Oeste,25.991826,29.548701
Alto Alegre dos Parecis,24.844156,29.179104
Alto Paraíso,24.960177,28.833333
Alvorada D'Oeste,25.770732,30.757282
Ariquemes,25.607866,32.466667
Buritis,25.559177,30.8125
Cabixi,26.0375,34.333333
Cacaulândia,25.546667,36.333333
Cacoal,26.890102,30.931854
Campo Novo de Rondônia,24.825301,30.5


### 2. Peso médio dos bebes por sexo que nasceram no dia do seu aniversário por faixas de escolaridade mae
Ex: Você, aluna(o), nasceu no dia 10/01, então você precisa filtrar o conjunto de dados nessa data e calcular o peso médio dos bebês de cada sexo por faixa de escolaridade da mãe.

In [10]:
peso_medio = sinasc_raw[sinasc_raw['DTNASC'] == '2019-01-10'].groupby(['DTNASC', 'SEXO', 'ESCMAE'])['PESO'].mean().to_frame()
peso_medio

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,PESO
DTNASC,SEXO,ESCMAE,Unnamed: 3_level_1
2019-01-10,Feminino,1 a 3 anos,3651.0
2019-01-10,Feminino,12 anos ou mais,3351.111111
2019-01-10,Feminino,4 a 7 anos,3152.375
2019-01-10,Feminino,8 a 11 anos,3120.909091
2019-01-10,Masculino,1 a 3 anos,3078.333333
2019-01-10,Masculino,12 anos ou mais,3015.428571
2019-01-10,Masculino,4 a 7 anos,3105.0
2019-01-10,Masculino,8 a 11 anos,3497.55


### 3. Qual o municipio que nasceu menos bebe em 2019?
    - qual a idade media, maxima, minima das maes nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?

In [143]:
print('Municípios em que nasceram menos bebês:\n')
print(sinasc_raw.munResNome.value_counts().sort_values().head())

sinasc_raw['COUNT'] = 1
sinasc_3 = sinasc_raw.groupby(by='munResNome')[['COUNT', 
                                                'IDADEMAE',
                                                'IDADEPAI']].agg(
    {'COUNT':[('Quantidade de bebês nascidos','count')], 
     'IDADEMAE':[('idade média','mean'), 
                 ('idade máxima',max), 
                 ('idade mínima',min)], 
     'IDADEPAI':[('idade média','mean'), 
                 ('idade máxima',max), 
                 ('idade mínima',min)]})

sinasc_3.sort_values(('COUNT', 'Quantidade de bebês nascidos'))


Municípios em que nasceram menos bebês:

Município ignorado - RO     1
Castanheiras               32
Pimenteiras do Oeste       40
Primavera de Rondônia      43
Parecis                    44
Name: munResNome, dtype: int64


Unnamed: 0_level_0,COUNT,IDADEMAE,IDADEMAE,IDADEMAE,IDADEPAI,IDADEPAI,IDADEPAI
Unnamed: 0_level_1,Quantidade de bebês nascidos,idade média,idade máxima,idade mínima,idade média,idade máxima,idade mínima
munResNome,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2
Município ignorado - RO,1,24.0,24,24,22.0,22.0,22.0
Castanheiras,32,27.28125,39,17,30.392857,43.0,17.0
Pimenteiras do Oeste,40,25.075,40,14,35.6,45.0,25.0
Primavera de Rondônia,43,27.023256,39,16,31.888889,44.0,21.0
Parecis,44,26.454545,41,16,32.473684,61.0,18.0
Rio Crespo,50,26.66,39,16,28.0,28.0,28.0
São Felipe D'Oeste,54,26.481481,41,17,31.395833,57.0,18.0
Teixeirópolis,64,26.03125,39,16,31.5,67.0,20.0
Cacaulândia,75,25.546667,42,16,36.333333,50.0,28.0
Cabixi,80,26.0375,39,13,34.333333,47.0,19.0


### 4. Qual o municipio que nasceu mais bebe no mês de março?
    - qual a quantidade de filhos vivos media, maxima, minima nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?

In [146]:
sinasc_raw['DTNASC'] = pd.to_datetime(sinasc_raw['DTNASC'])
sinasc_mar = sinasc_raw[sinasc_raw.DTNASC.dt.month == 3].copy()

print('O município que mais nasceu bebê no mês de março foi {} com {} nascimentos.'.format(
    sinasc_mar['munResNome'].value_counts().index[0], 
    sinasc_mar['munResNome'].value_counts().values[0]))

sinasc_mar['MES'] = sinasc_mar['DTNASC'].dt.month_name()
sinasc_mar['COUNT'] = 1
sinasc_4 = sinasc_mar.groupby(by=['MES',
                                  'munResNome']
                             )[['COUNT', 
                                'QTDFILVIVO',
                                'IDADEMAE',
                                'IDADEPAI']
                              ].agg({'COUNT':[('Qtd de bebês nascidos','count')], 
                                     'QTDFILVIVO':[('Média','mean'), 
                                                   ('Máx',max), 
                                                   ('Mín',min)], 
                                     'IDADEMAE':[('Média','mean'), 
                                                 ('Máx',max), 
                                                 ('Mín',min), 
                                                 ('Amplitude',lambda x: x.max()-x.min())], 
                                     'IDADEPAI':[('Média','mean'), 
                                                 ('Máx',max), 
                                                 ('Mín',min), 
                                                 ('Amplitude',lambda x: x.max()-x.min())]
                                    })

sinasc_4['Diferença da média IDADEPAI-IDADEMAE'] = sinasc_4[('IDADEPAI','Média')]-sinasc_4[('IDADEMAE','Média')]
sinasc_4.sort_values(('COUNT', 'Qtd de bebês nascidos'), 
                     ascending=False
                    )

O município que mais nasceu bebê no mês de março foi Porto Velho com 744 nascimentos.


Unnamed: 0_level_0,Unnamed: 1_level_0,COUNT,QTDFILVIVO,QTDFILVIVO,QTDFILVIVO,IDADEMAE,IDADEMAE,IDADEMAE,IDADEMAE,IDADEPAI,IDADEPAI,IDADEPAI,IDADEPAI,Diferença da média IDADEPAI-IDADEMAE
Unnamed: 0_level_1,Unnamed: 1_level_1,Qtd de bebês nascidos,Média,Máx,Mín,Média,Máx,Mín,Amplitude,Média,Máx,Mín,Amplitude,Unnamed: 14_level_1
MES,munResNome,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2
March,Porto Velho,744,1.295056,9.0,0.0,26.596774,44,14,30,34.629032,62.0,19.0,43.0,8.032258
March,Ji-Paraná,188,0.828877,4.0,0.0,25.37766,44,13,31,30.831579,56.0,16.0,40.0,5.453919
March,Vilhena,148,0.979592,5.0,0.0,26.412162,39,16,23,33.5625,47.0,27.0,20.0,7.150338
March,Ariquemes,141,1.064748,4.0,0.0,25.304965,42,14,28,28.666667,29.0,28.0,1.0,3.361702
March,Cacoal,133,0.969697,7.0,0.0,26.466165,40,15,25,30.008197,47.0,17.0,30.0,3.542031
March,Jaru,80,1.025641,5.0,0.0,26.55,40,14,26,33.5,41.0,21.0,20.0,6.95
March,Guajará-Mirim,75,1.534247,8.0,0.0,26.333333,43,14,29,34.5,43.0,26.0,17.0,8.166667
March,Rolim de Moura,69,0.724638,5.0,0.0,27.594203,41,18,23,31.257576,50.0,19.0,31.0,3.663373
March,Ouro Preto do Oeste,67,1.014925,5.0,0.0,25.522388,44,14,30,30.175,57.0,19.0,38.0,4.652612
March,Pimenta Bueno,62,0.836066,4.0,0.0,25.177419,39,14,25,29.611111,49.0,17.0,32.0,4.433692


### Analise as respostas encontradas, tire algum insight delas, conte pra gente algo encontrado nos dados. Algo que você julgue relevante e novo pra você.

Diante dos resultados obtidos acima, é possível observar que a média de filhos vivos se mantém em torno de 1, independentemente do total de bebês nascidos em todo o estado de Rondônia em 2019.
Já a média de idade dos pais se mostra maior do que a das mães na maioria dos municípios do estado.