# Livro para consulta:
- https://jakevdp.github.io/PythonDataScienceHandbook/03.08-aggregation-and-grouping.html
- https://jakevdp.github.io/PythonDataScienceHandbook/03.09-pivot-tables.html
    

# 1. Importando bibliotecas <a name="import"></a>

<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [54]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib_inline

# 2. Carregando o dataframe SINASC <a name="read"></a>
<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [10]:
sinasc_raw = pd.read_csv('SINASC_RO_2019.csv')
sinasc_raw.head()

Unnamed: 0,ORIGEM,CODESTAB,CODMUNNASC,LOCNASC,IDADEMAE,ESTCIVMAE,ESCMAE,CODOCUPMAE,QTDFILVIVO,QTDFILMORT,...,KOTELCHUCK,CONTADOR,munResStatus,munResTipo,munResNome,munResUf,munResLat,munResLon,munResAlt,munResArea
0,1,2679477.0,110001,1,19,5.0,8 a 11 anos,,0.0,0.0,...,5,1,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
1,1,2679477.0,110001,1,29,2.0,8 a 11 anos,999992.0,1.0,0.0,...,5,2,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
2,1,2679477.0,110001,1,37,9.0,8 a 11 anos,513205.0,2.0,0.0,...,5,3,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025
3,1,2516500.0,110001,1,30,5.0,12 anos ou mais,231205.0,0.0,0.0,...,4,4,ATIVO,MUNIC,Alto Alegre dos Parecis,Rondônia,-12.13178,-61.85308,397.0,3958.273
4,1,2516500.0,110001,1,30,2.0,8 a 11 anos,999992.0,1.0,0.0,...,5,5,ATIVO,MUNIC,Alta Floresta D'Oeste,Rondônia,-11.93554,-61.99982,338.0,7067.025


# Tarefa 1

### 1. Idade media das mães e dos pais por município (coluna munResNome)


In [91]:
idade_media = sinasc_raw.groupby('munResNome').agg({'IDADEMAE': 'mean', 'IDADEPAI': 'mean'})
print(idade_media)

                            IDADEMAE   IDADEPAI
munResNome                                     
Alta Floresta D'Oeste      25.991826  29.548701
Alto Alegre dos Parecis    24.844156  29.179104
Alto Paraíso               24.960177  28.833333
Alvorada D'Oeste           25.770732  30.757282
Ariquemes                  25.607866  32.466667
Buritis                    25.559177  30.812500
Cabixi                     26.037500  34.333333
Cacaulândia                25.546667  36.333333
Cacoal                     26.890102  30.931854
Campo Novo de Rondônia     24.825301  30.500000
Candeias do Jamari         25.243323  29.894737
Castanheiras               27.281250  30.392857
Cerejeiras                 27.240506  31.652778
Chupinguaia                25.333333  29.629630
Colorado do Oeste          27.602804  34.354839
Corumbiara                 24.716535  32.470588
Costa Marques              24.412017  30.613636
Cujubim                    24.482927  31.400000
Espigão D'Oeste            26.093333  31

### 2. Peso médio dos bebes por sexo que nasceram no dia do seu aniversário por faixas de escolaridade mae
Ex: Você, aluna(o), nasceu no dia 10/01, então você precisa filtrar o conjunto de dados nessa data e calcular o peso médio dos bebês de cada sexo por faixa de escolaridade da mãe.

In [92]:
aniversario = sinasc_raw[(sinasc_raw['DTNASC'].dt.day == 12) & (sinasc_raw['DTNASC'].dt.month == 7)]
peso_medio_por_sexo_escolaridade = aniversario.groupby(['SEXO', 'ESCMAE'])['PESO'].mean()
print(peso_medio_por_sexo_escolaridade)

SEXO       ESCMAE         
Feminino   12 anos ou mais    3040.555556
           4 a 7 anos         2952.500000
           8 a 11 anos        3316.933333
Masculino  1 a 3 anos         3035.000000
           12 anos ou mais    3263.500000
           4 a 7 anos         3713.750000
           8 a 11 anos        3059.064516
Name: PESO, dtype: float64


### 3. Qual o municipio que nasceu menos bebe em 2019?
    - qual a idade media, maxima, minima das maes nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?

In [89]:
dados_menos_bebe = sinasc_raw[sinasc_raw['munResNome'] != 'Município ignorado - RO']
menos_bebe = dados_menos_bebe['munResNome'].value_counts().idxmin()
idade_media_min_mae = dados_menos_bebe[dados_menos_bebe['munResNome'] == menos_bebe]['IDADEMAE'].mean()
idade_max_mae = dados_menos_bebe[dados_menos_bebe['munResNome'] == menos_bebe]['IDADEMAE'].max()
idade_min_mae = dados_menos_bebe[dados_menos_bebe['munResNome'] == menos_bebe]['IDADEMAE'].min()
idade_media_min_pai = dados_menos_bebe[dados_menos_bebe['munResNome'] == menos_bebe]['IDADEPAI'].mean()
idade_max_pai = dados_menos_bebe[dados_menos_bebe['munResNome'] == menos_bebe]['IDADEPAI'].max()
idade_min_pai = dados_menos_bebe[dados_menos_bebe['munResNome'] == menos_bebe]['IDADEPAI'].min()
print(f"Menos bebês nasceram em {menos_bebe} em 2019.")
print(f"Idade média mães: {idade_media_min_mae}")
print(f"Idade máxima mães: {idade_max_mae}")
print(f"Idade minima mães: {idade_min_mae}")
print(f"Idade média pais: {idade_media_min_pai}")
print(f"Idade máxima pais: {idade_max_pai}")
print(f"Idade minima pais: {idade_min_pai}")

Menos bebês nasceram em Castanheiras em 2019.
Idade média mães: 27.28125
Idade máxima mães: 39
Idade minima mães: 17
Idade média pais: 30.392857142857142
Idade máxima pais: 43.0
Idade minima pais: 17.0


### 4. Qual o municipio que nasceu mais bebe no mês de março?
    - qual a quantidade de filhos vivos media, maxima, minima nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?



In [86]:
mais_bebe_marco = sinasc_raw[sinasc_raw['DTNASC'].dt.month == 3]['munResNome'].value_counts().idxmax()
dados_mais_bebe_marco = sinasc_raw[sinasc_raw['munResNome'] == mais_bebe_marco]
estatisticas_filhos = dados_mais_bebe_marco['QTDFILVIVO'].describe()
estatisticas_idade_pais = dados_mais_bebe_marco['IDADEPAI'].describe()
print(f"Mais bebês nasceram em {mais_bebe_marco} em março.")
print(f"Filhos vivos estatísticas:\n: {estatisticas_filhos}")
print(f"Estatísticas Paiss: {estatisticas_idade_pais}")

Mais bebês nasceram em Porto Velho em março.
Filhos vivos estatísticas:
: count    7319.000000
mean        1.167236
std         1.222640
min         0.000000
25%         0.000000
50%         1.000000
75%         2.000000
max        12.000000
Name: QTDFILVIVO, dtype: float64
Estatísticas Paiss: count    672.000000
mean      32.352679
std        7.865620
min       16.000000
25%       27.000000
50%       32.000000
75%       37.000000
max       65.000000
Name: IDADEPAI, dtype: float64


### Analise as respostas encontradas, tire algum insight delas, conte pra gente algo encontrado nos dados. Algo que você julgue relevante e novo pra você.

Exemplo:
- Ah, descobri que a idade mediana das mulheres que deram a luz no ano de 2019 dos municipios x é maior que y.

- Em Castanheiras, onde nasceram menos bebês em 2019, a idade média das mães é de 27,28, com uma idade mínima de 17 e uma idade máxima de 39. 

- A idade média dos pais ali é de 28 e 30, variando de 17 a 43.

- O peso médio ao nascer de bebês nascidos em 12 de julho varia de acordo com o gênero e o nível de escolaridade da mãe.

- Para mulheres, o peso médio ao nascer é maior para mães com 8 a 11 anos de educação (3316,93g), enquanto para homens, é maior para mães com 4 a 7 anos de educação (3713,75g).

- O município com mais nascimentos em março é Porto Velho.

- As estatísticas para o número de filhos nascidos vivos em Porto Velho durante março mostram que a média é de aproximadamente 1,17 crianças, com um máximo de 12 e um mínimo de 0. 

- A idade média dos pais em Porto Velho é de cerca de 32,35, com uma idade mínima de 16 e uma idade máxima de 65.