# Livro para consulta:
- https://jakevdp.github.io/PythonDataScienceHandbook/03.08-aggregation-and-grouping.html
- https://jakevdp.github.io/PythonDataScienceHandbook/03.09-pivot-tables.html
    

# 1. Importando bibliotecas <a name="import"></a>

<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [2]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from datetime import datetime as dt

%matplotlib inline

# 2. Carregando o dataframe SINASC <a name="read"></a>
<div style="text-align: right"
     
[Voltar ao índice](#Contents)

In [3]:
df = pd.read_csv('sinasc.csv')


In [None]:
df[['munResNome','QTDFILVIVO','QTDFILMORT']].groupby('munResNome').sum().sort_values(by=['QTDFILVIVO'],ascending=False)

In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 27028 entries, 0 to 27027
Data columns (total 69 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   ORIGEM        27028 non-null  int64  
 1   CODESTAB      26913 non-null  float64
 2   CODMUNNASC    27028 non-null  int64  
 3   LOCNASC       27028 non-null  int64  
 4   IDADEMAE      27028 non-null  int64  
 5   ESTCIVMAE     26711 non-null  float64
 6   ESCMAE        26716 non-null  object 
 7   CODOCUPMAE    24121 non-null  float64
 8   QTDFILVIVO    25455 non-null  float64
 9   QTDFILMORT    24930 non-null  float64
 10  CODMUNRES     27028 non-null  int64  
 11  GESTACAO      25796 non-null  object 
 12  GRAVIDEZ      26949 non-null  object 
 13  PARTO         26979 non-null  object 
 14  CONSULTAS     27028 non-null  int64  
 15  DTNASC        27028 non-null  object 
 16  HORANASC      27007 non-null  float64
 17  SEXO          27024 non-null  object 
 18  APGAR1        26932 non-nu

# Tarefa 1

### 1. Idade media das mães e dos pais por município (coluna munResNome)


In [5]:
df.groupby(['munResNome'])[['IDADEMAE','IDADEPAI']].mean().head(50)

Unnamed: 0_level_0,IDADEMAE,IDADEPAI
munResNome,Unnamed: 1_level_1,Unnamed: 2_level_1
Alta Floresta D'Oeste,25.991826,29.548701
Alto Alegre dos Parecis,24.844156,29.179104
Alto Paraíso,24.960177,28.833333
Alvorada D'Oeste,25.770732,30.757282
Ariquemes,25.607866,32.466667
Buritis,25.559177,30.8125
Cabixi,26.0375,34.333333
Cacaulândia,25.546667,36.333333
Cacoal,26.890102,30.931854
Campo Novo de Rondônia,24.825301,30.5


### 2. Peso médio dos bebes por sexo que nasceram no dia do seu aniversário por faixas de escolaridade mae
Ex: Você, aluna(o), nasceu no dia 10/01, então você precisa filtrar o conjunto de dados nessa data e calcular o peso médio dos bebês de cada sexo por faixa de escolaridade da mãe.

In [6]:
df['DTNASC'] = pd.to_datetime(df['DTNASC'])

In [7]:
df['MEU_Niver'] = df['DTNASC'].loc[df['DTNASC']=='2019-09-29']

In [8]:
df[['MEU_Niver','ESCMAE','SEXO','PESO']].groupby(['MEU_Niver','ESCMAE','SEXO']).mean()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,PESO
MEU_Niver,ESCMAE,SEXO,Unnamed: 3_level_1
2019-09-29,12 anos ou mais,Feminino,3095.714286
2019-09-29,12 anos ou mais,Masculino,2939.0
2019-09-29,4 a 7 anos,Feminino,3372.5
2019-09-29,4 a 7 anos,Masculino,3375.166667
2019-09-29,8 a 11 anos,Feminino,3403.333333
2019-09-29,8 a 11 anos,Masculino,3357.0


### 3. Qual o municipio que nasceu menos bebe em 2019?
    - qual a idade media, maxima, minima das maes nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?

In [9]:
# REMOÇÃO DO MUNICIPIO QUE NASCEU APENAS UMA CRIANÇA
filtro = df.loc[df['munResNome']=='Município ignorado - RO']
df = df.drop(filtro.index)

In [10]:
df_menos = df[['munResNome','ORIGEM','DTNASC','IDADEMAE','IDADEPAI']]

In [11]:
# NOME DO MUNICIPIO QUE NASCEU MENOS FILHOS
df_menos[['munResNome','ORIGEM']].groupby('munResNome').sum().nsmallest(1,'ORIGEM') 

Unnamed: 0_level_0,ORIGEM
munResNome,Unnamed: 1_level_1
Castanheiras,32


In [12]:
# REMOÇÃO DOS DADOS FALTANTES
df_min = df_menos[['munResNome','IDADEMAE','IDADEPAI']].loc[df_menos['munResNome']=='Castanheiras'].dropna()

In [13]:
# IDADE MAXIMA E MINIMA DAS MAES E DOS PAIS PELO MUNICIPIO
df_min.groupby('munResNome')[['IDADEMAE','IDADEPAI']].agg([('Media',np.mean),('Maxima',max),('Minima','min')])

Unnamed: 0_level_0,IDADEMAE,IDADEMAE,IDADEMAE,IDADEPAI,IDADEPAI,IDADEPAI
Unnamed: 0_level_1,Media,Maxima,Minima,Media,Maxima,Minima
munResNome,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
Castanheiras,28.071429,39,18,30.392857,43.0,17.0


### 4. Qual o municipio que nasceu mais bebe no mês de março?
    - qual a quantidade de filhos vivos media, maxima, minima nesse municipio?
    - qual a idade media, maxima, minima dos pais nesse municipio?



In [14]:
# FILTRANDO DADOS PELO MES DE MARÇO
df_marco = df[['munResNome','DTNASC','ORIGEM','QTDFILVIVO','IDADEMAE','IDADEPAI']]
df_maior = df_marco.loc[df['DTNASC'].dt.month==3]
# MUNICIPIO COM MAIS CRIANÇAS NASCIDAS EM MARÇO
df_maior[['munResNome','ORIGEM']].groupby('munResNome').sum().nlargest(1,'ORIGEM')

Unnamed: 0_level_0,ORIGEM
munResNome,Unnamed: 1_level_1
Porto Velho,744


In [15]:
df_max = df_maior[['munResNome','IDADEPAI','QTDFILVIVO']].loc[df_maior['munResNome'] =='Porto Velho'].dropna()

In [16]:
# QTD FILHOS VIVOS MÉDIA MÁXIMA E MINIMA
df_max[['munResNome','QTDFILVIVO']].groupby('munResNome').agg([('Media',np.mean),('Maxima',max),('Minima','min')])

Unnamed: 0_level_0,QTDFILVIVO,QTDFILVIVO,QTDFILVIVO
Unnamed: 0_level_1,Media,Maxima,Minima
munResNome,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
Porto Velho,1.479167,6.0,0.0


In [17]:
# IDADE MÉDIA, MÁXIMA E MINIMA DOS PAIS NO MUNICIPIO
df_max[['munResNome','IDADEPAI']].groupby('munResNome').agg([('Media',np.mean),('Maxima',max),('Minima','min')])

Unnamed: 0_level_0,IDADEPAI,IDADEPAI,IDADEPAI
Unnamed: 0_level_1,Media,Maxima,Minima
munResNome,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2
Porto Velho,35.75,62.0,19.0


### Analise as respostas encontradas, tire algum insight delas, conte pra gente algo encontrado nos dados. Algo que você julgue relevante e novo pra você.

* As crianças nascidas no dia do meu aniversario tem uma média de peso maior entre as mães com menor escolaridade.
* O municipio com menor taxa de natalidade possui uma média de idade entre os pais parecida com o restante do estado.
* Como era de se esperar o municipio com a maior taxa de natalidade é a capital Porto Velho
