# Script para ánalise de nascimentos em Rondônia - 2019

In [1]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import os

sns.set_theme() 


def plota_pivot_table(df, value, index, func, ylabel, xlabel, opcao='nada'):  ## função para plotar gráficos
    if opcao == 'nada':
        pd.pivot_table(df, values=value, index=index,
                       aggfunc=func).plot(figsize=[15, 5])
    elif opcao == 'sort':  # organizar valores 
        pd.pivot_table(df, values=value, index=index,
                       aggfunc=func).sort_values(value).plot(figsize=[15, 5])
    elif opcao == 'unstack':   # quando quiser usar 2 colunas como referência, uma como linhas e a outra como colunas
        pd.pivot_table(df, values=value, index=index,
                       aggfunc=func).unstack().plot(figsize=[15, 5])
    plt.ylabel(ylabel)  # legenda do eixo y
    plt.xlabel(xlabel)  # legenda do eixo x
    return None

meses = ['MAR', 'ABR', 'MAI', 'JUN', 'DEZ']

for mes in meses:
    sinasc = pd.read_csv('SINASC_RO_2019_'+mes+'.csv') # carregar base de dados

    max_data = sinasc.DTNASC.max()[:7]  # data dos nascimentos (mês e ano), referência para nome da pasta que será criada
    print(max_data)
    os.makedirs('./output/figs/'+max_data, exist_ok=True)  # cria pasta nomeada com o mês e ano dos nascimentos 


    plota_pivot_table(sinasc, 'IDADEMAE', 'DTNASC', 'mean', 'média idade mãe', 'data_nascimento', opcao='nada')
    plt.savefig('./output/figs/'+max_data+'/media idade mae.png') # salva figura na pasta criada
    plt.close()

    plota_pivot_table(sinasc, 'IDADEMAE', 'DTNASC', 'count', 'quantidade de nascimentos', 'data_nascimento', opcao='nada')
    plt.savefig('./output/figs/'+max_data+'/quantidade nascimentos.png')
    plt.close()

    plota_pivot_table(sinasc, 'IDADEMAE', ['DTNASC', 'SEXO'], 'count', 'idade', 'data_nascimento', opcao='unstack')
    plt.savefig('./output/figs/'+max_data+'/media idade mae por sexo.png')
    plt.close()

    plota_pivot_table(sinasc, 'PESO', ['DTNASC', 'SEXO'], 'count', 'peso', 'data_nascimento', opcao='unstack')
    plt.savefig('./output/figs/'+max_data+'/media peso bebe por sexo.png')
    plt.close()

    plota_pivot_table(sinasc, 'PESO', 'ESCMAE', 'median', 'peso', 'escolaridade_mae', opcao='sort')
    plt.savefig('./output/figs/'+max_data+'/media peso por escolaridade mae.png')
    plt.close()
    
    plota_pivot_table(sinasc, 'APGAR1', 'GESTACAO', 'mean', 'apgar1 medio', 'gestacao', opcao='sort')
    plt.savefig('./output/figs/'+max_data+'/media apgar1 por gestacao.png')
    plt.close()

    plota_pivot_table(sinasc, 'APGAR5', 'GESTACAO', 'mean', 'apgar5 medio', 'gestacao', opcao='sort')
    plt.savefig('./output/figs/'+max_data+'/media apgar5 por gestacao.png')
    plt.close()

2019-03
2019-04
2019-05
2019-06
2019-12


* Uma forma de tornar este processo mais automatizado e eficiente seria criar um script que possa ser chamado por meio de uma linha de comando.  
* Poderia incluir no código a geração de gráficos por mês (e não o cumulativo de meses), assim obtendo mais informações sobre os nascimentos.
* Poderia, também, incluir no código a criação de painéis com gráficos daquele mês, facilitando a comparação e a elaboração de apresentações. 