# Scripting - Parte 1

### 1 - Criando um código com os import necessários para gerar os gráficos referentes a base de dados de março, abril, maio, junho e dezembro.

In [65]:
# Bibliotecas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os

# Main function
def plot_pivot_table(data, value, index, function, option='default', ylabel=None, xlabel=None, title=None):
    if option == 'default':
        pd.pivot_table(data, values=value, index=index, aggfunc=function).plot(figsize=[13,5], color='blue')
    elif option == 'unstack':
        pd.pivot_table(data, values=value, index=index, aggfunc=function).unstack().plot(figsize=[13,5])
    elif option == 'sort':
        pd.pivot_table(data, values=value, index=index, aggfunc=function).sort_values(value).plot(figsize=[13,5], color='green')

    plt.ylabel(ylabel)
    plt.xlabel(xlabel)
    plt.title(title)

    return None
        

# Carregando datasets
df_mar = pd.read_csv('SINASC_RO_2019_MAR.csv')
df_abr = pd.read_csv('SINASC_RO_2019_ABR.csv')
df_mai = pd.read_csv('SINASC_RO_2019_MAI.csv')
df_jun = pd.read_csv('SINASC_RO_2019_JUN.csv')
df_dez = pd.read_csv('SINASC_RO_2019_DEZ.csv')
# Armazenando dados
df_meses = [df_mar, df_abr, df_mai, df_jun, df_dez]


for df in df_meses:
    # Definindo a data (ano/mês)
    max_data = df['DTNASC'].max()[:7]
    print(max_data)
    # Definindo a criação de uma pasta
    os.makedirs('./figs/part1-'+max_data)

    # Plots
    plot_pivot_table(df, 'IDADEMAE', 'DTNASC', 'mean', ylabel='Média idade da mãe', 
                     xlabel='Data de nascimento', title='Média idade mãe X data nascimento')
    plt.savefig('./figs/part1-'+max_data+'/media_idade_x_data_nasc.png', dpi=200)
    plt.close()

    plot_pivot_table(df, 'IDADEMAE', ['DTNASC', 'SEXO'], 'mean', option='unstack', ylabel='Média idade da mãe', 
                     xlabel='Data de nascimento', title='Média idade mãe X sexo bebê por data nascimento')
    plt.savefig('./figs/part1-'+max_data+'/media_idade_x_sexo_data_nasc.png', dpi=200)
    plt.close()

    plot_pivot_table(df, 'PESO', ['DTNASC', 'SEXO'], function='mean', option='unstack', ylabel='Média do peso do bebê',
                    xlabel='Data de nascimento', title='Peso x sexo bebê por data nascimento')
    plt.savefig('./figs/part1-'+max_data+'/media_peso_x_sexo_data_nasc.png', dpi=200)
    plt.close()

    plot_pivot_table(df, 'PESO', 'ESCMAE', 'median', option='sort', ylabel='Mediana do peso', 
                     xlabel='Escolaridade da mãe', title='Peso do bebê X Escolaridade da mãe')
    plt.savefig('./figs/part1-'+max_data+'/peso_esc_mae.png', dpi=200)
    plt.close()

    plot_pivot_table(df, 'APGAR1', 'GESTACAO', 'mean', option='sort', ylabel='Média apgar1', 
                     xlabel='Gestação', title='APGAR1 x Gestação')
    plt.savefig('./figs/part1-'+max_data+'/apgar1_x_gestacao.png', dpi=200)
    plt.close()

    plot_pivot_table(df, 'APGAR5', 'GESTACAO', 'mean', option='sort', ylabel='Média apgar5', 
                     xlabel='Gestação', title='APGAR5 x Gestação')
    plt.savefig('./figs/part1-'+max_data+'/apgar5_x_gestacao.png', dpi=200)
    plt.close()

2019-03
2019-04
2019-05
2019-06
2019-12


### 2 - Como você poderia fazer para deixar isso mais automatizado? Descreva na última célula do jupyter notebook o que ajudaria na hora de gerar novos gráficos pros meses/anos seguintes.

- Uma possibilidade adicional de automatização seria a inserção da uma opção de seleção, na qual pode-se escolher um mês de interesse, gerando os gráficos do mesmo. Um outro adicional interessante seria a opção de gerar gráficos de todos os meses, como por exemplo todos os gráficos ao longo de um ano.
- <span style='color:blue'> Implementei a ideia comentada no código abaixo.

In [130]:
# Bibliotecas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os

# Main function
def plot_pivot_table(data, value, index, function, option='default', ylabel=None, xlabel=None, title=None):
    if option == 'default':
        pd.pivot_table(data, values=value, index=index, aggfunc=function).plot(figsize=[13,5], color='blue')
    elif option == 'unstack':
        pd.pivot_table(data, values=value, index=index, aggfunc=function).unstack().plot(figsize=[13,5])
    elif option == 'sort':
        pd.pivot_table(data, values=value, index=index, aggfunc=function).sort_values(value).plot(figsize=[13,5], color='green')

    plt.ylabel(ylabel)
    plt.xlabel(xlabel)
    plt.title(title)

    return None

meses_ano = {'JANEIRO-2019': 'SINASC_RO_2019_JAN.csv',
      'FEVEREIRO-2019' : 'SINASC_RO_2019_FEV.csv',
      'MARÇO-2019' : 'SINASC_RO_2019_MAR.csv',
      'ABRIL-2019' : 'SINASC_RO_2019_ABR.csv',
      'MAIO-2019' : 'SINASC_RO_2019_MAI.csv',
       'JUNHO-2019' : 'SINASC_RO_2019_JUN.csv',
       'JULHO-2019' : 'SINASC_RO_2019_JUL.csv',
      'AGOSTO-2019' : 'SINASC_RO_2019_AGO.csv',
       'SETEMBRO-2019' : 'SINASC_RO_2019_SET.csv',
       'OUTUBRO-2019' : 'SINASC_RO_2019_OUT.csv',
       'NOVEMBRO-2019' : 'SINASC_RO_2019_NOV.csv',
       'DEZEMBRO-2019' : 'SINASC_RO_2019_DEZ.csv'
      }

# Inserindo mês de interesse
mes_interesse = input('Insira o mês e o ano que deseja analisar (ex:"JANEIRO-2019") ou se deseja analisar tudo (ex:"TUDO"): ').upper()
# Verificação 
if mes_interesse in meses_ano:
    df = pd.read_csv(meses_ano[mes_interesse])
    print(df.head(3))

    # Definindo a data (ano/mês)
    max_data = df['DTNASC'].max()[:7]
    print(max_data)
    # Definindo a criação de uma pasta
    os.makedirs('./figs/part1-'+max_data)

    # Plots
    plot_pivot_table(df, 'IDADEMAE', 'DTNASC', 'mean', ylabel='Média idade da mãe', 
                     xlabel='Data de nascimento', title='Média idade mãe X data nascimento')
    plt.savefig('./figs/part1-'+max_data+'/media_idade_x_data_nasc.png', dpi=200)

    plot_pivot_table(df, 'IDADEMAE', ['DTNASC', 'SEXO'], 'mean', option='unstack', ylabel='Média idade da mãe', 
                     xlabel='Data de nascimento', title='Média idade mãe X sexo bebê por data nascimento')
    plt.savefig('./figs/part1-'+max_data+'/media_idade_x_sexo_data_nasc.png', dpi=200)

    plot_pivot_table(df, 'PESO', ['DTNASC', 'SEXO'], function='mean', option='unstack', ylabel='Média do peso do bebê',
                    xlabel='Data de nascimento', title='Peso x sexo bebê por data nascimento')
    plt.savefig('./figs/part1-'+max_data+'/media_peso_x_sexo_data_nasc.png', dpi=200)

    plot_pivot_table(df, 'PESO', 'ESCMAE', 'median', option='sort', ylabel='Mediana do peso', 
                     xlabel='Escolaridade da mãe', title='Peso do bebê X Escolaridade da mãe')
    plt.savefig('./figs/part1-'+max_data+'/peso_esc_mae.png', dpi=200)

    plot_pivot_table(df, 'APGAR1', 'GESTACAO', 'mean', option='sort', ylabel='Média apgar1', 
                     xlabel='Gestação', title='APGAR1 x Gestação')
    plt.savefig('./figs/part1-'+max_data+'/apgar1_x_gestacao.png', dpi=200)

    plot_pivot_table(df, 'APGAR5', 'GESTACAO', 'mean', option='sort', ylabel='Média apgar5', 
                     xlabel='Gestação', title='APGAR5 x Gestação')
    plt.savefig('./figs/part1-'+max_data+'/apgar5_x_gestacao.png', dpi=200)    
    
elif mes_interesse == "TUDO":
    df_list_full = []
    for mes in meses_ano.values():
        df_mes = pd.read_csv(mes)
        df_list_full.append(df_mes)

    # ----
    for df in df_list_full:
        # Definindo a data (ano/mês)
        max_data = df['DTNASC'].max()[:7]
        print(max_data)
        # Definindo a criação de uma pasta
        os.makedirs('./figs/part1-'+max_data)
    
        # Plots
        plot_pivot_table(df, 'IDADEMAE', 'DTNASC', 'mean', ylabel='Média idade da mãe', 
                         xlabel='Data de nascimento', title='Média idade mãe X data nascimento')
        plt.savefig('./figs/part1-'+max_data+'/media_idade_x_data_nasc.png', dpi=200)
        plt.close()
    
        plot_pivot_table(df, 'IDADEMAE', ['DTNASC', 'SEXO'], 'mean', option='unstack', ylabel='Média idade da mãe', 
                         xlabel='Data de nascimento', title='Média idade mãe X sexo bebê por data nascimento')
        plt.savefig('./figs/part1-'+max_data+'/media_idade_x_sexo_data_nasc.png', dpi=200)
        plt.close()
    
        plot_pivot_table(df, 'PESO', ['DTNASC', 'SEXO'], function='mean', option='unstack', ylabel='Média do peso do bebê',
                        xlabel='Data de nascimento', title='Peso x sexo bebê por data nascimento')
        plt.savefig('./figs/part1-'+max_data+'/media_peso_x_sexo_data_nasc.png', dpi=200)
        plt.close()
    
        plot_pivot_table(df, 'PESO', 'ESCMAE', 'median', option='sort', ylabel='Mediana do peso', 
                         xlabel='Escolaridade da mãe', title='Peso do bebê X Escolaridade da mãe')
        plt.savefig('./figs/part1-'+max_data+'/peso_esc_mae.png', dpi=200)
        plt.close()
    
        plot_pivot_table(df, 'APGAR1', 'GESTACAO', 'mean', option='sort', ylabel='Média apgar1', 
                         xlabel='Gestação', title='APGAR1 x Gestação')
        plt.savefig('./figs/part1-'+max_data+'/apgar1_x_gestacao.png', dpi=200)
        plt.close()
    
        plot_pivot_table(df, 'APGAR5', 'GESTACAO', 'mean', option='sort', ylabel='Média apgar5', 
                         xlabel='Gestação', title='APGAR5 x Gestação')
        plt.savefig('./figs/part1-'+max_data+'/apgar5_x_gestacao.png', dpi=200)
        plt.close()  


else:
    print('O mês inserido não se encontra na base de dados.')

Insira o mês e o ano que deseja analisar (ex:"JANEIRO-2019") ou se deseja analisar tudo (ex:"TUDO"):  tudo


2019-01
2019-02
2019-03
2019-04
2019-05
2019-06
2019-07
2019-08
2019-09
2019-10
2019-11
2019-12
