In [8]:
# Importando bibliotecas
import os
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Configurações iniciais para os gráficos
sns.set_theme()
plt.rcParams['figure.figsize'] = [15, 5]

def plot_and_save(df, value, index, func, ylabel, xlabel, folder_name, file_name, option=None):
    # Cria uma tabela dinâmica
    pivot_table = pd.pivot_table(df, values=value, index=index, aggfunc=func)
    
    # Ordena a tabela se a opção for 'sort'
    if option == 'sort':
        pivot_table.sort_values(value, inplace=True)
    # Desempilha a tabela se a opção for 'unstack'
    elif option == 'unstack':
        pivot_table = pivot_table.unstack()
    
    # Plota o gráfico e salva a figura
    ax = pivot_table.plot()
    ax.set(ylabel=ylabel, xlabel=xlabel)
    plt.savefig(f'./output/figs/{folder_name}/{file_name}.png')
    plt.close()

# Carrega os dataframes dos meses
data_frames = {m: pd.read_csv(f'SINASC_RO_2019_{m}.csv') for m in ['MAR', 'ABR', 'MAI', 'JUN', 'DEZ']}

# Itera sobre os dataframes
for mes, df in data_frames.items():
    # Obtém a data máxima para criar a pasta de saída
    max_data = df.DTNASC.max()[:7]
    os.makedirs(f'./output/figs/{max_data}', exist_ok=True)
    
    # Lista de análises a serem realizadas
    analyses = [
        ('IDADEMAE', 'DTNASC', 'count', 'Quantidade de nascimentos', 'Data de nascimento', None),
        ('IDADEMAE', ['DTNASC', 'SEXO'], 'mean', 'Média da idade das mães', 'Data de nascimento', 'unstack'),
        ('PESO', ['DTNASC', 'SEXO'], 'mean', 'Média do peso dos bebês', 'Data de nascimento', 'unstack'),
        ('APGAR1', 'ESCMAE', 'median', 'Mediana do APGAR1', 'Escolaridade', 'sort'),
        ('APGAR1', 'GESTACAO', 'mean', 'Média do APGAR1', 'Gestação', 'sort'),
        ('APGAR5', 'GESTACAO', 'mean', 'Média do APGAR5', 'Gestação', 'sort')]
    
    # Itera sobre as análises
    for value, index, func, ylabel, xlabel, option in analyses:
        plot_and_save(df, value, index, func, ylabel, xlabel, max_data, ylabel.replace(' ', '_'), option)
    
    # Imprime informações sobre as datas e a pasta criada
    print(f'Data inicial: {df.DTNASC.min()}, Data final: {df.DTNASC.max()}')
    print(f'Nome da pasta: {max_data}\n')

Data inicial: 2019-01-01, Data final: 2019-03-31
Nome da pasta: 2019-03

Data inicial: 2019-01-01, Data final: 2019-04-30
Nome da pasta: 2019-04

Data inicial: 2019-01-01, Data final: 2019-05-31
Nome da pasta: 2019-05

Data inicial: 2019-01-01, Data final: 2019-06-30
Nome da pasta: 2019-06

Data inicial: 2019-01-01, Data final: 2019-12-31
Nome da pasta: 2019-12

