# Tarefa 02
- Gerar análises com a base de dados de acordo com a abreviação do mês selecionado no prompt

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import os
import sys

def plota_pivot_table(df, value, index, func, ylabel, xlabel, opcao='nada'):
    if opcao == 'nada':
        pd.pivot_table(df, values=value, index=index,
                       aggfunc=func).plot(figsize=[15, 5])
    elif opcao == 'sort':
        pd.pivot_table(df, values=value, index=index,
                       aggfunc=func).sort_values(value).plot(figsize=[15, 5])
    elif opcao == 'unstack':
        pd.pivot_table(df, values=value, index=index,
                       aggfunc=func).unstack().plot(figsize=[15, 5])
    plt.ylabel(ylabel)
    plt.xlabel(xlabel)
    return None

def get_month_number(month_abbr):
    month_numbers = {
        'JAN': 1, 'FEV': 2, 'MAR': 3, 'ABR': 4,
        'MAI': 5, 'JUN': 6, 'JUL': 7, 'AGO': 8,
        'SET': 9, 'OUT': 10, 'NOV': 11, 'DEZ': 12
    }
    return month_numbers.get(month_abbr.upper(), None)

# Carregar a base de dados completa
sinasc = pd.read_csv('./input/SINASC_RO_2019.csv')

# Adicionar coluna MESNASC
sinasc['MESNASC'] = pd.to_datetime(sinasc['DTNASC']).dt.month

# Capturar os argumentos da linha de comando
meses_abreviados = sys.argv[1:]

# Loop para gerar análises para cada mês especificado
for mes_abbr in meses_abreviados:
    mesnasc = get_month_number(mes_abbr)
    if mesnasc is None:
        print(f"Abreviação de mês inválida: {mes_abbr}")
        continue

    # Filtrar os dados para o mês especificado
    sinasc_mes = sinasc[sinasc['MESNASC'] == mesnasc]

    # Obter a data máxima para o diretório de saída
    max_data = sinasc_mes['DTNASC'].max()[:7]
    os.makedirs(f'./output/figs/{max_data}', exist_ok=True)

    plota_pivot_table(sinasc_mes, 'IDADEMAE', 'DTNASC', 'count', 'quantidade de nascimento', 'data de nascimento')
    plt.savefig(f'./output/figs/{max_data}/quantidade de nascimento_{mes_abbr}.png')

    plota_pivot_table(sinasc_mes, 'IDADEMAE', ['DTNASC', 'SEXO'], 'mean', 'media idade mae', 'data de nascimento', 'unstack')
    plt.savefig(f'./output/figs/{max_data}/media idade mae por sexo_{mes_abbr}.png')

    plota_pivot_table(sinasc_mes, 'PESO', ['DTNASC', 'SEXO'], 'mean', 'media peso bebe', 'data de nascimento', 'unstack')
    plt.savefig(f'./output/figs/{max_data}/media peso bebe por sexo_{mes_abbr}.png')

    plota_pivot_table(sinasc_mes, 'PESO', 'ESCMAE', 'median', 'peso medio', 'escolaridade mae', 'sort')
    plt.savefig(f'./output/figs/{max_data}/media peso por escolaridade mae_{mes_abbr}.png')

    plota_pivot_table(sinasc_mes, 'APGAR1', 'GESTACAO', 'mean', 'apgar1 medio', 'gestacao', 'sort')
    plt.savefig(f'./output/figs/{max_data}/media apgar1 por gestacao_{mes_abbr}.png')

    plota_pivot_table(sinasc_mes, 'APGAR5', 'GESTACAO', 'mean', 'apgar5 medio', 'gestacao', 'sort')
    plt.savefig(f'./output/figs/{max_data}/media apgar5 por gestacao_{mes_abbr}.png')

    print(f"Gráficos para o mês {mes_abbr} foram gerados na pasta {max_data}.")

Abreviação de mês inválida: --f=c:\Users\BrunodaCunhaPeixoto\AppData\Roaming\jupyter\runtime\kernel-v2-19449La33Z0N5XOf.json
