<a href="https://colab.research.google.com/github/AlexandreOrmandes/sinasc_14/blob/main/gerar_analise.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
import os
import matplotlib.pyplot as plt
from datetime import datetime

# Dicionário para mapear abreviaturas de meses para números
month_map = {
    'JAN': '01', 'FEV': '02', 'MAR': '03', 'ABR': '04',
    'MAI': '05', 'JUN': '06', 'JUL': '07', 'AGO': '08',
    'SET': '09', 'OUT': '10', 'NOV': '11', 'DEZ': '12'
}

def create_folder(folder_name):
    """Cria uma pasta se ela ainda não existir."""
    if not os.path.exists(folder_name):
        os.makedirs(folder_name)

def plot_histogram(df, column, folder_name):
    """Gera um histograma para uma coluna específica de um DataFrame e salva na pasta especificada."""
    plt.hist(df[column], bins=20, edgecolor='black')
    plt.title(f'Histograma de {column}')
    plt.xlabel(column)
    plt.ylabel('Frequência')
    plt.savefig(f"{folder_name}/{column}_histogram.png")
    plt.close()

def plot_line_chart(df, column, folder_name):
    """Gera um gráfico de linha para uma coluna específica de um DataFrame e salva na pasta especificada."""
    df[column].value_counts().sort_index().plot.line()
    plt.title(f'Tendência de {column}')
    plt.xlabel(column)
    plt.ylabel('Frequência')
    plt.savefig(f"{folder_name}/{column}_line_chart.png")
    plt.close()

def main(months):
    """Função principal para gerar pastas e gráficos."""
    for month in months:
        month_number = month_map.get(month.upper(), None)
        if month_number is None:
            print(f"Mês {month} inválido.")
            continue

        folder_name = f"2019-{month_number}"
        create_folder(folder_name)

        file_path = f'/mnt/data/SINASC_RO_2019_{month}.csv'
        if not os.path.exists(file_path):
            print(f"Arquivo para o mês {month} não encontrado.")
            continue

        df = pd.read_csv(file_path)

        # Gere histograma de peso
        plot_histogram(df, 'PESO', folder_name)

        # Converte a coluna de data para o formato datetime
        df['DTNASC'] = pd.to_datetime(df['DTNASC'])

        # Gere gráfico de linha mostrando a tendência do número de nascimentos
        df['Day'] = df['DTNASC'].dt.day
        plot_line_chart(df, 'Day', folder_name)

# Simulando a chamada da função main como se fossem argumentos passados na linha de comando
main(['MAR', 'ABR', 'MAI', 'JUN', 'JUL'])
