In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline


In [37]:
# Carregar os quatro arquivos CSV
df_mar = pd.read_csv('SINASC_RO_2019_MAR.csv')
df_abr = pd.read_csv('SINASC_RO_2019_ABR.csv')
df_mai = pd.read_csv('SINASC_RO_2019_MAI.csv')
df_jun = pd.read_csv('SINASC_RO_2019_JUN.csv')

# Concatenar os DataFrames
df_total = pd.concat([df_mar, df_abr, df_mai, df_jun], ignore_index=True)

# Salvar o DataFrame resultante em um novo arquivo CSV
df_total.to_csv('dados_completos.csv', index=False)


In [39]:
dados_completos = pd.read_csv('./dados_completos.csv')
dados_completos

Unnamed: 0,IDADEMAE,SEXO,APGAR1,APGAR5,PESO,CONSULTAS,DTNASC,GESTACAO,GRAVIDEZ,ESCMAE,IDADEPAI
0,19,Masculino,9.0,10.0,3685,4,2019-02-19,37 a 41 semanas,Única,8 a 11 anos,26.0
1,29,Feminino,8.0,9.0,3055,4,2019-02-21,37 a 41 semanas,Única,8 a 11 anos,24.0
2,37,Feminino,8.0,10.0,3460,4,2019-02-25,37 a 41 semanas,Única,8 a 11 anos,32.0
3,30,Feminino,9.0,10.0,2982,3,2019-03-20,37 a 41 semanas,Única,12 anos ou mais,24.0
4,30,Feminino,8.0,10.0,3310,4,2019-03-23,37 a 41 semanas,Única,8 a 11 anos,27.0
...,...,...,...,...,...,...,...,...,...,...,...
41396,27,Feminino,9.0,10.0,3375,4,2019-05-29,37 a 41 semanas,Única,8 a 11 anos,
41397,26,Feminino,8.0,9.0,2420,3,2019-05-15,37 a 41 semanas,Única,8 a 11 anos,
41398,16,Feminino,8.0,9.0,3045,4,2019-02-02,37 a 41 semanas,Única,8 a 11 anos,24.0
41399,30,Feminino,8.0,9.0,3050,4,2019-06-18,37 a 41 semanas,Única,8 a 11 anos,28.0


In [47]:
import os
from datetime import datetime

# Dicionário de nomes abreviados dos meses
meses_abreviados = {
    'JAN': '01',
    'FEV': '02',
    'MAR': '03',
    'ABR': '04',
    'MAI': '05',
    'JUN': '06',
    'JUL': '07',
    'AGO': '08',
    'SET': '09',
    'OUT': '10',
    'NOV': '11',
    'DEZ': '12'
}

# Função para gerar análise para um determinado mês
def gerar_analise_por_mes(mes, df):
    # Filtrar os dados para o mês especificado
    df_mes = df[pd.to_datetime(df['DTNASC']).dt.strftime('%Y-%m') == mes]

    # Criar uma pasta para o mês se ela não existir
    if not os.path.exists(mes):
        os.makedirs(mes)

    # Gerar gráfico para o peso dos bebês
    plt.figure(figsize=(10, 6))
    plt.hist(df_mes['PESO'], bins=20, color='skyblue', edgecolor='black')
    plt.title('Distribuição do Peso dos Bebês - ' + mes)
    plt.xlabel('Peso (g)')
    plt.ylabel('Frequência')
    plt.savefig(os.path.join(mes, 'peso_bebe_' + mes + '.png'))
    plt.close()

    # Gerar gráfico para a idade da mãe
    plt.figure(figsize=(10, 6))
    plt.hist(df_mes['IDADEMAE'], bins=20, color='salmon', edgecolor='black')
    plt.title('Distribuição da Idade das Mães - ' + mes)
    plt.xlabel('Idade')
    plt.ylabel('Frequência')
    plt.savefig(os.path.join(mes, 'idade_mae_' + mes + '.png'))
    plt.close()

# Verificação dos argumentos fornecidos
if 'ipykernel' in sys.argv[0]:
    args = [datetime.now().strftime('%Y-') + meses_abreviados[m] for m in ['MAR', 'ABR', 'MAI', 'JUN', 'JUL']]  # Modifique aqui com os meses desejados
else:
    args = sys.argv[1:]

if len(args) < 1:
    print("Uso: python gerar_analise.py <lista de meses>")
    sys.exit(1)

# Ler os dados completos
try:
    dados_completos = pd.read_csv('./dados_completos.csv', parse_dates=['DTNASC'])
except FileNotFoundError:
    print("Arquivo 'dados_completos.csv' não encontrado.")
    sys.exit(1)

# Iterar sobre os meses fornecidos como argumentos
for mes in args:
    gerar_analise_por_mes(mes, dados_completos)
    print(f"Análise para o mês de {mes} gerada com sucesso.")

Análise para o mês de 2024-03 gerada com sucesso.
Análise para o mês de 2024-04 gerada com sucesso.
Análise para o mês de 2024-05 gerada com sucesso.
Análise para o mês de 2024-06 gerada com sucesso.
Análise para o mês de 2024-07 gerada com sucesso.
