<img src="https://raw.githubusercontent.com/rhatiro/Curso_EBAC-Profissao_Cientista_de_Dados/main/ebac-course-utils/media/logo/newebac_logo_black_half.png" alt="ebac-logo">

---

# **Profissão: Cientista de Dados**
### **Módulo 14** | Scripting | Exercício 1

Aluno [Marcello Lassalla](https://www.linkedin.com/in/marcello-lassalla-a146b8225/)<br>
Data: 2 de abril de 2023.

---

In [9]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

import os

sns.set_theme()

def plot_pivot_table(df: pd.DataFrame,
                     value: str,
                     index: str,
                     func: str,
                     ylabel: str,
                     xlabel: str,
                     opcao: str='nenhuma'
                    ) -> None:
    if opcao == 'nenhuma':
        pd.pivot_table(data=df,
                       values=value,
                       index=index,
                       aggfunc=func
                      ).plot(figsize=[15, 5])
    elif opcao == 'sort':
        pd.pivot_table(data=df,
                       values=value,
                       index=index,
                       aggfunc=func
                      ).sort_values(value).plot(figsize=[15, 5])
    elif opcao == 'unstack':
        pd.pivot_table(data=df,
                       values=value,
                       index=index,
                       aggfunc=func
                      ).unstack().plot(figsize=[15, 5])
    plt.ylabel(ylabel)
    plt.xlabel(xlabel)
    return None


meses = ['MAR', 'ABR', 'MAI', 'JUN', 'DEZ']

for mes in meses:
    sinasc = pd.read_csv('SINASC_RO_2019_' +mes+ '.csv')

    max_data = sinasc.DTNASC.max()[:7]
    os.makedirs('./output/figs/'+max_data, exist_ok=True)

    plot_pivot_table(df=sinasc,
                     value='IDADEMAE',
                     index='DTNASC',
                     func='count',
                     ylabel='Quantidade de nascimentos',
                     xlabel='Data de nascimento')
    plt.savefig('./output/figs/'+max_data+'/Quantidade de nascimentos.png')
    plt.close()

    plot_pivot_table(df=sinasc,
                     value='IDADEMAE',
                     index=['DTNASC', 'SEXO'],
                     func='mean',
                     ylabel='Média da idade das mães',
                     xlabel='Data de nascimento',
                     opcao='unstack')
    plt.savefig('./output/figs/'+max_data+'/Média da idade das mães por sexo.png')
    plt.close()

    plot_pivot_table(df=sinasc,
                     value='PESO',
                     index=['DTNASC', 'SEXO'],
                     func='mean',
                     ylabel='Média do peso dos bebês',
                     xlabel='Data de nascimento',
                     opcao='unstack')
    plt.savefig('./output/figs/'+max_data+'/Média do peso dos bebês por sexo.png')
    plt.close()

    plot_pivot_table(df=sinasc,
                     value='APGAR1',
                     index='ESCMAE',
                     func='median',
                     ylabel='Mediana do APGAR1',
                     xlabel='Escolaridade',
                     opcao='sort')
    plt.savefig('./output/figs/'+max_data+'/Mediana do APGAR1 por escolaridade das mães.png')
    plt.close()

    plot_pivot_table(df=sinasc,
                     value='APGAR1',
                     index='GESTACAO',
                     func='mean',
                     ylabel='Média do APGAR1',
                     xlabel='Gestação',
                     opcao='sort')
    plt.savefig('./output/figs/'+max_data+'/Média do APGAR1 por gestação.png')
    plt.close()

    plot_pivot_table(df=sinasc,
                     value='APGAR5',
                     index='GESTACAO',
                     func='mean',
                     ylabel='Média do APGAR5',
                     xlabel='Gestação',
                     opcao='sort')
    plt.savefig('./output/figs/'+max_data+'/Média do APGAR5 por gestação.png')
    plt.close()

    print('Data inicial:', sinasc.DTNASC.min(),
          'Data final:', sinasc.DTNASC.max())
    print('Nome da pasta:', max_data, '\n')


Data inicial: 2019-01-01 Data final: 2019-03-31
Nome da pasta: 2019-03 

Data inicial: 2019-01-01 Data final: 2019-04-30
Nome da pasta: 2019-04 

Data inicial: 2019-01-01 Data final: 2019-05-31
Nome da pasta: 2019-05 

Data inicial: 2019-01-01 Data final: 2019-06-30
Nome da pasta: 2019-06 

Data inicial: 2019-01-01 Data final: 2019-12-31
Nome da pasta: 2019-12 



In [10]:
import shutil
from google.colab import files

# Caminho da pasta que você deseja comprimir
pasta_origem = './output/figs/'
# Nome do arquivo zip que será criado
arquivo_zip = 'figs.zip'

# Cria o arquivo zip
shutil.make_archive(arquivo_zip.replace('.zip', ''), 'zip', pasta_origem)

# Faz o download do arquivo zip
files.download(arquivo_zip)


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

---

Uma maneira de tornar o processo de geração de gráficos mais automatizado e eficiente é criar um script em Python que possa ser executado automaticamente via linha de comando, de acordo com a frequência desejada (mensal, semanal ou diária). Isso reduziria a necessidade de intervenção manual. Além disso, seria possível gerar gráficos para um mês específico solicitado, bem como para o período completo desde o início do ano até o mês atual. Conforme necessário, o código poderia ser aprimorado para atender a demandas futuras, tornando o processo ainda mais eficiente e automatizado.

---