# Planejamento do ETL - Logging

## 1 - Requisitos Mínimos do ETL

1. Desenho da arquitetura do ETL
2. Orquestração dos Jobs
3. Arquivos de Log
4. Documentação ( Tabela de Agendamentos )

## 2 - Desenho da arquitetura do ETL

1. Fonte de Dados, arquivos intermediários e saída final.
2. Jobs ( origem e destino )
3. Dependências entre os Jobs.

## 3 - Arquivos de Log

1. Ferramenta para gerar e armazenar os Logs.
2. Leitura e escrita dos Jobs.

### 3.1 - O que é Logging?

Logging é uma maneira de rastrear eventos que acontecem quando algum software executa.<br>
O Evento é descrito por uma mensagem descritiva que pode opcionalmente conter o dado de uma
variável.<br>
Eventos também tem um peso que o desenvolvedor atribui para o evento. O peso pode também
ser chamada de níveis ou severidade.<br>

### 3.2 - Os níveis de severidade.

<b>DEBUG:</b> Informação detalhada, tipicamente de interesse apenas quando diagnosticando problemas.<br><br>
<b>INFO:</b> Confirmação de que as coisas estão funcionando como esperado.<br><br>
<b>WARNING:</b> Uma indicação que algo esperado aconteceu, ou um indicativo que algum problema
em futuro próximo.<br><br>
<b>ERROR:</b> Por conta de um problama mais grave, o software não conseguiu executar alguma
função.<br><br>
<b>CRITICAL:</b> Um erro grave, indicando que o programa pode não conseguir continuar rodando

### 3.3 - Exemplos

In [1]:
import os
import logging

In [None]:
if not os.path.exists( 'Logs' ):
    os.makedirs( 'Logs' )
        
logging.basicConfig(
    filename='Logs/webscraping_hm.txt',
    format='%(asctime)s - %(levelname)s - %(name)s - %(message)s',
    datefmt='%Y-%m-%d %H:%M:%S',
    level=logging.DEBUG )

logger = logging.getLogger( 'webscraping_hm' )

In [None]:
logger.debug( 'O valor da variavel x eh de %s', 10 )
logger.info( 'Essa eh a interacao de numero' )
logger.warning( 'Esse ponto do codigo deve ser melhorado' )

## 4 - Orquestração dos Jobs

1. Ferramenta para “rodar” o job automaticamente.
2. Dependências entre os Jobs.
3. Rodar novamente em caso de falha.

## 5 - Documentação

1. Tabela de agendamento dos Jobs e suas dependência.

## 6 - O Cron

O Cron é um agendador de tarefas, baseado em tempo, usado em sistemas operacionais de base
Unix.

### 6.1 - O funcionamento do Cron

minute hour day_of_month month day_of_week COMMAND

In [4]:
# 0 8 * * * python webscraping_hm.py
# 30 10 * * * python webscraping_hm.py
# 30 10,22 * * * python webscraping_hm.py
# 0 8-12 * * * python webscraping_hm.py
# * * * * * mkdir /Users/meigarom.lopes/repos/python-ds-ao-dev/modulo09_design_ETL/apagar

### 6.2 - Os arquivos de Log

/var/mail/<username'><br>
/var/mail/meigarom.lopes

### 6.3 - Desvantagem do Cron

1. Não há sincronia das tarefas.
2. O computador precisa estar ligado

## 7 - Documentação

In [3]:
#* * * * * python /Users/meigarom.lopes/repos/python-ds-ao-dev/modulo09_design_ETL/example_crontab.py

1. Tabela de agendamento dos Jobs e suas dependência.