# üéØ Exemplos de Outros Tipos de Triggers

Este notebook apresenta exemplos de configura√ß√£o para os outros tipos de triggers dispon√≠veis no Lakeflow Jobs.

## üìã Tipos de Triggers Dispon√≠veis

1. ‚úÖ **Time-based (Agendado)** - Executa em hor√°rios definidos
2. ‚úÖ **Continuous (Cont√≠nuo)** - Execu√ß√£o constante, sempre ativa
3. ‚úÖ **File Arrival** - Dispara quando novo arquivo √© detectado (ver notebook 05)
4. ‚úÖ **Manual** - Iniciado pelo usu√°rio
5. ‚úÖ **Table Update** - Executa quando h√° altera√ß√£o em tabela (ver notebook 06)


## ‚è∞ Trigger 1: Time-based (Agendado)

### Quando usar:
- Processamento batch di√°rio, semanal ou mensal
- Relat√≥rios agendados
- Limpeza de dados peri√≥dica
- Backup de tabelas

### Configura√ß√£o:

**Trigger Type:** `Scheduled`

**Schedule:**
- **Cron expression:** `0 0 2 * * ?` (todos os dias √†s 02:00)
- **Timezone:** `America/Sao_Paulo`

**Exemplos de Cron:**
- `0 0 2 * * ?` - Di√°rio √†s 02:00
- `0 0 0 ? * MON` - Toda segunda-feira √† meia-noite
- `0 0 0 1 * ?` - Primeiro dia de cada m√™s
- `0 */30 * * * ?` - A cada 30 minutos

### Exemplo de Job:

**Nome:** `daily_claims_ingestion`

**Schedule:** `0 0 2 * * ?` (di√°rio √†s 02:00)

**Task:** Executa `ingestion_claim.py` para reprocessar todos os dados


## üîÑ Trigger 2: Continuous (Cont√≠nuo)

### Quando usar:
- Processamento de streaming em tempo real
- Monitoramento cont√≠nuo de dados
- Pipelines que precisam estar sempre ativos
- Processamento de eventos em tempo real

### Configura√ß√£o:

**Trigger Type:** `Continuous`

**Restart on failure:**
- ‚úÖ Marque para reiniciar automaticamente em caso de falha

**Max concurrent runs:**
- Exemplo: `1` (apenas uma execu√ß√£o por vez)
- Evita sobrecarga do cluster

### Exemplo de Job:

**Nome:** `continuous_claims_streaming`

**Trigger:** Continuous

**Task:** Processa dados de streaming usando `readStream()` do Spark

**‚ö†Ô∏è Aten√ß√£o:** Jobs cont√≠nuos consomem recursos constantemente. Use apenas quando necess√°rio.


## üë§ Trigger 3: Manual

### Quando usar:
- Testes e desenvolvimento
- Execu√ß√µes sob demanda
- Reprocessamento manual de dados
- Valida√ß√£o de pipelines

### Configura√ß√£o:

**Trigger Type:** `Manual`

- N√£o requer configura√ß√£o adicional
- Job s√≥ executa quando iniciado manualmente pelo usu√°rio

### Como executar:

1. Acesse **Lakeflow Jobs** > Seu Job
2. Clique em **Run now**
3. Ou use a API do Databricks para executar programaticamente

### Exemplo de Job:

**Nome:** `manual_data_validation`

**Trigger:** Manual

**Task:** Executa valida√ß√µes e testes de qualidade de dados

**Uso:** Executar manualmente ap√≥s mudan√ßas no c√≥digo ou schema


## üìä Compara√ß√£o de Triggers

| Trigger | Uso Ideal | Frequ√™ncia | Recursos |
|---------|-----------|------------|----------|
| **Time-based** | Processamento batch agendado | Peri√≥dico (hor√°rio fixo) | Baixo (executa apenas no hor√°rio) |
| **Continuous** | Streaming em tempo real | Constante | Alto (sempre ativo) |
| **File Arrival** | Ingest√£o quando arquivo chega | Event-driven | M√©dio (s√≥ quando h√° arquivo) |
| **Table Update** | Pipeline reativo a mudan√ßas | Event-driven | M√©dio (s√≥ quando h√° mudan√ßa) |
| **Manual** | Testes e execu√ß√µes sob demanda | Sob demanda | Baixo (apenas quando executado) |

## üéØ Recomenda√ß√µes por Cen√°rio

### Ingest√£o de Arquivos CSV
- ‚úÖ **File Arrival** - Ideal para processar arquivos assim que chegam

### Transforma√ß√£o Bronze ‚Üí Silver
- ‚úÖ **Table Update** - Ideal para manter dados silver sincronizados

### Relat√≥rios Di√°rios
- ‚úÖ **Time-based** - Executa em hor√°rio fixo todos os dias

### Streaming de Dados
- ‚úÖ **Continuous** - Processa dados em tempo real continuamente

### Desenvolvimento e Testes
- ‚úÖ **Manual** - Permite controle total sobre quando executar


## üîó Combinando M√∫ltiplos Triggers

Voc√™ pode configurar **m√∫ltiplos triggers** para o mesmo job:

### Exemplo: Job com 2 Triggers

**Job:** `flexible_claims_processing`

**Trigger 1:** File Arrival
- Monitora: `/Volumes/.../claims*.csv`
- Processa automaticamente quando arquivo chega

**Trigger 2:** Time-based
- Schedule: `0 0 1 * * ?` (di√°rio √†s 01:00)
- Reprocessa todos os dados diariamente

**Resultado:** 
- Processamento autom√°tico quando arquivo chega (File Arrival)
- Reprocessamento completo di√°rio (Time-based)
- Garante que dados estejam sempre atualizados


In [None]:
# Exemplo: Criar job programaticamente usando Databricks API
# Este c√≥digo demonstra como criar um job com trigger via API

import json

# Configura√ß√£o do job com trigger Time-based
job_config = {
    "name": "daily_claims_ingestion",
    "tasks": [
        {
            "task_key": "ingest_claims",
            "python_wheel_task": {
                "package_name": "ingestion_claim",
                "entry_point": "main"
            },
            "libraries": [
                {
                    "pypi": {
                        "package": "pyspark"
                    }
                }
            ],
            "python_wheel_task": {
                "parameters": [
                    "--catalog", "smart_claims_dev",
                    "--schema", "01_bronze"
                ]
            }
        }
    ],
    "schedule": {
        "quartz_cron_expression": "0 0 2 * * ?",
        "timezone_id": "America/Sao_Paulo",
        "pause_status": "UNPAUSED"
    },
    "max_concurrent_runs": 1,
    "timeout_seconds": 3600
}

print("üìã Exemplo de configura√ß√£o de job com trigger Time-based:")
print(json.dumps(job_config, indent=2))

# Para criar o job, use a API do Databricks:
# POST /api/2.1/jobs/create
# Headers: Authorization: Bearer <token>
# Body: job_config (acima)
