In [1]:
# ---------------------------------------------------------------------------
# Notebook de Manutenção Periódica dos Lakehouses
# Autor: José Augusto
# Data: 08 de Agosto de 2025
# Objetivo: Executar rotinas de otimização (VACUUM, OPTIMIZE, ANALYZE)
#           nas principais tabelas Silver e Gold para garantir performance e
#           controle de custos.
# ---------------------------------------------------------------------------

import logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')

# --- CONFIGURAÇÃO ---
# Adicione aqui o nome completo de todas as tabelas importantes que você quer manter.
# Inclua suas principais tabelas Silver e, principalmente, as tabelas Gold que são mais usadas.
tables_to_maintain = [
    # Exemplo da sua dimensão histórica, que é a mais importante
    "lk_departamento_pessoal.tab_gold_dim_funcionario_historico",

        # Exemplo da sua dimensão de última posição mês
    "lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao_mes",
    
    # Exemplo da sua dimensão de última posição
    "lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao",
]
# --------------------


logging.info(f"Iniciando script de manutenção para {len(tables_to_maintain)} tabelas.")
print("="*60)

# Loop principal que passa por cada tabela da lista
for table_name in tables_to_maintain:
    logging.info(f"--- Iniciando manutenção para a tabela: {table_name} ---")
    
    # --- Etapa 1: VACUUM ---
    # Limpa arquivos órfãos e mais antigos que o período de retenção (padrão é 7 dias)
    try:
        logging.info(f"Executando VACUUM em {table_name}...")
        spark.sql(f"VACUUM {table_name} RETAIN 168 HOURS")
        logging.info(f"VACUUM em {table_name} concluído com sucesso.")
    except Exception as e:
        logging.error(f"ERRO ao executar VACUUM em {table_name}: {e}")

    # --- Etapa 2: OPTIMIZE ---
    # Compacta arquivos pequenos em arquivos maiores para otimizar a velocidade de leitura
    try:
        logging.info(f"Executando OPTIMIZE em {table_name}...")
        spark.sql(f"OPTIMIZE {table_name}")
        logging.info(f"OPTIMIZE em {table_name} concluído com sucesso.")
    except Exception as e:
        logging.error(f"ERRO ao executar OPTIMIZE em {table_name}: {e}")

    # --- Etapa 3: ANALYZE TABLE ---
    # Coleta estatísticas da tabela para ajudar o motor do Spark a criar planos de consulta mais rápidos
    try:
        logging.info(f"Executando ANALYZE TABLE em {table_name}...")
        spark.sql(f"ANALYZE TABLE {table_name} COMPUTE STATISTICS FOR ALL COLUMNS")
        logging.info(f"ANALYZE TABLE em {table_name} concluído com sucesso.")
    except Exception as e:
        logging.error(f"ERRO ao executar ANALYZE TABLE em {table_name}: {e}")
        
    print(f"--- Manutenção para {table_name} finalizada. ---")
    print("-"*60)

logging.info("=== SCRIPT DE MANUTENÇÃO FINALIZADO COM SUCESSO ===")



StatementMeta(, 8a5f4f2d-31d9-4f32-9466-d545f53123ee, 3, Finished, Available, Finished)

2025-12-05 14:40:18,503 - INFO - Iniciando script de manutenção para 3 tabelas.
2025-12-05 14:40:18,504 - INFO - --- Iniciando manutenção para a tabela: lk_departamento_pessoal.tab_gold_dim_funcionario_historico ---
2025-12-05 14:40:18,504 - INFO - Executando VACUUM em lk_departamento_pessoal.tab_gold_dim_funcionario_historico...
2025-12-05 14:40:58,591 - INFO - VACUUM em lk_departamento_pessoal.tab_gold_dim_funcionario_historico concluído com sucesso.
2025-12-05 14:40:58,592 - INFO - Executando OPTIMIZE em lk_departamento_pessoal.tab_gold_dim_funcionario_historico...
2025-12-05 14:41:13,253 - INFO - VACUUM em lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao_mes concluído com sucesso.
2025-12-05 14:41:13,255 - INFO - Executando OPTIMIZE em lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao_mes...
2025-12-05 14:41:31,120 - INFO - VACUUM em lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao concluído com sucesso.
2025-12-05 14:41:31,121 - INFO - E

--- Manutenção para lk_departamento_pessoal.tab_gold_dim_funcionario_historico finalizada. ---
------------------------------------------------------------
--- Manutenção para lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao_mes finalizada. ---
------------------------------------------------------------
--- Manutenção para lk_departamento_pessoal.tab_gold_dim_funcionario_ultima_posicao finalizada. ---
------------------------------------------------------------
