## Para executar este notebook, você precisará ter as seguintes permissões: 
- ### CREATE CATALOG
- ### CREATE SCHEMA 
- ### CREATE TABLE

In [0]:
%pip install "databricks-sdk>=0.28.0"


[43mNote: you may need to restart the kernel using %restart_python or dbutils.library.restartPython() to use updated packages.[0m


In [0]:
dbutils.library.restartPython()

In [0]:
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.catalog import MonitorSnapshot,MonitorCronSchedule
import time

In [0]:
def set_monitoring(catalog,schema,user_email,output_catalog,cron,flg):
  df = spark.read.table(f"{catalog}.information_schema.tables").filter("table_type = 'MANAGED' OR table_type = 'EXTERNAL'").select('table_schema','table_name')
  for row in df.filter(df.table_schema == schema).collect():
    table_name = row.table_name
    w = WorkspaceClient()
    if flg == 'S':
      try:
        w.quality_monitors.delete(table_name=f"{catalog}.{schema}.{table_name}")
        print(f"Monitoramento excluido com sucesso! Tabela : {table_name}")
      except Exception as e:
        print(f"Monitoramento não excluido! Tabela : {table_name} -> Motivo:{str(e)}")
    try:
      w.quality_monitors.create(
        table_name=f"{catalog}.{schema}.{table_name}",
        assets_dir=f"/Workspace/Users/{user_email}/databricks_lakehouse_monitoring/{catalog}.{schema}.{table_name}",
        output_schema_name=f"{output_catalog}.{schema}",
        snapshot=MonitorSnapshot(),
        schedule=MonitorCronSchedule(
          quartz_cron_expression=cron, # todos os dias 9:30, para alterar a frequencia altera a cron_expression
          timezone_id="America/Sao_Paulo")
      )
      print(f"Monitoramento criado com sucesso! Tabela : {row.table_name}")
      time.sleep(15)
    except Exception as e:
      print(f"Motironado não criado! Tabela : {table_name} -> Motivo: {str(e)}")

In [0]:
def create_monitoring():
    print("Vamos definir os parâmetros para criação do monitoramento")

    catalog = input("Digite o nome do catálogo onde estão suas tabelas que serão monitoradas")
    schema = input("Digite o nome do schema onde estão suas tabelas")
    user_email = dbutils.notebook.entry_point.getDbutils().notebook
    flg = input("Você deseja deletar os monitoramentos existentes antes da criação dos novos? (S/N)")
    print("Como uma boa prática, vamos criar um catálogo exclusivo para salvar os dados do monitoramento")
    time.sleep(3)
    print("Dentro deste catálogo, teremos os schemas com o mesmo nome do schema da tabela a ser monitorada")
    time.sleep(3)
    output_catalog=input("Digite o nome do catálogo onde deseja salvar os dados do monitoramento (se não existir, ele será criado)")
   
    print("Agora, vamos criar o agendamento do monitoramento")
    day_of_month = input("Caso a execução seja mensal, digite o dia do mês(1-31) caso contrário digite ?): ")
    day_of_week = input("Para semanal, digite o dia da semana (0-6, 0=Domingo, * para diário): ")
    hour = input("Hora da execução (0-23)): ")
    minute = input("Minuto de início da execução (0-59): ")
    day_of_week_map = {
        '0': 'SUN',
        '1': 'MON',
        '2': 'TUE',
        '3': 'WED',
        '4': 'THU',
        '5': 'FRI',
        '6': 'SAT',
        '*': '*'
    }
    day_of_week = day_of_week_map.get(day_of_week, '*')
    month = '*'
    cron_expression = f"0 {minute} {hour} {day_of_month} {month} {day_of_week}"
    spark.sql(f"CREATE CATALOG IF NOT EXISTS {output_catalog}")
    spark.sql(f"CREATE SCHEMA IF NOT EXISTS {output_catalog}.{schema}")
    set_monitoring(catalog,schema,user_email,output_catalog,cron_expression,flg)

In [0]:
create_monitoring()

Vamos definir os parâmetros para criação do monitoramento


Digite o nome do catálogo onde estão suas tabelas que serão monitoradas jsf_catalog

Digite o nome do schema onde estão suas tabelas ecommerce

Você deseja deletar os monitoramentos existentes antes da criação dos novos? (S/N) S

Como uma boa prática, vamos criar um catálogo exclusivo para salvar os dados do monitoramento
Dentro deste catálogo, teremos os schemas com o mesmo nome do schema da tabela a ser monitorada


Digite o nome do catálogo onde deseja salvar os dados do monitoramento (se não existir, ele será criado) jsf_monitoring

Agora, vamos criar o agendamento do monitoramento


Caso a execução seja mensal, digite o dia do mês(1-31) caso contrário digite ?):  ?

Para semanal, digite o dia da semana (0-6, 0=Domingo, * para diário):  0

Hora da execução (0-23)):  0

Minuto de início da execução (0-59):  0

Monitoramento não excluido! Tabela : order_payments_bronze -> Motivo:Data Monitor 'jsf_catalog.ecommerce.order_payments_bronze' does not exist.
Motironado não criado! Tabela : order_payments_bronze -> Motivo: Cannot create 1 Data Monitor(s) in Metastore b169b504-4c54-49f2-bc3a-adf4b128f36d (estimated count: 1000, limit: 1000).
Monitoramento não excluido! Tabela : geolocation_bronze -> Motivo:Data Monitor 'jsf_catalog.ecommerce.geolocation_bronze' does not exist.
Motironado não criado! Tabela : geolocation_bronze -> Motivo: Cannot create 1 Data Monitor(s) in Metastore b169b504-4c54-49f2-bc3a-adf4b128f36d (estimated count: 1000, limit: 1000).
Monitoramento não excluido! Tabela : products_bronze -> Motivo:Data Monitor 'jsf_catalog.ecommerce.products_bronze' does not exist.
Motironado não criado! Tabela : products_bronze -> Motivo: Cannot create 1 Data Monitor(s) in Metastore b169b504-4c54-49f2-bc3a-adf4b128f36d (estimated count: 1000, limit: 1000).
Monitoramento não excluido! Tabela : ven