# Tutorial de tabelas de sistema do Databricks usando demonstração do Databricks

Source: [Databricks Demos Website](https://www.databricks.com/resources/demos/tutorials/governance/system-tables?itm_data=demo_center)

In [0]:
%pip install dbdemos

In [0]:
import dbdemos
dbdemos.install('uc-04-system-tables')

`Lembre-se de que a execução de dbdemos terminará em uma série de implantações na plataforma, desde o cluster Databricks SQL até DLT Pipelines, dependendo da demonstração que está sendo instalada!`

# Tabelas do sistema

### Tabela do sistema de log de auditoria:

###### Descrição: Inclui registros para todos os eventos de auditoria em sua conta do Databricks. Para obter uma lista de eventos de auditoria disponíveis, consulte Referência do log de auditoria.
###### Localização: `system.access.audit`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `version` | string | Versão do esquema do log de auditoria | 2.0 |
| `event_time` | timestamp | Timestamp | 2023-01-01T01:01:01.123 |
| `event_date` | date | Data do calendário em que a ação ocorreu | 01/01/2023 |
| `workspace_id` | long | ID do espaço de trabalho | 1234567890123456 |
| `source_ip_address` | string | Endereço IP de origem do pedido | 10.30.0.242 |
| `user_agent` | string | Originação do pedido | Apache-HttpClient/4.5.13 (Java/1.8.0_345) |
| `session_id` | string | ID da sessão de onde veio a solicitação | 123456789 |
| `user_identity` | string | Identidade do utilizador que inicia o pedido | {"email": "user@domain.com", "subjectName": null} |
| `service_name` | string | Nome do serviço iniciando solicitação | unidadeCatálogo |
| `action_name` | string | Categoria do evento capturado no registo de auditoria | obterTabela |
| `request_id` | string | ID do pedido | ServiçoPrincipal-4529754264 |
| `request_params` | map | Mapa de valores-chave contendo todos os parâmetros da solicitação. Depende do tipo de solicitação | [["nome_completo_arg", "user.chat.messages"], ["workspace_id", "123456789"], ["metastore_id", "123456789"]] |
| `response` | struct | Estrutura dos valores de retorno da resposta | {"statusCode": 200, "errorMessage": nulo, "resultado": nulo} |
| `audit_level` | string | Evento no nível do espaço de trabalho ou da conta | CONTA_LEVEL |
| `account_id` | string | ID da conta | 23e22ba4-87b9-4cc2-9770-d10b894bxx |
| `event_id` | string | ID do evento | 34ac703c772f3549dcc8671f654950f0 |

### Tabela do sistema de linhagem:

###### Descrição: Inclui um registro para cada evento de leitura ou gravação em uma tabela ou caminho do Catálogo do Unity e também um registro para cada evento de leitura ou gravação em uma coluna do Catálogo do Unity (mas não inclui eventos que não possuem uma origem ).
###### Localização: `system.access.table_lineage` e `system.access.column_lineage`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `account_id` | string | O ID da conta do Databricks. | 7af234db-66d7-4db3-bbf0-956098224879 |
| `metastore_id` | string | O ID do metastore do Catálogo do Unity. | 5a31ba44-bbf4-4174-bf33-e1fa078e6765 |
| `workspace_ido` | string | O ID do espaço de trabalho | 123456789012345 |
| `entity_type` | string | O tipo de entidade da qual a transação de linhagem foi capturada. O valor é NOTEBOOK, JOB, PIPELINE, DBSQL_DASHBOARD, DBSQL_QUERY ou NULL. | NOTEBOOK |
| `entity_id` | string | O ID da entidade da qual a transação de linhagem foi capturada. Seentity_type for NULL,entity_id será NULL. Notebook: 23098402394234 <br /> Job: 23098402394234  <br /> Databricks SQL query: e9cd8a31-de2f-4206-adfa-4f6605d68d88  <br /> Databricks SQL dashboard: e9cd8a31-de2f-4206-adfa-4f6605d68d88  <br /> Pipeline: e9cd8a31-de2f-4206-adfa-4f6605d68d88 |
| `entity_run_id` | string | ID para descrever a execução exclusiva da entidade ou NULL. Isso difere para cada tipo de entidade: <br /> Notebook: command_run_id <br /> Trabalho: job_run_id <br /> Consulta SQL do Databricks: query_run_id <br /> Painel SQL do Databricks: query_run_id <br /> Pipeline: pipeline_update_id <br /> Seentity_type for NULL,entity_run_id será NULL. | Notebook: 23098402394234  <br /> Job: 23098402394234  <br /> Databricks SQL query: e9cd8a31-de2f-4206-adfa-4f6605d68d88  <br /> Databricks SQL dashboard: e9cd8a31-de2f-4206-adfa-4f6605d68d88  <br /> Pipeline: e9cd8a31-de2f-4206-adfa-4f6605d68d88
| `source_table_full_name` | string | Nome de três partes para identificar a tabela de origem. | catalog.schema.table |
| `source_table_catalog` | string | O catálogo da tabela de origem. | catalog |
| `source_table_schema` | string | O esquema da tabela de origem. | catalog.schema |
| `source_table_name` | string | O nome da tabela de origem. | table |
| `caminho_fonte` | string | Localização no armazenamento em nuvem da tabela de origem ou o caminho, se estiver lendo diretamente do armazenamento em nuvem. | s3://meubucket/tabela1 |
| `tipo_fonte` | string | O tipo da fonte. O valor é TABLE, PATH, VIEW ou STREAMING_TABLE. | TABLE |
| `source_path` | string | O nome da coluna de origem. | date |
| `target_table_full_name` | string | Nome de três partes para identificar a tabela de destino. | catalog.schema.table |
| `target_table_catalog` | string | O catálogo da tabela de destino. | catalog |
| `target_table_schema` | string | O esquema da tabela de destino. | catalog.schema |
| `target_table_name` | string | O nome da tabela de destino. | table |
| `target_path` | string | Localização no armazenamento em nuvem da tabela de destino. | s3://meubucket/tabela1 |
| `target_type` | string | O tipo do destino. O valor é TABLE, PATH, VIEW ou STREAMING TABLE. | TABELA |
| `target_column_name` | string | O nome da coluna de destino. | date |
| `created_by` | string | O usuário que gerou esta linhagem. Pode ser um nome de usuário do Databricks, uma ID principal de serviço do Databricks, “Usuário do Sistema” ou NULL se as informações do usuário não puderem ser capturadas. | crampton.rods@email.com |
| `event_time` | timestamp | The timestamp when the lineage was generated. | 2023-06-20T19:47:21.194+0000 |
| `event_date` | date | A data em que a linhagem foi gerada. Esta é uma coluna particionada. | 2023/06/20 |

### Tabela de Sistema de Uso Faturável:

###### Descrição: Inclui registros de todo o uso faturável em sua conta. Cada registro de uso é um agregado por hora do uso faturável de um recurso.
###### Localização: `system.billing.usage`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `record_id` | string | ID exclusivo para este registro | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
| `account_id` | string | ID da conta para a qual este relatório foi gerado | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
| `workspace_id` | string | ID do espaço de trabalho ao qual esse uso foi associado | 1234567890123456 |
| `sku_name` | string | Nome do SKU | STANDARD_ALL_PURPOSE_COMPUTE |
| `cloud` | string | Nuvem para a qual esse uso é relevante. Os valores possíveis são AWS, AZURE e GCP. | AWS <br /> AZURE <br />GCP |
| `usage_start_time` | timestamp  | A hora de início relevante para este registo de utilização | 09/01/2023 10:00:00.000 |
| `usage_end_time` | timestamp  | A hora final relevante para este registo de utilização | 09/01/2023 11:00:00.000 |
| `usage_date` | date | Data do registro de utilização, este campo pode ser utilizado para agregação mais rápida por data | 01/01/2023 |
| `custom_tags` | map | Tags aplicadas pelos usuários a este uso | { “ambiente”: “produção” } |
| `usage_unit` | string | Unidade em que esse uso é medido. Os valores possíveis incluem DBUs. | DBU |
| `usage_unit` | decimal | Número de unidades consumidas para este registro. | 259.2958 |
| `usage_metadata` | estruct | Metadados fornecidos pelo sistema sobre o uso, incluindo IDs para recursos de computação e trabalhos (se aplicável). | {cluster_id: 12345; instance_pool_id: nulo; warehouse_id: nulo; id_trabalho: nulo; node_type: nulo} |

### Tabela do sistema de preços:

###### Descrição: um registro histórico de preços de SKU. Um registro é adicionado sempre que há uma alteração no preço do SKU.
###### Localização: `system.billing.list_prices`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `price_start_time` | timestamp | O momento em que este preço entrou em vigor | 2023-01-01T09:59:59.999Z |
| `price_end_time` | timestamp | O momento em que esse preço deixou de vigorar | 2023-01-01T09:59:59.999Z |
| `account_id` | string | ID da conta para a qual este relatório foi gerado | 1234567890123456 |
| `sku_name` | string | Nome do SKU | STANDARD_ALL_PURPOSE_COMPUTE |
| `cloud` | string | Nuvem para a qual esse uso é relevante. Os valores possíveis são AWS, AZURE e GCP. | AWS <br /> AZURE <br />GCP |
| `currency_code` | string | A moeda em que este preço é expresso | USD |
| `usage_unit` | string | A unidade de medida que é monetizada. | DBU |
| `pricing` | estruct | Um campo de dados estruturados que inclui informações de preços de acordo com o preço de tabela publicado. O padrão da chave sempre retornará um preço único que pode ser usado para estimativas simples. Alguns modelos de preços também podem incluir chaves adicionais que fornecem mais detalhes. | {padrão: $ 0,10} |

### Tabela do sistema de clusters:

###### Descrição: uma tabela de dimensões de alteração lenta que contém o histórico completo de configurações de cluster ao longo do tempo para qualquer cluster.
###### Localização: `system.compute.clusters`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `id_da_conta` | string | ID da conta onde este cluster foi criado. | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
| `id do espaço de trabalho` | string | ID do workspace onde este cluster foi criado. | 1234567890123456 |
| `cluster_id` | string | ID do cluster ao qual esse registro está associado. | 0000-123456-xxxxxxx |
| `nome_cluster` | string | Nome definido pelo usuário para o cluster. | Meu cluster |
| `propriedade_por` | string | Nome de usuário do proprietário do cluster. O padrão é o criador do cluster, mas pode ser alterado por meio da API Clusters. | sample_user@email.com |
| `criar_hora` | timestamp | Data/hora da alteração nesta definição de computação. | 09/01/2023 11:00:00.000 |
| `delete_time` | timestamp | Data/hora de quando o cluster foi excluído. O valor será nulo se o cluster não for excluído. | 09/01/2023 11:00:00.000 |
| `driver_node_type` | string | Nome do tipo de nó do driver. Corresponde ao nome do tipo de instância do provedor de nuvem. | i3.xbigint |
| `worker_node_type` | string | Nome do tipo de nó de trabalho. Corresponde ao nome do tipo de instância do provedor de nuvem. | i3.xbigint |
| `contagem_de_trabalhadores` | bigint | Número de trabalhadores. Definido apenas para clusters de tamanho fixo. | 4 |
| `min_autoscale_workers` | bigint | O número mínimo definido de trabalhadores. Este campo é válido somente para clusters de escalonamento automático. | 1 |
| `max_autoscale_workers` | bigint | O número máximo definido de trabalhadores. Este campo é válido somente para clusters de escalonamento automático. | 1 |
| `auto_termination_minutos` | bigint | A duração da terminação automática configurada. | 120 |
| `enable_elastic_disk` | booleano | Status de ativação do disco de escalonamento automático. | verdade |
| `etiquetas` | mapa | Tags padrão e definidas pelo usuário para o cluster. | {"ResourceClass":"SingleNode"} |
| `cluster_source` | string | Indica o criador do cluster: UI, API, DLT, JOB, etc. | IU |
| `init_scripts` | matriz | Conjunto de caminhos para scripts de inicialização. | "/Users/example@email.com/files/scripts/install-pyt |
| `aws_attributes` | estruct | Configurações específicas da AWS. | {<br>"ebs_volume_count": null<br>"availability": "SPOT_WITH_FALLBACK",<br>"first_on_demand": "0",<br>"spot_bid_price_percent": "100"<br>} |
| `atributos_azure` | estruct | Configurações específicas do Azure. | vazio |
| `gcp_attributes` | estruct | Configurações específicas do GCP. Este campo estará vazio. | vazio |
| `driver_instance_pool_id` | string | ID do pool de instâncias se o driver estiver configurado sobre um pool de instâncias. | 1107-555555-crhod16-pool-DIdnjazB |
| `worker_instance_pool_id` | string | ID do pool de instâncias se o trabalhador estiver configurado sobre um pool de instâncias. | 1107-555555-crhod16-pool-DIdnjazB |
| `dbr_versão` | string | O tempo de execução do Databricks do cluster. | 14.x-instantâneo-scala2.12 |
| `change_time` | timestamp | Data/hora da alteração na definição de computação. | 09/01/2023 11:00:00.000 |
| `data_alteração` | data | Alterar data. Usado para retenção. | 09/01/2023 |

### Tabela de sistema de tipos de nós:

###### Descrição: Captura os tipos de nós atualmente disponíveis com suas informações básicas de hardware.
###### Localização: `system.compute.node_types`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `account_id` | string | ID da conta onde este cluster foi criado. | 23e22ba4-87b9-4cc2-9770-d10b894b7118 |
| `node_type_name` | string | Identificador exclusivo para tipo de nó. | i3.xlarge |
| `core_count` | double | Número de vCPUs da instância. | 48,0 |
| `memory_mb` | long | Memória total da instância. | 393216 |
| `gpu_count` | long | Número de GPUs da instância. | 0 |

### Tabela do sistema de acesso às listagens do Marketplace:

###### Descrição: Inclui informações do consumidor para dados de solicitação concluída ou eventos de obtenção de dados em suas listagens.
###### Localização: `system.marketplace.listing_access_events`

| Nome da coluna | Tipo de dados | Descrição |
|------------|-----------|-------------|
| `account_id` | string | O ID da conta que hospeda a listagem. |
| `metastore_id` | string | O ID do metatore que hospeda a listagem. |
| `metastore_cloud` | string | O provedor de nuvem do metastore que hospeda a listagem. |
| `metastore_region` | string | A região do metastore que hospeda a listagem. |
| `provider_id` | string | O ID do perfil do provedor. |
| `provider_name` | string | O nome do perfil do provedor. |
| `listing_id` | string | O ID da listagem. |
| `listing_name` | string | O nome da listagem. |
| `consumer_delta_sharing_recipient_name` | string | O nome do destinatário do Delta Sharing subjacente para o consumidor. O valor é nulo quando event_type é REQUEST_DATA. |
| `consumer_delta_sharing_recipient_type` | string | Quer o consumidor esteja numa conta Databricks ou não. Os valores serão OPEN ou DATABRICKS. |
| `consumer_cloud` | string | A nuvem do consumidor. Anulável se consumer_delta_sharing_recipient_type for OPEN. |
| `consumer_regions` | string | A região do consumidor. Anulável se consumer_delta_sharing_recipient_type for OPEN. |
| `consumer_metastore_id` | string | O ID do metastore do consumidor. Anulável se consumer_delta_sharing_recipient_type for OPEN. |
| `consumer_email` | string | O endereço de e-mail do consumidor. PII. |
| `consumer_name` | string | O nome do consumidor. PII. |
| `consumer_company` | string | A empresa do consumidor. |
| `consumer_intended_use` | string | O uso pretendido da listagem pelo consumidor. |
| `consumer_comments` | string | Qualquer comentário adicional que o consumidor tenha deixado. |
| `event_type` | string | O tipo de acesso. O valor pode ser REQUEST_DATA ou GET_DATA. |
| `event_date` | date | A data UTC em que o evento aconteceu. |
| `event_time` | timestamp | Data/hora UTC exato em que o evento aconteceu. |

### Tabela do sistema de histórico de otimização preditiva:

###### Descrição: rastreia o histórico de operação do recurso de otimização preditiva.
###### Localização: `system.storage.predictive_optimization_operations_history`

| Nome da coluna | Tipo de dados | Descrição | Exemplo |
|------------|-----------|-------------|--------- |
| `account_id` | string | ID da conta. | 11e22ba4-87b9-4cc2-9770-d10b894b7118 |
| `wordspace_id` | string | A ID do workspace no qual a otimização preditiva executou a operação. | 1234567890123456 |
| `start_time` | timestamp | A hora em que a operação foi iniciada. | 09/01/2023 10:00:00.000 |
| `end_time` | timestamp | A hora em que a operação terminou. | 09/01/2023 11:00:00.000 |
| `metastore_name` | string | O nome do metastore ao qual pertence a tabela otimizada. | metastore |
| `catalog_name` | string | O nome do catálogo ao qual pertence a tabela otimizada. | catalog |
| `schema_name` | string | O nome do esquema ao qual pertence a tabela otimizada. | schema |
| `table_id` | string | O ID da tabela otimizada. | 138ebb4b-3757-41bb-9e18-52b38d3d2836 |
| `table_name` | string | O nome da tabela otimizada. | tabela1 |
| `operation_type` | string | A operação de otimização que foi executada. O valor será COMPACTAÇÃO ou VÁCUO. | COMPACTION |
| `operation_id` | string | O ID da operação de otimização. | 4dad1136-6a8f-418f-8234-6855cfaff18f |
| `operation_status` | string | O status da operação de otimização. O valor será SUCCESSFUL ou FAILED: INTERNAL_ERROR. | SUCCESSFUL |
| `operation_metrics` | map[string, string]` | Detalhes adicionais sobre a otimização específica que foi executada. Para operações COMPACTION: (number_of_compacted_files, amount_of_data_compacted_bytes, number_of_output_files, amount_of_output_data_bytes) Para operações VACUUM: (number_of_deleted_files, amount_of_data_deleted_bytes)` | {"número_de_arquivos_de_saída":"100", <br /> "número_de_arquivos_compactados":"1000", <br /> "quantidade_de_dados_de_saída_bytes":"4000", <br /> "quantidade_de_dados_compactados_bytes":"10000"}` |
| `usage_unit` | string | A unidade de uso que esta operação incorreu. Só pode ser um valor: ESTIMATED_DBU. | ESTIMATED_DBU |
| `usage_quantity` | decimal | A quantidade da unidade de uso que foi usada por esta operação. | 2.12 |