In [None]:
CATALOGO_DESTINO = "spotify_analytics"
SCHEMA_DESTINO = "bronze"
TABELA_DESTINO = "tb_bronze_search"

nome_tabela_destino = f"{CATALOGO_DESTINO}.{SCHEMA_DESTINO}.{TABELA_DESTINO}"

### Configuração

Define catálogo, schema e nome da tabela Bronze de dados brutos da API Search do Spotify.

### DDL - Tabela Bronze de Search

Cria tabela Bronze com:
- **raw_json** (STRING): Payload JSON completo da API
- **source_file** (STRING): Caminho do arquivo fonte no DBFS
- **ingestion_date** (TIMESTAMP): Data/hora da ingestão

Estratégia: Schema-on-read, dados imutáveis, particionado por data de ingestão.

In [None]:
query = f"""
CREATE OR REPLACE TABLE {nome_tabela_destino} (
    raw_json STRING COMMENT 'Payload JSON bruto da API de Search do Spotify',
    source_file STRING COMMENT 'Caminho do arquivo fonte no DBFS para rastreabilidade',
    ingestion_date TIMESTAMP COMMENT 'Timestamp de quando os dados foram ingeridos no lake'
)
USING DELTA
PARTITIONED BY (ingestion_date)
COMMENT 'Tabela bronze: dados brutos JSON da API Search do Spotify com metadata de rastreabilidade'
TBLPROPERTIES (
    'delta.autoOptimize.optimizeWrite' = 'true',
    'delta.autoOptimize.autoCompact' = 'true',
    'quality' = 'bronze',
    'source' = 'spotify_api_search'
);
"""

spark.sql(query)
print(f"✅ Tabela {nome_tabela_destino} criada com sucesso!")