# 00_setup — Configuração do Projeto (Medallion)

## Objetivo deste notebook
Este notebook centraliza a configuração inicial do MVP no Databricks, criando os recursos mínimos necessários para a ingestão dos dados no padrão **Medallion** (Bronze/Silver/Gold).

Os **Volumes** criados no Unity Catalog são:
- `mvp_chess_raw`: armazenamento do arquivo bruto (CSV) após upload, servindo como camada *landing/raw* do pipeline.
- `mvp_chess_out`: armazenamento de exports (CSV agregados, evidências e outputs estáticos) para posterior versionamento no GitHub. (Pode não ser utilizado, mas preferi prevenir)

## Parâmetros do projeto
- `CATALOG`: catálogo do Unity Catalog utilizado (neste MVP: `workspace`)
- `SCHEMA`: schema utilizado (neste MVP: `default`)
- `VOLUME_RAW` / `VOLUME_OUT`: volumes para *raw* e *exports*

## Saídas desta etapa
- Volumes criados:
  - `workspace.default.mvp_chess_raw`
  - `workspace.default.mvp_chess_out`
- Paths padrão para uso nos próximos notebooks:
  - `RAW_BASE_PATH = /Volumes/workspace/default/mvp_chess_raw`
  - `OUT_BASE_PATH = /Volumes/workspace/default/mvp_chess_out`

In [0]:
CATALOG = "workspace"
SCHEMA  = "default"
VOLUME_RAW = "mvp_chess_raw"
VOLUME_OUT = "mvp_chess_out"

PROJECT_DB = f"{CATALOG}.{SCHEMA}"
print("Project DB:", PROJECT_DB)


Project DB: workspace.default


In [0]:
spark.sql(f"CREATE VOLUME IF NOT EXISTS {PROJECT_DB}.{VOLUME_RAW}")
spark.sql(f"CREATE VOLUME IF NOT EXISTS {PROJECT_DB}.{VOLUME_OUT}")

display(spark.sql(f"SHOW VOLUMES IN {PROJECT_DB}"))


database,volume_name
default,mvp_chess_out
default,mvp_chess_raw


In [0]:
RAW_BASE_PATH = f"/Volumes/{CATALOG}/{SCHEMA}/{VOLUME_RAW}"
OUT_BASE_PATH = f"/Volumes/{CATALOG}/{SCHEMA}/{VOLUME_OUT}"

print("RAW_BASE_PATH:", RAW_BASE_PATH)
print("OUT_BASE_PATH:", OUT_BASE_PATH)


RAW_BASE_PATH: /Volumes/workspace/default/mvp_chess_raw
OUT_BASE_PATH: /Volumes/workspace/default/mvp_chess_out
