In [0]:
import os

base_path = os.getcwd()

dirs = {
    "src": ["bronze", "silver", "gold", "curated"],
    "ddl": ["bronze", "silver", "gold"]
}

for parent, subs in dirs.items():
    for sub in subs:
        full_path = os.path.join(base_path, parent, sub)
        os.makedirs(full_path, exist_ok=True)
        print(f"Diret√≥rio criado: {full_path}")

# Notebook de Inicializacao - V-Credit Data Lakehouse

## Proposito
Este notebook realiza a configuracao inicial do ambiente de Data Lakehouse, criando a estrutura de diretorios e schemas necessarios para o projeto V-Credit.

## O que este notebook faz:
1. **Cria estrutura de diretorios locais** para organizacao dos notebooks
2. **Cria o catalogo** `v_credit` no Databricks
3. **Cria os schemas** das camadas da Medallion Architecture:
   - `bronze`: Dados brutos com metadata
   - `silver`: Dados limpos e validados
   - `gold`: Modelagem dimensional (Star Schema)
   - `curated`: Views para consumo em BI

## Quando executar:
- **UMA VEZ** na criacao inicial do projeto
- Sempre que resetar o ambiente completo

## Proximo passo:
Apos executar este notebook, execute os notebooks de DDL para criar as tabelas Bronze.

In [0]:
catalog_name = "v_credit"
schemas = ["bronze", "silver", "gold", "curated"]

spark.sql(f"CREATE CATALOG IF NOT EXISTS {catalog_name}")
spark.sql(f"USE CATALOG {catalog_name}")

for schema in schemas:
    spark.sql(f"CREATE SCHEMA IF NOT EXISTS {schema}")
    print(f"Schema garantido: {catalog_name}.{schema}")