Este notebook cria a estrutura de diretórios padrão para a arquitetura Medallion (Bronze, Silver, Gold) e a Landing Zone no Databricks File System (DBFS). Esta é a base para organizar todos os dados do projeto "Health Insights Brasil".

### 1. Configuração das Variáveis de Caminho

Nesta célula, definimos todas as variáveis que conterão os caminhos para cada camada do nosso Lakehouse. Usar uma variável `root_path` torna o projeto portátil e fácil de manter.

In [0]:
# --- CONFIGURAÇÃO DA FONTE DE DADOS ---
# Altere esta variável para a fonte de dados atual (sinasc)
data_source = "sinasc" 

# --- CONFIGURAÇÃO DOS CAMINHOS ---
root_path = "/lakehouse/health_insights_brasil"
layers = ["landing_zone", "bronze", "silver", "gold"]

# --- CRIAÇÃO DA LISTA ---
# A variável 'directories_to_create' é criada aqui
directories_to_create = []
for layer in layers:
    layer_path = f"{root_path}/{layer}/{data_source}"
    directories_to_create.append(layer_path)

print("Lista de diretórios a serem criados:")
print(directories_to_create)

Lista de diretórios a serem criados:
['/lakehouse/health_insights_brasil/landing_zone/sinasc', '/lakehouse/health_insights_brasil/bronze/sinasc', '/lakehouse/health_insights_brasil/silver/sinasc', '/lakehouse/health_insights_brasil/gold/sinasc']


### 2. Criação dos Diretórios

Agora, vamos iterar sobre a lista de caminhos e usar o comando `dbutils.fs.mkdirs()` para criar cada um dos diretórios. 

Este comando é idempotente, o que significa que se o diretório já existir, ele não fará nada e não retornará um erro. Isso é perfeito para garantir que a estrutura exista sem causar problemas ao reexecutar o notebook.

In [0]:
print("Iniciando a criação da estrutura de diretórios...")

for path in directories_to_create:
  dbutils.fs.mkdirs(path)
  print(f"Diretório garantido: {path}")

print("\n✅ Estrutura de diretórios criada/verificada com sucesso!")

Iniciando a criação da estrutura de diretórios...
Diretório garantido: /lakehouse/health_insights_brasil/landing_zone/sinasc
Diretório garantido: /lakehouse/health_insights_brasil/bronze/sinasc
Diretório garantido: /lakehouse/health_insights_brasil/silver/sinasc
Diretório garantido: /lakehouse/health_insights_brasil/gold/sinasc

✅ Estrutura de diretórios criada/verificada com sucesso!


### 3. Verificação da Estrutura Criada

Para confirmar que tudo foi criado corretamente, usamos o comando mágico `%fs ls` para listar o conteúdo do nosso diretório raiz. Você deve ver as pastas `landing_zone`, `bronze`, `silver` e `gold`.

In [0]:
%fs ls /lakehouse/health_insights_brasil

path,name,size,modificationTime
dbfs:/lakehouse/health_insights_brasil/bronze/,bronze/,0,0
dbfs:/lakehouse/health_insights_brasil/gold/,gold/,0,0
dbfs:/lakehouse/health_insights_brasil/landing_zone/,landing_zone/,0,0
dbfs:/lakehouse/health_insights_brasil/silver/,silver/,0,0
