# MVP – Preparação do Ambiente no Databricks (Camada de Staging)

Este notebook configura o ambiente inicial do MVP de engenharia de dados no Databricks, criando:

- O catálogo `mvp_engenharia_de_dados`, já existente na plataforma,
- Os esquemas lógicos que representam as camadas staging, bronze, silver e gold,
- E o *volume* `synthea_raw` na camada *staging*, que será utilizado para armazenar os arquivos CSV brutos do Synthea.

Esses passos preparam a infraestrutura de armazenamento necessária para as etapas seguintes do pipeline do MVP (ingestão dos dados brutos, modelagem em esquema estrela e análise dos indicadores hospitalares).


In [0]:
%sql
-- Seleciona o catálogo do MVP
USE CATALOG mvp_engenharia_de_dados

In [0]:
%sql
-- Cria o schema staging
CREATE SCHEMA IF NOT EXISTS staging;

In [0]:
%sql
-- Cria o schema bronze
CREATE SCHEMA IF NOT EXISTS bronze;
    

In [0]:
%sql
-- # Cria o schema silver
CREATE SCHEMA IF NOT EXISTS silver;

In [0]:
%sql
-- Cria o schema gold
CREATE SCHEMA IF NOT EXISTS gold;


In [0]:
%sql
-- Define o esquema padrao como staging
USE SCHEMA staging;

In [0]:
%sql
-- listar todos os schemas existentes dentro do catálogo atual 
SHOW SCHEMAS IN mvp_engenharia_de_dados;



databaseName
bronze
default
gold
information_schema
silver
staging


## Volume `synthea_raw` na camada *staging*

No schema `staging`, foi criado um volume chamado `synthea_raw` para armazenar os arquivos de dados em sua forma original (dados brutos do Synthea).

Os arquivos que carregados nesse volume foram:

- `encounters.csv`
- `patients.csv`

Esses arquivos foram enviados para o caminho:

`/Volumes/mvp_engenharia_de_dados/staging/synthea_raw/`

manualmente, utilizando a interface gráfica do Databricks, acessando o menu volumes e realizando o upload dos arquivos CSV.  
A partir desse volume, os dados serão lidos e tratados nas próximas etapas do pipeline (camadas Bronze, Silver e Gold), que irão compor o Data Warehouse em esquema estrela do MVP.


In [0]:
%sql
-- Cria o volume de dados brutos do Synthea
CREATE VOLUME IF NOT EXISTS synthea_raw;


In [0]:
%sql
-- Verifica o conteúdo do volume
LIST '/Volumes/mvp_engenharia_de_dados/staging/synthea_raw';


path,name,size,modification_time
/Volumes/mvp_engenharia_de_dados/staging/synthea_raw/encounters.csv,encounters.csv,170369297,1765196995000
/Volumes/mvp_engenharia_de_dados/staging/synthea_raw/patients.csv,patients.csv,2707224,1765197061000
