# Task_002 - Criar Volumes no Schema 00_landing

Este notebook cria volumes no schema `00_landing` para organizar diferentes tipos de dados do projeto Smart Claims.

## Volumes a serem criados:
- `claims` - Volume para dados e imagens de sinistros (CSV, imagens, metadata)
- `sql_server` - Volume para dados extraídos do SQL Server (CSV: claims, customers, policies)
- `telematics` - Volume para dados de telemetria veicular (arquivos Parquet)
- `training_imgs` - Volume para imagens de treinamento de modelos de Machine Learning (PNG)

## O que são Volumes no Unity Catalog?
- **Volumes** são containers de arquivos no Unity Catalog
- Permitem armazenar arquivos não estruturados ou semi-estruturados (CSV, JSON, Parquet, imagens, etc.)
- Fornecem governança e controle de acesso granular
- São a alternativa moderna ao DBFS para armazenamento de arquivos
- Permitem organizar dados por tipo ou origem antes do processamento

## Nota sobre Upload
Após criar os volumes neste notebook, você pode fazer upload dos arquivos diretamente via **UI do Databricks**:
1. Navegue até: Catalog → smart_claims_dev → 00_landing
2. Clique no volume desejado
3. Clique em **Upload** ou **Add files**
4. Selecione os arquivos/pastas do seu sistema local



## Parte 1: Garantir que o Catálogo e Schema existem

Primeiro, vamos garantir que estamos usando o catálogo correto e que o schema 00_landing existe.



In [0]:
USE CATALOG smart_claims_dev



In [0]:
SHOW SCHEMAS IN smart_claims_dev LIKE '00_landing'

## Parte 2: Criar Volumes no Schema 00_landing

**COMANDO: CREATE VOLUME**

O que faz:
- Cria um volume dentro de um schema para armazenar arquivos
- Volumes são containers para arquivos não estruturados ou semi-estruturados
- Permitem controle de acesso granular através do Unity Catalog
- Suportam diferentes tipos de arquivo (CSV, JSON, Parquet, imagens PNG/JPG, etc.)

**Documentação oficial:** [Unity Catalog - CREATE VOLUME](https://docs.databricks.com/en/connect/unity-catalog/create-volume.html)



In [0]:
CREATE VOLUME IF NOT EXISTS smart_claims_dev.00_landing.claims
COMMENT 'Volume para armazenar dados e imagens de sinistros (CSV, imagens JPG, metadata)'



In [0]:
CREATE VOLUME IF NOT EXISTS smart_claims_dev.00_landing.sql_server
COMMENT 'Volume para armazenar dados extraídos do SQL Server (CSV: claims, customers, policies)'



In [0]:
CREATE VOLUME IF NOT EXISTS smart_claims_dev.00_landing.telematics
COMMENT 'Volume para armazenar dados de telemetria veicular (arquivos Parquet)'



In [0]:
CREATE VOLUME IF NOT EXISTS smart_claims_dev.00_landing.training_imgs
COMMENT 'Volume para armazenar imagens de treinamento de modelos de Machine Learning (PNG)'


## Parte 3: Verificar Volumes Criados

Vamos verificar se todos os volumes foram criados com sucesso.



In [0]:
SHOW VOLUMES IN smart_claims_dev.00_landing



## Parte 4: Como Fazer Upload dos Arquivos

Após criar os volumes, você pode fazer upload dos arquivos diretamente via **UI do Databricks**:

### Passo a Passo:

1. **Acesse o Unity Catalog:**
   - No Databricks Workspace, clique em **Catalog** (no menu lateral)
   - Expanda: **smart_claims_dev** → **00_landing**

2. **Para cada volume, faça upload dos arquivos:**
   
   **Volume `claims`:**
   - Clique no volume `claims`
   - Clique em **Upload** ou **Add files**
   - Selecione a pasta `data/claims/` ou seus arquivos individuais
   - Suba as imagens (JPG) e o arquivo de metadata (CSV)
   
   **Volume `sql_server`:**
   - Clique no volume `sql_server`
   - Clique em **Upload** ou **Add files**
   - Selecione os arquivos da pasta `data/sql_server/`
   - Suba: `claims.csv`, `customers.csv`, `policies.csv`
   
   **Volume `telematics`:**
   - Clique no volume `telematics`
   - Clique em **Upload** ou **Add files**
   - Selecione todos os arquivos Parquet da pasta `data/telematics/`
   
   **Volume `training_imgs`:**
   - Clique no volume `training_imgs`
   - Clique em **Upload** ou **Add files**
   - Selecione todas as imagens PNG da pasta `data/training_imgs/`

### Estrutura Esperada após Upload:

```
smart_claims_dev
  └── 00_landing
      ├── claims/
      │   ├── images/        (JPG files)
      │   └── metadata/      (CSV files)
      ├── sql_server/
      │   ├── claims.csv
      │   ├── customers.csv
      │   └── policies.csv
      ├── telematics/
      │   └── *.parquet      (múltiplos arquivos)
      └── training_imgs/
          └── *.png          (múltiplas imagens)
```


## Parte 5: Resumo dos Volumes Criados

✅ **4 volumes criados com sucesso no schema 00_landing:**

1. **`claims`** - Dados e imagens de sinistros
2. **`sql_server`** - Dados extraídos do SQL Server (CSV)
3. **`telematics`** - Dados de telemetria veicular (Parquet)
4. **`training_imgs`** - Imagens para treinamento de ML (PNG)

### Próximos Passos

Após fazer upload dos arquivos via UI, você pode:

- **Task_003**: Criar tabelas Delta na camada `01_bronze` a partir dos arquivos nos volumes
