# üì• Ingest√£o de Claims para Camada Bronze

Este notebook realiza a ingest√£o batch de dados de claims para a camada bronze, processando **TODOS** os arquivos `claims*.csv` do volume automaticamente.

## üìã Objetivo

- Processar todos os arquivos `claims*.csv` do diret√≥rio `/Volumes/{catalog}/00_landing/sql_server/`
- Criar/atualizar a tabela `${catalog}.${schema}.claims` na camada bronze
- Processar automaticamente m√∫ltiplos arquivos usando padr√£o glob

## üîÑ Fluxo de Processamento

1. **Configura√ß√£o**: Define cat√°logo e schema via widgets ou vari√°veis de ambiente
2. **Leitura**: L√™ todos os arquivos `claims*.csv` do volume usando padr√£o glob
3. **Processamento**: Infere schema automaticamente e cacheia dados
4. **Persist√™ncia**: Salva como tabela Delta na camada bronze
5. **Valida√ß√£o**: Mostra estat√≠sticas da ingest√£o

## üìù Par√¢metros

Este notebook aceita par√¢metros via **widgets** ou **vari√°veis de ambiente**:

- `catalog` - Nome do cat√°logo (ex: `smart_claims_dev`)
- `schema` - Nome do schema bronze (ex: `01_bronze`)

## ‚ö†Ô∏è Importante

- O notebook **reprocessa TODOS** os arquivos `claims*.csv` sempre que executado
- Ideal para reprocessamento completo quando novos arquivos chegam
- O padr√£o glob `claims*.csv` processa automaticamente todos os arquivos correspondentes


## üîß Fun√ß√£o Helper: Obter Par√¢metros

Fun√ß√£o auxiliar para obter par√¢metros via widgets (Databricks) ou vari√°veis de ambiente.


In [None]:
def _get_widget_or_env(name: str, env_var: str, default: str = None) -> str:
    """
    Obt√©m valor de widget do Databricks ou vari√°vel de ambiente.
    
    Args:
        name: Nome do widget
        env_var: Nome da vari√°vel de ambiente
        default: Valor padr√£o (opcional)
    
    Returns:
        Valor do widget, vari√°vel de ambiente ou default
    """
    value = None
    
    # Tenta obter do widget do Databricks
    if "dbutils" in globals():
        try:
            value = dbutils.widgets.get(name).strip()
        except Exception:
            value = None
    
    # Se n√£o encontrou no widget, tenta vari√°vel de ambiente
    if not value:
        import os
        value = os.getenv(env_var, "").strip()
    
    # Se ainda n√£o encontrou, usa default ou levanta erro
    if not value:
        if default:
            return default
        raise ValueError(f"Missing configuration for {name} / {env_var}. Configure via widget ou vari√°vel de ambiente.")
    
    return value


## üìå Passo 1: Configurar Par√¢metros

Configure os par√¢metros via widgets ou vari√°veis de ambiente. Se estiver executando manualmente, voc√™ pode definir valores padr√£o.


In [None]:
# Obter par√¢metros via widgets ou vari√°veis de ambiente
catalog = _get_widget_or_env("catalog", "CATALOG", default="smart_claims_dev")
schema = _get_widget_or_env("schema", "SCHEMA", default="01_bronze")

print(f"üìÇ Cat√°logo: {catalog}")
print(f"üìÇ Schema: {schema}")


## üóÇÔ∏è Passo 2: Configurar Cat√°logo e Schema

Seleciona o cat√°logo e schema onde a tabela ser√° criada.


In [None]:
# Configurar cat√°logo e schema
spark.sql(f"USE CATALOG {catalog}")
spark.sql(f"USE SCHEMA {schema}")

print(f"‚úÖ Cat√°logo e schema configurados")


## üìÇ Passo 3: Definir Caminhos

Define o caminho do volume e o nome da tabela de destino.


In [None]:
# Definir caminhos
volume_path = f"/Volumes/{catalog}/00_landing/sql_server/claims*.csv"
target_table = f"{catalog}.{schema}.claims"

print(f"üìÅ Volume path: {volume_path}")
print(f"üéØ Tabela destino: {target_table}")
