 # Ingestão do JSON Raw com Estrutura de Pastas Data/Hora no Lakehouse do Fabric

 Este notebook realiza o download do JSON disponibilizado no endpoint e o salva, sem transformações, 
 em uma estrutura de pastas no Lakehouse organizada por ano/mês/dia. O nome do arquivo inclui a data e hora (ano, mês, dia, hora, minuto e segundo)
 do download.

 **Observações:**
 - Utilizamos a biblioteca `requests` para realizar o download.
 - A estrutura de diretórios é criada dinamicamente conforme a data atual.
 - O arquivo é salvo utilizando `dbutils.fs.put`. Caso o arquivo seja muito grande, avalie outras alternativas.


In [2]:
import requests
from datetime import datetime

# URL do arquivo JSON raw
json_url = "https://raw.githubusercontent.com/DTX-Galgas/health-Microsoft-Fabric/refs/heads/main/dataset/fhir_data.json"

# Realiza o download do JSON
response = requests.get(json_url)
if response.status_code == 200:
    raw_json = response.text
    print("Download realizado com sucesso.")
else:
    raise Exception(f"Erro ao baixar o JSON, status code: {response.status_code}")


StatementMeta(, 4f974097-2a6d-4ed9-bba2-d9499a629966, 4, Finished, Available, Finished)

Download realizado com sucesso.


## Organização por Data/Hora

 Utilizaremos a data e hora atual para definir:
 - **Estrutura de Pastas:** `/Lakehouse/Raw/FHIRData/AAAA/MM/DD`
 - **Nome do Arquivo:** `AAAAMMDDHHMMSS.json`


In [3]:
# Obtém a data e hora atual
now = datetime.now()

# Formata o caminho das pastas (exemplo: /Lakehouse/Raw/FHIRData/2025/02/23)
date_path = now.strftime("%Y/%m/%d")

# Formata o nome do arquivo (exemplo: 20250223153045.json)
file_name = now.strftime("%Y%m%d%H%M%S") + ".json"

# Define o caminho completo para salvar o arquivo
target_folder = f"Files/Raw/FHIRData/{date_path}"
target_file = f"{target_folder}/{file_name}"

print(f"Pasta de destino: {target_folder}")
print(f"Nome do arquivo: {file_name}")

StatementMeta(, 4f974097-2a6d-4ed9-bba2-d9499a629966, 5, Finished, Available, Finished)

Pasta de destino: Files/Raw/FHIRData/2025/02/23
Nome do arquivo: 20250223152342.json


 ## Criação da Estrutura de Pastas e Salvamento do Arquivo

 Cria a estrutura de pastas, se ainda não existir, e salva o arquivo JSON no Lakehouse.


In [5]:
mssparkutils.fs.put(target_file, raw_json, overwrite=True)
print(f"Arquivo JSON salvo com sucesso em: {target_file}")

StatementMeta(, 4f974097-2a6d-4ed9-bba2-d9499a629966, 7, Finished, Available, Finished)

Arquivo JSON salvo com sucesso em: Files/Raw/FHIRData/2025/02/23/20250223152342.json


 ## Verificação

 Podemos listar o diretório para confirmar que o arquivo foi criado corretamente.


In [8]:
display(mssparkutils.fs.ls(target_folder))

StatementMeta(, 4f974097-2a6d-4ed9-bba2-d9499a629966, 10, Finished, Available, Finished)

[FileInfo(path=abfss://5aad9838-8ce9-4dff-af19-512a77e46917@onelake.dfs.fabric.microsoft.com/4ce8615c-a96e-4904-a59f-1c1fa48881a9/Files/Raw/FHIRData/2025/02/23/20250223152342.json, name=20250223152342.json, size=33699287)]