In [0]:
import json
import time

# Caminho onde os arquivos serão salvos (ajuste se usar Unity Catalog Volumes)
base_path = "/Volumes/dae_learn_path/default/star_wars_data"


# Lote 1: Estrutura Simples
batch_1 = [
    {"id": 1, "name": "Luke Skywalker", "affiliation": "Jedi Order", "rank": "Master"},
    {"id": 2, "name": "Darth Vader", "affiliation": "Sith", "rank": "Lord"},
    {"id": 3, "name": "Leia Organa", "affiliation": "Resistance", "rank": "General"}
]

# Lote 2: Schema Evolution (Adicionando campo 'homeworld')
batch_2 = [
    {"id": 4, "name": "Obi-Wan Kenobi", "affiliation": "Jedi Order", "rank": "Master", "homeworld": "Stewjon"},
    {"id": 5, "name": "Yoda", "affiliation": "Jedi Order", "rank": "Grand Master", "homeworld": "Unknown"},
    {"id": 6, "name": "Han Solo", "affiliation": "Resistance", "rank": "Captain", "homeworld": "Corellia"}
]

# Lote 3: Tipos Complexos (Adicionando Array em 'weapons' e Struct em 'stats')
batch_3 = [
    {"id": 7, "name": "Mace Windu", "affiliation": "Jedi Order", "rank": "Master", "homeworld": "Haruun Kal", 
     "weapons": ["Purple Lightsaber"], "stats": {"force_level": 95, "combat": 98}},
    {"id": 8, "name": "General Grievous", "affiliation": "Separatists", "rank": "General", "homeworld": "Kalee", 
     "weapons": ["Blue Lightsaber", "Green Lightsaber", "Blaster"], "stats": {"force_level": 0, "combat": 90}}
]

# Função auxiliar para salvar (usando a API padrão de IO do Python que grava no /dbfs)
def save_json_batch(data, batch_name):
    file_path = f"{base_path}/{batch_name}.json"
    with open(file_path, "w") as f:
        # Gravando como multiline JSON (lista de objetos) ou JSON por linha
        # Para Auto Loader, JSON por linha (NDJSON) é muito comum, mas vamos usar lista padrão aqui
        # Se quiser NDJSON, remova os colchetes e a vírgula entre objetos.
        json.dump(data, f) 
    print(f"Arquivo gerado: {file_path}")

# Criando o diretório se não existir
import os
if not os.path.exists(base_path):
    os.makedirs(base_path)

In [0]:
# Gerando os arquivos
save_json_batch(batch_1, "batch_1_basic")

In [0]:
save_json_batch(batch_2, "batch_2_evolution")

In [0]:
save_json_batch(batch_3, "batch_3_complex")

In [0]:
import json
import os

# Seus caminhos (mantendo a consistência)
source_raw_files = '/Volumes/dae_learn_path/default/star_wars_data'
file_path = f"{source_raw_files}/batch_4_chaos_b.json"

# Lote 4: Dados com Tipagem Incorreta (Type Mismatch)
batch_4 = [
    # Erro: 'id' virou string ("nine")
    {"id": "nine", "name": "BB-8", "affiliation": "Resistance", "rank": "Droid", "homeworld": "Unknown"},
    
    # Erro: Dentro do struct 'stats', 'force_level' virou texto ("High")
    {"id": "ten", "name": "R2-D2", "affiliation": "Rebel Alliance", "rank": "Droid", "homeworld": "Naboo", 
     "stats": {"force_level": "High", "combat": 50}}
]

with open(file_path, "w") as f:
    for entry in batch_4:
        json.dump(entry, f)
        f.write('\n')

print(f"Lote do Caos gerado em: {file_path}")