In [4]:
import json
import os

BASE_DIR = os.path.join(os.getcwd(), "JsonSoup")
DIR_CLASSES = os.path.join(BASE_DIR, "JsonClasses")
DIR_RACAS = os.path.join(BASE_DIR, "JsonRacas")
DIR_UNION = os.path.join(BASE_DIR, "JsonUnion")

os.makedirs(DIR_UNION, exist_ok=True)


# ============================================================
# 1️⃣ — Detecta se um bloco é uma tabela (deve ser ignorado)
# ============================================================
def is_table_block(block):
    if not isinstance(block, list) or not block:
        return False

    if not all(isinstance(row, list) for row in block):
        return False

    lengths = [len(row) for row in block if isinstance(row, list)]
    if len(lengths) < 2:
        return False

    if len(set(lengths)) == 1 and lengths[0] >= 3:
        return True

    header = block[0]
    if isinstance(header, list) and len(header) >= 3 and all(isinstance(c, str) for c in header):
        if all(len(c.strip()) <= 25 for c in header):
            return True

    return False


# ============================================================
# 2️⃣ — Checa se um valor é uma tabela simples
# ============================================================
def eh_tabela(valor):
    if not isinstance(valor, list) or not valor:
        return False

    if not all(isinstance(item, list) for item in valor):
        return False

    for sub in valor:
        if not all(isinstance(x, (str, int, float)) for x in sub):
            return False

    tamanhos = [len(sub) for sub in valor]
    if all(1 < t <= 10 for t in tamanhos) and len(set(tamanhos)) <= 2:
        return True

    return False


# ============================================================
# 3️⃣ — Extrai apenas frases relevantes (ignorando tabelas)
# ============================================================
def extrair_frases(dado):
    frases = []

    def percorrer(valor):
        if isinstance(valor, list):
            if is_table_block(valor) or eh_tabela(valor):
                return
            for item in valor:
                percorrer(item)

        elif isinstance(valor, str):
            valor_limpo = valor.strip()
            if valor_limpo:
                frases.append(valor_limpo)

        elif isinstance(valor, dict):
            for v in valor.values():
                percorrer(v)

    percorrer(dado)
    return frases


# ============================================================
# 4️⃣ — Processa todos os JSONs de uma pasta
# ============================================================
def processar_pasta(caminho):
    resultado = {}
    for arquivo in sorted(os.listdir(caminho)):
        if not arquivo.endswith(".json"):
            continue

        caminho_arquivo = os.path.join(caminho, arquivo)
        nome_base = arquivo.replace(".json", "")

        try:
            with open(caminho_arquivo, "r", encoding="utf-8") as f:
                dados = json.load(f)
        except Exception as e:
            print(f"❌ Erro ao carregar {arquivo}: {e}")
            continue

        frases = extrair_frases(dados)
        resultado[nome_base] = frases
        print(f"✅ {nome_base}: {len(frases)} frases extraídas.")

    return resultado


# ============================================================
# 5️⃣ — Une os JSONs em um único arquivo
# ============================================================
def unir_jsons():
    print("\nProcessando classes...")
    classes = processar_pasta(DIR_CLASSES)

    print("\nProcessando raças...")
    racas = processar_pasta(DIR_RACAS)

    resultado_final = {
        "classes": classes,
        "races": racas
    }

    caminho_saida = os.path.join(DIR_UNION, "resultado_unificado.json")
    with open(caminho_saida, "w", encoding="utf-8") as f:
        json.dump(resultado_final, f, ensure_ascii=False, indent=4)

    print(f"\nJSON final salvo em: {caminho_saida}")


# ============================================================
# 6️⃣ — Execução principal
# ============================================================
if __name__ == "__main__":
    unir_jsons()



Processando classes...
✅ Barbarian: 154 frases extraídas.
✅ artificer: 298 frases extraídas.
✅ bard: 346 frases extraídas.
✅ cleric: 314 frases extraídas.
✅ druid: 324 frases extraídas.
✅ fighter: 109 frases extraídas.
✅ monk: 199 frases extraídas.
✅ paladin: 70 frases extraídas.
✅ ranger: 95 frases extraídas.
✅ rogue: 124 frases extraídas.
✅ sorcerer: 379 frases extraídas.
✅ warlock: 227 frases extraídas.
✅ wizard: 310 frases extraídas.

Processando raças...
✅ dragonborn: 0 frases extraídas.
✅ dwarf: 21 frases extraídas.
✅ elf: 34 frases extraídas.
✅ gnome: 24 frases extraídas.
✅ half-elf: 18 frases extraídas.
✅ half-orc: 12 frases extraídas.
✅ halfling: 20 frases extraídas.
✅ human: 13 frases extraídas.
✅ tiefling: 14 frases extraídas.

JSON final salvo em: C:\Users\casti\Downloads\PlnAtividade1\JsonSoup\JsonUnion\resultado_unificado.json
