In [None]:
import json
import numpy as np

# Fungsi untuk membaca file JSON
def load_json(path):
    with open(path, 'r') as f:
        return json.load(f)

# Path file (sesuaikan dengan struktur direktori Anda)
text_embed_path = "1. pre-processing & feature extraction/text/text_embeddings_output.json"
image_embed_path = "1. pre-processing & feature extraction/image/aggregated_features.json"

# Baca kedua file JSON
text_data = load_json(text_embed_path)          # Misal: list of dict
image_data = load_json(image_embed_path)         # Misal: dictionary { "batik-bali": [ ... ], ... }

# Misalnya text_data adalah list dictionary dengan masing-masing item memiliki kolom:
# "Path Folder" (misal "batik-bali") dan "nama_embedding" (list angka)
# Kita asumsikan image_data sudah menggunakan kunci yang sama seperti nilai "Path Folder" di text_data.

multimodal_features = {}

# Loop melalui setiap item di text_data
for item in text_data:
    # Gunakan "Path Folder" sebagai kunci untuk menggabungkan embedding
    folder_key = item.get("Path Folder", "").strip().lower()  # misal "batik-bali"
    text_embed = item.get("nama_embedding", None)
    
    # Pastikan text embedding ada dan key ditemukan pada image_data
    if text_embed is not None and folder_key in image_data:
        image_embed = image_data[folder_key]  # image embedding sebagai list angka
        
        # Konversi ke NumPy array untuk konkatenasi
        text_arr = np.array(text_embed)
        image_arr = np.array(image_embed)
        
        # Misalnya kita ingin menggabungkan dengan cara konkatenasi
        multimodal_arr = np.concatenate([text_arr, image_arr], axis=0)
        
        # Simpan hasil (bisa menggunakan nama batik atau key folder)
        batik_name = item.get("Nama", folder_key)
        multimodal_features[batik_name] = multimodal_arr.tolist()
    else:
        print(f"Kunci '{folder_key}' tidak ditemukan di file image embedding atau text embedding hilang.")

# Simpan hasil multimodal ke file JSON baru
output_path = "multimodal_features.json"
with open(output_path, 'w') as f:
    json.dump(multimodal_features, f)

print(f"Multimodal embedding telah disimpan di {output_path}.")
