# Environement Setup

In [4]:
# @title 1. üõ†Ô∏è Installazione Ambiente (PyTorch 2.4.0)
import os
import sys

print("üîÑ Preparazione ambiente in corso... (richieder√† 2-3 minuti)")

# 1. Disinstallazione versioni incompatibili
os.system("pip uninstall -y torch torchvision torchaudio torch-scatter torch-sparse torch-cluster torch-geometric")

# 2. Installazione PyTorch 2.4.0 (Versione richiesta dal README)
# Usiamo CUDA 12.1 che √® stabile su Colab
cmd_torch = "pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121"
os.system(cmd_torch)

# 3. Installazione librerie Grafiche (PyG) specifiche per Torch 2.4.0
pyg_url = "https://data.pyg.org/whl/torch-2.4.0+cu121.html"
libs = ["torch-scatter", "torch-sparse", "torch-cluster", "torch-spline-conv"]
cmd_pyg = f"pip install {' '.join(libs)} -f {pyg_url}"
os.system(cmd_pyg)

# 4. Altre dipendenze
os.system("pip install torch-geometric hydra-core omegaconf submitit pandas")

print("‚úÖ Installazione completata.")
print("‚ö†Ô∏è IMPORTANTE: Ora vai nel menu in alto: 'Runtime' > 'Restart Session' (Riavvia Sessione) prima di eseguire la cella successiva!")

‚¨áÔ∏è Installazione PyTorch 2.4.0...
‚¨áÔ∏è Installazione dipendenze PyG...
‚úÖ Installazione completata come da README.
‚ö†Ô∏è ORA RIAVVIA IL RUNTIME (Runtime > Restart Session)!


In [1]:
# @title 2. üìÇ Setup HiERO e Download Pesi Pre-addestrati
import os

# 1. Clone del repository
if not os.path.exists("HiERO"):
    print("‚¨áÔ∏è Clonazione repository HiERO...")
    os.system("git clone --recursive https://github.com/sapeirone/HiERO.git")

os.chdir("/content/HiERO")

# 2. Creazione struttura cartelle
dirs = [
    "checkpoints",
    "pretrained",
    "data/ego4d/raw/annotations",
    "data/ego4d/raw/features/egovlp"
]
for d in dirs:
    os.makedirs(d, exist_ok=True)

# 3. Download del modello HiERO gi√† addestrato (Backbone EgoVLP)
if not os.path.exists("checkpoints/hiero_egovlp.pth"):
    print("‚¨áÔ∏è Scaricamento Modello Pre-addestrato (hiero_egovlp.pth)...")
    os.system("wget -O checkpoints/hiero_egovlp.pth https://www.sapeirone.it/data/hiero/ckpt/hiero_egovlp.pth")

# 4. Download componenti testuali (richiesti dal codice)
print("‚¨áÔ∏è Scaricamento Encoder Testuale...")
os.system("wget -q -O pretrained/egovlp_text.pth https://www.sapeirone.it/data/hiero/pretrained/egovlp_text.pth")
os.system("wget -q -O pretrained/egovlp_txt_proj.pth https://www.sapeirone.it/data/hiero/pretrained/egovlp_txt_proj.pth")

# 5. Download Annotazioni necessarie (EgoMCQ/EgoClip)
print("‚¨áÔ∏è Scaricamento Annotazioni...")
os.system("gdown --id 1-aaDu_Gi-Y2sQI_2rsI2D1zvQBJnHpXl -O data/ego4d/raw/annotations/egoclip.csv")
os.system("gdown --id 1-5iRYf4BCHmj4MYQYFRMY4bhsWJUN3rW -O data/ego4d/raw/annotations/egomcq.json")

print("‚úÖ Setup completato. Cartelle pronte.")

‚¨áÔ∏è Scaricamento Modello Pre-addestrato (hiero_egovlp.pth)...
‚¨áÔ∏è Scaricamento Encoder Testuale...
‚¨áÔ∏è Scaricamento Annotazioni...
‚úÖ Setup completato. Cartelle pronte.


In [30]:
import os
import shutil
import torch
import glob
import sys
import numpy as np
from tqdm import tqdm
from omegaconf import OmegaConf

# ==========================================
# 1. SETUP PERCORSI CORRETTI
# ==========================================
# üõë PUNTO CRITICO: Qui mettiamo il percorso che mi hai appena dato
USER_ACTUAL_PATH = "/content/data/egovlp/egovlp_test"

HIERO_ROOT = "/content/HiERO"
OUTPUT_DIR = "/content/output_embeddings"

if HIERO_ROOT not in sys.path:
    sys.path.append(HIERO_ROOT)
os.chdir(HIERO_ROOT)
os.makedirs(OUTPUT_DIR, exist_ok=True)

print(f"üìÇ Cartella Input Dati: {USER_ACTUAL_PATH}")
print(f"üìÇ Cartella Output: {OUTPUT_DIR}")

# ==========================================
# 2. CONFIGURAZIONE MODELLO
# ==========================================
print("\n‚öôÔ∏è Configurazione Modello...")
try:
    from models.hiero import HiERO

    # Configurazione Layer
    conv_config = OmegaConf.create({
        "_target_": "models.conv.tdgc.TDGC",
        "in_channels": 768, "out_channels": 768, "bias": True,
        "pos_hidden_channels": 256, "aggr": "mean", "pos_act": "tanh",
        "use_signed_temporal_distance": True, "use_pos_attr": True
    })

    # Istanziazione Modello
    model = HiERO(
        input_size=256, hidden_size=768, conv=conv_config,
        depth=3, n_clusters=8, input_projection=True, dropout=0.1,
        pool="batch_subsampling"
    )

    # Caricamento Pesi
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    ckpt_path = os.path.join(HIERO_ROOT, "checkpoints/hiero_egovlp.pth")

    if os.path.exists(ckpt_path):
        checkpoint = torch.load(ckpt_path, map_location="cpu")
        state_dict = checkpoint['model'] if 'model' in checkpoint else checkpoint
        model.load_state_dict(state_dict, strict=False)
        model = model.to(device).eval()
        print(f"‚úÖ Modello pronto su {device}.")
    else:
        raise FileNotFoundError(f"Modello mancante in {ckpt_path}")

    # ==========================================
    # 3. RICERCA E ELABORAZIONE (PTH + NPZ)
    # ==========================================
    print(f"\nüîç Cerco file .pth e .npz in {USER_ACTUAL_PATH}...")

    # Cerchiamo sia .pth che .npz
    files_pth = glob.glob(f"{USER_ACTUAL_PATH}/*.pth")
    files_npz = glob.glob(f"{USER_ACTUAL_PATH}/*.npz")
    files = files_pth + files_npz

    print(f"üìÇ Trovati {len(files)} file totali ({len(files_pth)} pth, {len(files_npz)} npz).")

    count = 0
    if len(files) == 0:
        print("‚ùå ERRORE: La cartella sembra vuota! Controlla se il percorso √® esatto.")
    else:
        with torch.no_grad():
            for fpath in tqdm(files):
                filename = os.path.basename(fpath)

                # Salta il modello se per caso √® l√¨ dentro
                if "hiero_egovlp.pth" in filename: continue

                # Nome file output (sempre .pth per compatibilit√† PyTorch)
                out_name = filename.replace('.npz', '.pth')
                save_path = os.path.join(OUTPUT_DIR, out_name)

                try:
                    feat = None

                    # --- CARICAMENTO ---
                    if fpath.endswith('.npz'):
                        # Logica per .npz
                        with np.load(fpath, allow_pickle=True) as data:
                            keys = list(data.keys())
                            # Cerca la chiave giusta
                            if 'features' in keys: feat_np = data['features']
                            elif 'arr_0' in keys: feat_np = data['arr_0']
                            else: feat_np = data[keys[0]] # Fallback sulla prima

                            # Converti a Tensor
                            if isinstance(feat_np, np.ndarray):
                                feat = torch.from_numpy(feat_np).float()
                            else:
                                feat = torch.tensor(feat_np).float()
                    else:
                        # Logica per .pth
                        feat = torch.load(fpath, map_location=device)
                        if isinstance(feat, dict):
                            for k in ['features', 'feats', 'video_features']:
                                if k in feat:
                                    feat = feat[k]; break
                            else:
                                if len(feat)>0: feat = list(feat.values())[0]

                    # --- CONTROLLI ---
                    if not isinstance(feat, torch.Tensor):
                        print(f"‚ö†Ô∏è {filename}: Formato dati non valido.")
                        continue

                    feat = feat.to(device)
                    # Aggiungi dimensione batch se manca (Time, Feat) -> (1, Time, Feat)
                    if feat.dim() == 2: feat = feat.unsqueeze(0)

                    B, T, F_dim = feat.shape
                    if T == 0: continue # Video vuoto

                    # --- PREPARAZIONE DATI HiERO ---
                    from torch_geometric.data import Data
                    pos = torch.arange(T, device=device, dtype=torch.float).repeat(B)
                    batch = torch.arange(B, device=device).repeat_interleave(T)
                    indices = torch.arange(T, device=device).repeat(B)
                    x_flat = feat.reshape(-1, F_dim)

                    data_obj = Data(x=x_flat, pos=pos, batch=batch, indices=indices)
                    data_obj.mask = torch.ones(x_flat.shape[0], dtype=torch.bool, device=device)

                    # --- INFERENZA ---
                    out_batch = model(data_obj)
                    final_emb = out_batch.x

                    # --- SALVATAGGIO ---
                    torch.save(final_emb.cpu(), save_path)
                    count += 1

                except Exception as e:

                    print(f"‚ö†Ô∏è Errore su {filename}: {e}")

        print(f"\n‚úÖ OPERAZIONE COMPLETATA!")
        print(f"   Salvato {count} file in: {OUTPUT_DIR}")
        print("   (Controlla la cartella 'output_embeddings' a sinistra per scaricarli)")

except Exception as e:
    print(f"\n‚ùå ERRORE IRRECUPERABILE: {e}")

üìÇ Cartella Input Dati: /content/data/egovlp/egovlp_test
üìÇ Cartella Output: /content/output_embeddings

‚öôÔ∏è Configurazione Modello...


  checkpoint = torch.load(ckpt_path, map_location="cpu")


‚úÖ Modello pronto su cuda.

üîç Cerco file .pth e .npz in /content/data/egovlp/egovlp_test...
üìÇ Trovati 10 file totali (0 pth, 10 npz).


 10%|‚ñà         | 1/10 [00:00<00:01,  6.20it/s]

‚ö†Ô∏è Errore su 3_18_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 1_14_360p_224.mp4_1s_1s.npz: 2


100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 10/10 [00:00<00:00, 27.88it/s]

‚ö†Ô∏è Errore su 3_5_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 3_13_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 3_12_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 1_32_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 1_10_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 3_14_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 1_19_360p_224.mp4_1s_1s.npz: 2
‚ö†Ô∏è Errore su 2_28_360p_224.mp4_1s_1s.npz: 2

‚úÖ OPERAZIONE COMPLETATA!
   Salvato 0 file in: /content/output_embeddings
   (Controlla la cartella 'output_embeddings' a sinistra per scaricarli)



