Prima di eseguire il codice, assicurati di seguire questi passaggi:
-
Struttura cartelle
- All’interno di
src/data, crea la seguente struttura:src/data/dataset/ogbl_biokg - Scarica dal Drive il file
load_data.zipe decomprimilo nella cartellaogbl_biokg.
- All’interno di
-
Cartella dei risultati
- All’interno di
graph-alignment, crea una cartellaruns. - Inserisci in
runsle seguenti cartelle scaricate dal Drive:vgae-infomaxdinosupervised
- All’interno di
-
Creazione ambiente conda
- Crea l'ambiente conda dal file
environment.yaml
- Crea l'ambiente conda dal file
Configura il file config_yaml con i seguenti parametri:
model: scegli traDINO,DeepGraphInfomax,Supervisedlayer: scegli traGIN,Transformern_layers: imposta il numero di layer (modifica il loader di conseguenza)norm_layer: scegli traBatchNorm1d,LayerNormact_layer: scegli traGELU,ReLU,ELU,SiLUloader.batch_size: imposta la dimensione del batchloader.n_neighbors: definisci il numero di vicini caricati a ogni layerdrug_disease,drug_side_effect,disease_protein,function_function: in caso di modello Supervised, impostare a True solo il task target del training.- altri hyperparametri di training
Dopo aver configurato il file YAML, esegui il training con:
python training.pyPer valutare l’allineamento delle rappresentazioni tra modelli:
-
Modifica il file
config_alignment.yaml:-
Nella sezione
models, specifica i modelli per cui vuoi misurare:- Allineamento intra-bucket (tra modelli supervised e tra modelli unsupervised)
- Allineamento inter-bucket (all vs all)
-
Nella sezione
align_to_one:left_models: i modelli di riferimento (quelli a cui allineare)right_models: i modelli da confrontare (quelli che verranno allineati)
-
-
Esegui il seguente comando:
python alignment_plots.py config_alignment.yaml