In [7]:
import torchvision
print(torchvision.__version__)

0.21.0+cu124


In [1]:
from utils import Config
from data_loader import MultiOmicsDataset, create_dataloaders

In [26]:
# # Reload all modules every time before executing code
%load_ext autoreload
%autoreload 2  

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


### 1. Test Config class

In [3]:
config = Config.from_yaml("configs/data_config.yaml")
config

Config({'data_dir': './data/clean_data', 'omics': Config({'methyl': Config({'file': 'methy.csv', 'dtype': 'float32', 'reshape': [50, 100]}), 'mirna': Config({'file': 'mirna.csv', 'dtype': 'float32'}), 'rna': Config({'file': 'exp.csv', 'dtype': 'float32'})}), 'labels': Config({'file': 'label.csv', 'dtype': 'int16', 'squeeze': True}), 'loader': Config({'batch_size': 64, 'num_workers': 8, 'seed': 42, 'splits': Config({'train': 0.7, 'val': 0.15, 'test': 0.15})})})

In [4]:
dataset = MultiOmicsDataset(config)

In [5]:
[(name, x.shape) for name, x in dataset.data.items()]

[('methyl', (439, 50, 100)), ('mirna', (439, 1046)), ('rna', (439, 13054))]

In [6]:
config_mirna = Config.from_yaml("configs/data_config_mirna.yaml")
config_mirna

Config({'data_dir': './data/clean_data', 'omics': Config({'mirna': Config({'file': 'mirna.csv', 'dtype': 'float32'})}), 'labels': Config({'file': 'label.csv', 'dtype': 'int16', 'squeeze': True})})

In [7]:
dataset_mirna  =  MultiOmicsDataset(config_mirna)

In [8]:
dataset_mirna[1] 

({'mirna': tensor([13.0402, 14.0594, 13.0643,  ...,  6.0753,  9.3519, 16.5759])},
 tensor(0))

### 2. Test Dataset and dataloader

In [9]:
config = Config.from_yaml("configs/data_config_wo_reshape.yaml")

In [10]:
dataset = MultiOmicsDataset(config)

In [26]:
dataloaders = create_dataloaders(dataset, config)

In [27]:
# Check if wi_reshpae option works

config = Config.from_yaml("configs/data_config.yaml")

dataset = MultiOmicsDataset(config)
dataloaders = create_dataloaders(dataset, config)

for batch in dataloaders['train']:
    batch_data, batch_labels = batch
    
    print(batch_data['methyl'].shape) # Shape: (B, C, H, W)
    print( batch_data['rna'].shape)   

torch.Size([64, 1, 50, 100])
torch.Size([64, 13054])
torch.Size([64, 1, 50, 100])
torch.Size([64, 13054])
torch.Size([64, 1, 50, 100])
torch.Size([64, 13054])
torch.Size([64, 1, 50, 100])
torch.Size([64, 13054])
torch.Size([51, 1, 50, 100])
torch.Size([51, 13054])


In [29]:
# Check if wo_reshpae option works

config = Config.from_yaml("configs/data_config_wo_reshape.yaml")

dataset = MultiOmicsDataset(config)
dataloaders = create_dataloaders(dataset, config)

dataset = MultiOmicsDataset(config)
for batch in dataloaders['train']:
    batch_data, batch_labels = batch
    
    print(batch_data['methyl'].shape) 
    print( batch_data['rna'].shape) 

torch.Size([64, 1, 5000])
torch.Size([64, 13054])
torch.Size([64, 1, 5000])
torch.Size([64, 13054])
torch.Size([64, 1, 5000])
torch.Size([64, 13054])
torch.Size([64, 1, 5000])
torch.Size([64, 13054])
torch.Size([51, 1, 5000])
torch.Size([51, 13054])


### 3. Test VAEencoder

In [33]:

from models.vae import VAEEncoder  # adjust the import path to match your repo

# Choose modality: "mirna" or "rna"
modality = "mirna"  # ← change this as needed

# Load config and dataset
config = Config.from_yaml("configs/data_config_wo_reshape.yaml")
input_dim = 1046
latent_dim = 64

dataset = MultiOmicsDataset(config)
dataloaders = create_dataloaders(dataset, config)

# Instantiate VAE
vae = VAEEncoder(input_dim=input_dim, latent_dim=latent_dim)
vae.eval()

# Test VAE with one batch
for batch_data, batch_labels in dataloaders["train"]:
    x = batch_data[modality]
    print("Input shape:", x.shape)

    with torch.no_grad():
        z, mu, logvar = vae(x)
        kl = vae.kl_divergence(mu, logvar)

    print("✅ z shape:     ", z.shape)
    print("✅ mu shape:    ", mu.shape)
    print("✅ logvar shape:", logvar.shape)
    print("✅ KL divergence:", kl.item())

    assert z.shape == (x.size(0), latent_dim)
    assert mu.shape == logvar.shape == (x.size(0), latent_dim)

    break  # just test one batch



Input shape: torch.Size([64, 1046])
✅ z shape:      torch.Size([64, 64])
✅ mu shape:     torch.Size([64, 64])
✅ logvar shape: torch.Size([64, 64])
✅ KL divergence: nan


### 4. Test convnext model

In [29]:
import torch
from models import MiniConvNeXtMethylation  # adjust path as needed


# Load config
config = Config.from_yaml("configs/data_config.yaml")


# Load dataset and dataloaders
dataset = MultiOmicsDataset(config)
dataloaders = create_dataloaders(dataset, config)

# Instantiate encoder (output latent dim should match your model)
latent_dim = 64
model = MiniConvNeXtMethylation(latent_dim=latent_dim)
model.eval()  # optional: disable dropout, etc.

# Test one batch from training data
for batch_data, batch_labels in dataloaders["train"]:
    methyl_batch = batch_data["methyl"]  # shape: (B, 1, 50, 100)
    
    # Forward pass
    with torch.no_grad():
        out = model(methyl_batch)

    print("✅ Input shape: ", methyl_batch.shape)
    print("✅ Output shape:", out.shape)

    # Optional: assert expected output shape
    assert out.shape == (methyl_batch.size(0), latent_dim), \
        f"Expected output shape ({methyl_batch.size(0)}, {latent_dim}), but got {out.shape}"

    break  # only test one batch


✅ Input shape:  torch.Size([64, 1, 50, 100])
✅ Output shape: torch.Size([64, 64])


### 5. Test MultimodalFusion

In [35]:
import torch
from models import MultimodalFusion  # adjust path as needed

def test_multimodal_fusion():
    batch_size = 8
    latent_dim = 64

    # Simulated modality embeddings (from encoder output)
    methy = torch.randn(batch_size, latent_dim)
    mirna = torch.randn(batch_size, latent_dim)
    rna   = torch.randn(batch_size, latent_dim)

    # Instantiate fusion module
    fusion_model = MultimodalFusion(latent_dim=latent_dim, num_heads=4)
    fusion_model.eval()

    # Forward pass
    with torch.no_grad():
        fused = fusion_model([methy, mirna, rna])

    print("✅ Input shapes: methy", methy.shape, "mirna", mirna.shape, "rna", rna.shape)
    print("✅ Fused output shape:", fused.shape)

    # Assertions
    assert fused.shape == (batch_size, latent_dim), \
        f"Expected output shape ({batch_size}, {latent_dim}), but got {fused.shape}"

    print("✅ MultimodalFusion test passed!")

# Run the test
test_multimodal_fusion()


✅ Input shapes: methy torch.Size([8, 64]) mirna torch.Size([8, 64]) rna torch.Size([8, 64])
✅ Fused output shape: torch.Size([8, 64])
✅ MultimodalFusion test passed!


In [44]:

from models import MiniConvNeXtMethylation, VAEEncoder, MultimodalFusion


def test_fusion_with_real_data():
    # Load config and dataset
    config = Config.from_yaml("configs/data_config.yaml")
    dataloaders = create_dataloaders(MultiOmicsDataset(config), config)
    
    # Get model input dims
    mirna_dim = 1046
    rna_dim = 13054
    methy_shape = (50, 100)  # e.g., (50, 100)
    latent_dim = 64

    # Initialize encoders
    methy_encoder = MiniConvNeXtMethylation(latent_dim=latent_dim, input_size=methy_shape)
    mirna_encoder = VAEEncoder(input_dim=mirna_dim, latent_dim=latent_dim)
    rna_encoder = VAEEncoder(input_dim=rna_dim, latent_dim=latent_dim)

    # Fusion model
    fusion_model = MultimodalFusion(latent_dim=latent_dim, num_heads=4)

    # Get one batch from train loader
    for batch_data, batch_labels in dataloaders['train']:
        x_methy = batch_data['methyl']  # shape: [B, 1, 50, 100]
        x_mirna = batch_data['mirna']   # shape: [B, mirna_dim]
        x_rna   = batch_data['rna']     # shape: [B, rna_dim]

        # Encode each modality
        with torch.no_grad():
            z_methy = methy_encoder(x_methy)
            z_mirna, _, _ = mirna_encoder(x_mirna)
            z_rna, _, _ = rna_encoder(x_rna)

            # Fuse features
            fused = fusion_model([z_methy, z_mirna, z_rna])

        # Print and assert
        print("✅ Encoded methylation:", z_methy.shape)
        print("✅ Encoded mirna:      ", z_mirna.shape)
        print("✅ Encoded rna:        ", z_rna.shape)
        print("✅ Fused output shape: ", fused.shape)

        assert fused.shape == (x_methy.size(0), latent_dim), "Fused output shape mismatch"
        print("✅ Real-data MultimodalFusion test passed!")

        break  # only one batch

# Run the test
test_fusion_with_real_data()


✅ Encoded methylation: torch.Size([64, 64])
✅ Encoded mirna:       torch.Size([64, 64])
✅ Encoded rna:         torch.Size([64, 64])
✅ Fused output shape:  torch.Size([64, 64])
✅ Real-data MultimodalFusion test passed!


### 6. Test MultiOmicsClassifier

In [3]:
from models import MultiOmicsClassifier  # adjust import
import torch

def test_multiomics_classifier():
    # Define input sizes
    batch_size = 4
    mirna_dim = 1046
    rna_exp_dim = 13054
    methy_shape = (50, 100)  # e.g., (50, 100)
    latent_dim = 64
    num_classes = 4

    # Instantiate the model
    model = MultiOmicsClassifier(
        mirna_dim=mirna_dim,
        rna_exp_dim=rna_exp_dim,
        methy_shape=methy_shape,
        latent_dim=latent_dim,
        num_classes=num_classes
    )
    model.eval()

    # Create fake input tensors
    x_methy = torch.randn(batch_size, 1, *methy_shape)
    x_mirna = torch.randn(batch_size, mirna_dim)
    x_rna = torch.randn(batch_size, rna_exp_dim)

    # Forward pass
    with torch.no_grad():
        outputs = model(x_methy, x_mirna, x_rna)

    # Assertions
    assert outputs['logits'].shape == (batch_size, num_classes), "❌ logits shape mismatch"
    assert outputs['mu_mirna'].shape == (batch_size, latent_dim), "❌ mu_mirna shape mismatch"
    assert outputs['logvar_mirna'].shape == (batch_size, latent_dim), "❌ logvar_mirna shape mismatch"
    assert outputs['mu_rna'].shape == (batch_size, latent_dim), "❌ mu_rna shape mismatch"
    assert outputs['logvar_rna'].shape == (batch_size, latent_dim), "❌ logvar_rna shape mismatch"

    # Print confirmations
    print("✅ logits shape:", outputs['logits'].shape)
    print("✅ mu_mirna shape:", outputs['mu_mirna'].shape)
    print("✅ mu_rna shape:", outputs['mu_rna'].shape)
    print("✅ MultiOmicsClassifier test passed!")

# Run the test
test_multiomics_classifier()



✅ logits shape: torch.Size([4, 4])
✅ mu_mirna shape: torch.Size([4, 64])
✅ mu_rna shape: torch.Size([4, 64])
✅ MultiOmicsClassifier test passed!


In [51]:

def test_multiomics_classifier_with_real_data():
    # Load config and dataset
    config = Config.from_yaml("configs/data_config.yaml")
    dataloaders = create_dataloaders(MultiOmicsDataset(config), config)

    # Get model input sizes from config
    # mirna_dim = config['omics']['mirna']['dim']
    # rna_exp_dim = config['omics']['rna']['dim']
    # methy_shape = tuple(config['omics']['methyl']['reshape'])  # e.g., (50, 100)
    # latent_dim = 64
    # num_classes = config['labels']['num_classes'] if 'num_classes' in config['labels'] else 4

    batch_size = 4
    mirna_dim = 1046
    rna_exp_dim = 13054
    methy_shape = (50, 100)  # e.g., (50, 100)
    latent_dim = 64
    num_classes = 4

    # Instantiate model
    model = MultiOmicsClassifier(
        mirna_dim=mirna_dim,
        rna_exp_dim=rna_exp_dim,
        methy_shape=methy_shape,
        latent_dim=latent_dim,
        num_classes=num_classes
    )
    model.eval()

    # Test one batch from dataloader
    for batch_data, batch_labels in dataloaders["train"]:
        x_methy = batch_data["methyl"]
        x_mirna = batch_data["mirna"]
        x_rna   = batch_data["rna"]

        with torch.no_grad():
            outputs = model(x_methy, x_mirna, x_rna)

        # Assertions
        assert outputs['logits'].shape == (x_methy.size(0), num_classes)
        assert outputs['mu_mirna'].shape == outputs['logvar_mirna'].shape == (x_methy.size(0), latent_dim)
        assert outputs['mu_rna'].shape == outputs['logvar_rna'].shape == (x_methy.size(0), latent_dim)

        # Print results
        print("✅ Real-batch MultiOmicsClassifier forward test:")
        print("   Logits shape:     ", outputs['logits'].shape)
        print("   mu_mirna shape:   ", outputs['mu_mirna'].shape)
        print("   mu_rna shape:     ", outputs['mu_rna'].shape)
        break  # just test one batch

# Run the test
test_multiomics_classifier_with_real_data()


✅ Real-batch MultiOmicsClassifier forward test:
   Logits shape:      torch.Size([64, 4])
   mu_mirna shape:    torch.Size([64, 64])
   mu_rna shape:      torch.Size([64, 64])


### 7. Run pytest

In [4]:
%%bash
pytest -v


platform linux -- Python 3.11.11, pytest-8.3.5, pluggy-1.5.0 -- /home/CBBI/wangh5/miniforge3/envs/cs7643_a4_generative/bin/python3.11
cachedir: .pytest_cache
rootdir: /home/CBBI/wangh5/_PyCharm/proj_dl
configfile: pytest.ini
plugins: anyio-4.9.0
[1mcollecting ... [0mcollected 5 items

tests/test_02_model_components.py::test_vae_forward [32mPASSED[0m[32m               [ 20%][0m
tests/test_02_model_components.py::test_mirna_vae_forward [32mPASSED[0m[32m         [ 40%][0m
tests/test_02_model_components.py::test_mini_convnext [32mPASSED[0m[32m             [ 60%][0m
tests/test_02_model_components.py::test_transformer_fusion [32mPASSED[0m[32m        [ 80%][0m
tests/test_02_model_components.py::test_fusion_classifier [32mPASSED[0m[32m         [100%][0m



In [1]:
import torch
from utils import Config
from data_loader import MultiOmicsDataset, create_dataloaders
from models import MultiOmicsClassifier 

In [2]:
from trainers import BaseTrainer
from losses import MultiOmicsLoss

In [3]:
config = Config.from_yaml("configs/data_config.yaml")

dataset = MultiOmicsDataset(config)
dataloaders = create_dataloaders(dataset, config)



In [4]:
batch_size = 4
mirna_dim = 1046
rna_exp_dim = 13054
methy_shape = (50, 100)  # e.g., (50, 100)
latent_dim = 64
num_classes = 5

# Instantiate model
multiomics_model = MultiOmicsClassifier(
    mirna_dim=mirna_dim,
    rna_exp_dim=rna_exp_dim,
    methy_shape=methy_shape,
    latent_dim=latent_dim,
    num_classes=num_classes
)

In [14]:
trainer = BaseTrainer(
    model=multiomics_model,
    optimizer=torch.optim.Adam(multiomics_model.parameters(), lr=2e-5),
    loss_fn=MultiOmicsLoss(),
    device='cuda'
)

trainer.fit(train_loader=dataloaders['train'], val_loader=dataloaders['val'], epochs=20)



Epoch 1/20


  'beta': torch.tensor(self.beta, device=self.current_step.device)
Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.40it/s, loss=0.0388]


[DEBUG] CE: 0.0330, KL_mirna: 10.3765, KL_rna: 19.4689
[DEBUG] CE: 0.0443, KL_mirna: 11.0556, KL_rna: 20.4731
[DEBUG] CE: 0.0319, KL_mirna: 11.0932, KL_rna: 20.9168
[DEBUG] CE: 0.0273, KL_mirna: 11.3598, KL_rna: 20.1461
[DEBUG] CE: 0.0377, KL_mirna: 10.9328, KL_rna: 17.5019
Train Loss: 0.0355


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.14it/s]


[DEBUG] CE: 0.6272, KL_mirna: 6.4601, KL_rna: 15.1710
[DEBUG] CE: 0.2024, KL_mirna: 5.2704, KL_rna: 14.2754
Val Loss:   0.4159

Epoch 2/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 12.79it/s, loss=0.0661]

[DEBUG] CE: 0.0306, KL_mirna: 10.8185, KL_rna: 21.8646
[DEBUG] CE: 0.0403, KL_mirna: 11.3067, KL_rna: 20.0635
[DEBUG] CE: 0.0259, KL_mirna: 11.9370, KL_rna: 21.9443
[DEBUG] CE: 0.0326, KL_mirna: 11.9157, KL_rna: 21.8530
[DEBUG] CE: 0.0627, KL_mirna: 12.0789, KL_rna: 18.8194


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.14it/s, loss=0.0661]


Train Loss: 0.0414


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.01it/s]


[DEBUG] CE: 0.4437, KL_mirna: 6.4762, KL_rna: 14.8045
[DEBUG] CE: 0.0502, KL_mirna: 5.3521, KL_rna: 13.1083
Val Loss:   0.2494

Epoch 3/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 13.75it/s, loss=0.0305]

[DEBUG] CE: 0.0206, KL_mirna: 11.1348, KL_rna: 22.3019
[DEBUG] CE: 0.0314, KL_mirna: 11.2031, KL_rna: 21.4499
[DEBUG] CE: 0.0202, KL_mirna: 11.7427, KL_rna: 22.0031
[DEBUG] CE: 0.0391, KL_mirna: 11.8407, KL_rna: 21.3725
[DEBUG] CE: 0.0243, KL_mirna: 11.6211, KL_rna: 22.8478


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.70it/s, loss=0.0305]


Train Loss: 0.0325


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.54it/s]


[DEBUG] CE: 0.4835, KL_mirna: 6.5299, KL_rna: 15.3804
[DEBUG] CE: 0.5127, KL_mirna: 5.4663, KL_rna: 12.7222
Val Loss:   0.5020

Epoch 4/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.06it/s, loss=0.0463]

[DEBUG] CE: 0.0268, KL_mirna: 11.5958, KL_rna: 22.3432
[DEBUG] CE: 0.0261, KL_mirna: 11.6548, KL_rna: 22.4181
[DEBUG] CE: 0.0312, KL_mirna: 11.1737, KL_rna: 23.1062
[DEBUG] CE: 0.0192, KL_mirna: 10.8270, KL_rna: 20.4509
[DEBUG] CE: 0.0374, KL_mirna: 11.8502, KL_rna: 23.9759
Train Loss: 0.0359



Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.47it/s]


[DEBUG] CE: 0.4103, KL_mirna: 6.5856, KL_rna: 15.9778
[DEBUG] CE: 1.8001, KL_mirna: 5.4520, KL_rna: 12.0945
Val Loss:   1.1105

Epoch 5/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.15it/s, loss=0.0418]

[DEBUG] CE: 0.0227, KL_mirna: 12.5636, KL_rna: 21.7938
[DEBUG] CE: 0.0296, KL_mirna: 11.7897, KL_rna: 24.4327
[DEBUG] CE: 0.0281, KL_mirna: 11.9000, KL_rna: 22.7658
[DEBUG] CE: 0.0226, KL_mirna: 11.5850, KL_rna: 24.8354
[DEBUG] CE: 0.0322, KL_mirna: 10.7822, KL_rna: 19.0238
Train Loss: 0.0373



Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.87it/s]


[DEBUG] CE: 0.5679, KL_mirna: 6.5937, KL_rna: 16.1474
[DEBUG] CE: 0.0175, KL_mirna: 5.4432, KL_rna: 10.7617
Val Loss:   0.2992

Epoch 6/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 12.70it/s, loss=0.0309]

[DEBUG] CE: 0.0235, KL_mirna: 11.0401, KL_rna: 22.3334
[DEBUG] CE: 0.0255, KL_mirna: 12.7223, KL_rna: 24.9851
[DEBUG] CE: 0.0278, KL_mirna: 12.0804, KL_rna: 23.9766
[DEBUG] CE: 0.0296, KL_mirna: 11.4176, KL_rna: 23.1180
[DEBUG] CE: 0.0170, KL_mirna: 11.3166, KL_rna: 24.3735


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  8.97it/s, loss=0.0309]


Train Loss: 0.0378


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.78it/s]


[DEBUG] CE: 0.5057, KL_mirna: 6.6182, KL_rna: 16.3453
[DEBUG] CE: 0.1112, KL_mirna: 5.2967, KL_rna: 9.6775
Val Loss:   0.3161

Epoch 7/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.76it/s, loss=0.0389]

[DEBUG] CE: 0.0235, KL_mirna: 11.7584, KL_rna: 24.7989
[DEBUG] CE: 0.0321, KL_mirna: 11.4437, KL_rna: 23.5788
[DEBUG] CE: 0.0253, KL_mirna: 11.7019, KL_rna: 22.2047
[DEBUG] CE: 0.0319, KL_mirna: 11.3890, KL_rna: 22.9551
[DEBUG] CE: 0.0222, KL_mirna: 11.6827, KL_rna: 24.7504





Train Loss: 0.0425


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.06it/s]


[DEBUG] CE: 0.4905, KL_mirna: 6.6048, KL_rna: 15.9127
[DEBUG] CE: 0.4796, KL_mirna: 5.2505, KL_rna: 10.4467
Val Loss:   0.4941

Epoch 8/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.26it/s, loss=0.0496]

[DEBUG] CE: 0.0296, KL_mirna: 11.7447, KL_rna: 23.7765
[DEBUG] CE: 0.0204, KL_mirna: 11.5281, KL_rna: 23.0570
[DEBUG] CE: 0.0188, KL_mirna: 13.0813, KL_rna: 23.4500
[DEBUG] CE: 0.0272, KL_mirna: 10.5005, KL_rna: 24.8933
[DEBUG] CE: 0.0289, KL_mirna: 12.4135, KL_rna: 26.5158
Train Loss: 0.0435



Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.80it/s]


[DEBUG] CE: 0.5139, KL_mirna: 6.5806, KL_rna: 15.7508
[DEBUG] CE: 0.1083, KL_mirna: 5.1432, KL_rna: 12.5479
Val Loss:   0.3220

Epoch 9/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 13.20it/s, loss=0.0457]

[DEBUG] CE: 0.0268, KL_mirna: 11.7161, KL_rna: 24.2653
[DEBUG] CE: 0.0272, KL_mirna: 11.5227, KL_rna: 24.6175
[DEBUG] CE: 0.0167, KL_mirna: 11.1409, KL_rna: 22.8269
[DEBUG] CE: 0.0305, KL_mirna: 11.6972, KL_rna: 24.2728
[DEBUG] CE: 0.0255, KL_mirna: 11.8036, KL_rna: 21.8259


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.33it/s, loss=0.0457]


Train Loss: 0.0457


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.98it/s]


[DEBUG] CE: 0.7101, KL_mirna: 6.5448, KL_rna: 15.7175
[DEBUG] CE: 2.1920, KL_mirna: 5.0905, KL_rna: 13.6380
Val Loss:   1.4637

Epoch 10/20


Training: 100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.58it/s, loss=0.05]


[DEBUG] CE: 0.0224, KL_mirna: 11.2557, KL_rna: 22.0309
[DEBUG] CE: 0.0228, KL_mirna: 11.8356, KL_rna: 26.2133
[DEBUG] CE: 0.0249, KL_mirna: 11.7595, KL_rna: 24.7451
[DEBUG] CE: 0.0198, KL_mirna: 11.5340, KL_rna: 22.1421
[DEBUG] CE: 0.0251, KL_mirna: 12.2826, KL_rna: 24.9185
Train Loss: 0.0463


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.43it/s]


[DEBUG] CE: 0.5761, KL_mirna: 6.5020, KL_rna: 15.6264
[DEBUG] CE: 0.3509, KL_mirna: 5.0140, KL_rna: 13.6579
Val Loss:   0.4774

Epoch 11/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.19it/s, loss=0.0487]


[DEBUG] CE: 0.0267, KL_mirna: 12.1388, KL_rna: 23.3115
[DEBUG] CE: 0.0205, KL_mirna: 11.8117, KL_rna: 23.6742
[DEBUG] CE: 0.0204, KL_mirna: 12.0105, KL_rna: 23.9650
[DEBUG] CE: 0.0223, KL_mirna: 11.6047, KL_rna: 23.6088
[DEBUG] CE: 0.0244, KL_mirna: 10.7270, KL_rna: 22.0984
Train Loss: 0.0480


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.38it/s]


[DEBUG] CE: 0.5740, KL_mirna: 6.4902, KL_rna: 16.0713
[DEBUG] CE: 0.7221, KL_mirna: 4.8835, KL_rna: 13.8036
Val Loss:   0.6636

Epoch 12/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 14.47it/s, loss=0.0504]

[DEBUG] CE: 0.0213, KL_mirna: 11.7943, KL_rna: 23.2142
[DEBUG] CE: 0.0214, KL_mirna: 11.5630, KL_rna: 23.3738
[DEBUG] CE: 0.0202, KL_mirna: 11.3084, KL_rna: 22.1520
[DEBUG] CE: 0.0230, KL_mirna: 11.8910, KL_rna: 23.4172
[DEBUG] CE: 0.0201, KL_mirna: 11.6353, KL_rna: 25.8528


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.03it/s, loss=0.0504]


Train Loss: 0.0491


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.09it/s]


[DEBUG] CE: 0.5037, KL_mirna: 6.4460, KL_rna: 15.8074
[DEBUG] CE: 1.8426, KL_mirna: 4.7914, KL_rna: 13.7179
Val Loss:   1.1900

Epoch 13/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.17it/s, loss=0.0493]


[DEBUG] CE: 0.0277, KL_mirna: 11.6934, KL_rna: 23.0383
[DEBUG] CE: 0.0199, KL_mirna: 10.5618, KL_rna: 22.5558
[DEBUG] CE: 0.0202, KL_mirna: 11.0439, KL_rna: 20.2204
[DEBUG] CE: 0.0263, KL_mirna: 12.7588, KL_rna: 23.2768
[DEBUG] CE: 0.0185, KL_mirna: 11.2398, KL_rna: 23.7994
Train Loss: 0.0518


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.25it/s]


[DEBUG] CE: 0.4280, KL_mirna: 6.3945, KL_rna: 15.3313
[DEBUG] CE: 0.9935, KL_mirna: 4.7373, KL_rna: 13.0441
Val Loss:   0.7285

Epoch 14/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 12.43it/s, loss=0.0504]

[DEBUG] CE: 0.0274, KL_mirna: 11.3767, KL_rna: 21.9631
[DEBUG] CE: 0.0384, KL_mirna: 11.0588, KL_rna: 20.5234
[DEBUG] CE: 0.0206, KL_mirna: 10.9233, KL_rna: 21.9165
[DEBUG] CE: 0.0180, KL_mirna: 12.1131, KL_rna: 22.6089
[DEBUG] CE: 0.0207, KL_mirna: 10.8237, KL_rna: 20.4503


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  8.91it/s, loss=0.0504]


Train Loss: 0.0555


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.84it/s]


[DEBUG] CE: 0.5236, KL_mirna: 6.3605, KL_rna: 15.0632
[DEBUG] CE: 0.0178, KL_mirna: 4.6288, KL_rna: 8.8483
Val Loss:   0.2875

Epoch 15/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.00it/s, loss=0.0511]


[DEBUG] CE: 0.0310, KL_mirna: 10.2967, KL_rna: 20.5909
[DEBUG] CE: 0.0272, KL_mirna: 11.5864, KL_rna: 20.1890
[DEBUG] CE: 0.0226, KL_mirna: 11.9459, KL_rna: 22.7195
[DEBUG] CE: 0.0201, KL_mirna: 10.5539, KL_rna: 20.8986
[DEBUG] CE: 0.0188, KL_mirna: 11.3507, KL_rna: 20.3714
Train Loss: 0.0560


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.34it/s]


[DEBUG] CE: 0.6317, KL_mirna: 6.2626, KL_rna: 14.7423
[DEBUG] CE: 0.0087, KL_mirna: 4.5891, KL_rna: 9.6726
Val Loss:   0.3384

Epoch 16/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.95it/s, loss=0.0659]


[DEBUG] CE: 0.0227, KL_mirna: 10.2059, KL_rna: 20.6504
[DEBUG] CE: 0.0188, KL_mirna: 11.8920, KL_rna: 18.5038
[DEBUG] CE: 0.0222, KL_mirna: 10.5541, KL_rna: 20.1614
[DEBUG] CE: 0.0184, KL_mirna: 11.2946, KL_rna: 20.6673
[DEBUG] CE: 0.0295, KL_mirna: 11.2076, KL_rna: 22.1587
Train Loss: 0.0560


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.94it/s]


[DEBUG] CE: 0.4561, KL_mirna: 6.1685, KL_rna: 14.2167
[DEBUG] CE: 0.2289, KL_mirna: 4.4978, KL_rna: 10.4542
Val Loss:   0.3620

Epoch 17/20


Training: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 12.85it/s, loss=0.061]

[DEBUG] CE: 0.0224, KL_mirna: 10.5991, KL_rna: 19.2271
[DEBUG] CE: 0.0166, KL_mirna: 10.4221, KL_rna: 19.4146
[DEBUG] CE: 0.0265, KL_mirna: 11.3822, KL_rna: 20.0710
[DEBUG] CE: 0.0287, KL_mirna: 11.1882, KL_rna: 21.4158
[DEBUG] CE: 0.0247, KL_mirna: 10.8523, KL_rna: 20.4047


Training: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.16it/s, loss=0.061]


Train Loss: 0.0591


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.06it/s]


[DEBUG] CE: 0.5499, KL_mirna: 6.0756, KL_rna: 13.5117
[DEBUG] CE: 0.0381, KL_mirna: 4.4320, KL_rna: 11.2242
Val Loss:   0.3147

Epoch 18/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.45it/s, loss=0.0674]

[DEBUG] CE: 0.0188, KL_mirna: 11.1836, KL_rna: 21.8569
[DEBUG] CE: 0.0309, KL_mirna: 10.7881, KL_rna: 20.0292
[DEBUG] CE: 0.0188, KL_mirna: 11.1532, KL_rna: 18.3491
[DEBUG] CE: 0.0245, KL_mirna: 11.1548, KL_rna: 18.8325
[DEBUG] CE: 0.0283, KL_mirna: 10.8345, KL_rna: 20.9299





Train Loss: 0.0618


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.08it/s]


[DEBUG] CE: 0.6085, KL_mirna: 5.9733, KL_rna: 12.7832
[DEBUG] CE: 0.0283, KL_mirna: 4.4088, KL_rna: 13.7113
Val Loss:   0.3414

Epoch 19/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 13.90it/s, loss=0.0528]

[DEBUG] CE: 0.0163, KL_mirna: 11.0595, KL_rna: 18.2399
[DEBUG] CE: 0.0227, KL_mirna: 10.1272, KL_rna: 20.0563
[DEBUG] CE: 0.0277, KL_mirna: 11.5354, KL_rna: 19.8193
[DEBUG] CE: 0.0605, KL_mirna: 10.6824, KL_rna: 19.4055
[DEBUG] CE: 0.0165, KL_mirna: 10.9697, KL_rna: 16.9696


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00,  9.93it/s, loss=0.0528]


Train Loss: 0.0669


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  5.10it/s]


[DEBUG] CE: 0.7433, KL_mirna: 5.8774, KL_rna: 12.5761
[DEBUG] CE: 0.8620, KL_mirna: 4.3379, KL_rna: 15.0551
Val Loss:   0.8275

Epoch 20/20


Training: 100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:00<00:00, 10.10it/s, loss=0.0729]


[DEBUG] CE: 0.0231, KL_mirna: 11.2375, KL_rna: 18.7006
[DEBUG] CE: 0.0231, KL_mirna: 10.2531, KL_rna: 19.3038
[DEBUG] CE: 0.0272, KL_mirna: 10.4292, KL_rna: 18.4801
[DEBUG] CE: 0.0204, KL_mirna: 10.3263, KL_rna: 18.6598
[DEBUG] CE: 0.0340, KL_mirna: 11.1221, KL_rna: 17.2793
Train Loss: 0.0649


Validation: 100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 2/2 [00:00<00:00,  4.81it/s]

[DEBUG] CE: 0.6081, KL_mirna: 5.8226, KL_rna: 12.4856
[DEBUG] CE: 0.4399, KL_mirna: 4.2448, KL_rna: 14.9770
Val Loss:   0.5500





In [15]:
preds, targets = trainer.predict(dataloaders["test"])

# Compute accuracy
from sklearn.metrics import accuracy_score

acc = accuracy_score(targets.numpy(), preds.numpy())
print(f"✅ Test Accuracy: {acc:.4f}")


✅ Test Accuracy: 0.8182


In [16]:
from sklearn.metrics import classification_report
print(classification_report(targets.numpy(), preds.numpy()))


              precision    recall  f1-score   support

           0       0.83      0.86      0.85        29
           1       0.79      0.73      0.76        15
           2       0.90      1.00      0.95         9
           3       0.73      0.89      0.80         9
           4       1.00      0.25      0.40         4

    accuracy                           0.82        66
   macro avg       0.85      0.75      0.75        66
weighted avg       0.83      0.82      0.81        66

