In [24]:
import sys
sys.path.insert(0, '..')

import torch
import os
import wandb
import random
import numpy as np
import torch
from torch import nn
from torch.optim import Adam
from ignite.handlers.param_scheduler import create_lr_scheduler_with_warmup
from torch.utils.data import DataLoader
from datetime import datetime
import matplotlib.pyplot as plt
import pandas as pd
from scipy import stats
from tqdm import tqdm
from matplotlib import cm
import seaborn as sns
import matplotlib.lines as mlines
from sklearn.decomposition import PCA
from openTSNE import TSNE
from PIL import Image
import umap
import torch.nn.functional as F
from scipy.spatial.distance import cdist
from torch.optim.lr_scheduler import ExponentialLR, ReduceLROnPlateau

from core.final.dataset import PSMDataset
from core.final.model import GalSpecNet, MetaModel, Informer, AstroModel
from core.final.trainer import Trainer
from core.final.loss import CLIPLoss

In [19]:
def set_random_seeds(random_seed):
    torch.manual_seed(random_seed)
    torch.cuda.manual_seed(random_seed)
    np.random.seed(random_seed)
    random.seed(random_seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

set_random_seeds(42)

In [44]:
class Model2D(nn.Module):
    def __init__(self, encoder):
        super(Model2D, self).__init__()

        self.encoder = encoder
        
        for param in self.encoder.parameters():
            param.requires_grad = False

        self.p_fc = nn.Linear(encoder.photometry_proj.out_features, 2)
        self.s_fc = nn.Linear(encoder.spectra_proj.out_features, 2)
        self.m_fc = nn.Linear(encoder.metadata_proj.out_features, 2)

    def forward(self, photometry, photometry_mask, spectra, metadata):
        p_emb, s_emb, m_emb = self.encoder.get_embeddings(photometry, photometry_mask, spectra, metadata)
        
        p_emb = self.p_fc(p_emb)
        s_emb = self.s_fc(s_emb)
        m_emb = self.m_fc(m_emb)

        logits_ps = p_emb @ s_emb.T
        logits_sm = s_emb @ m_emb.T
        logits_mp = m_emb @ p_emb.T

        return logits_ps, logits_sm, logits_mp

In [46]:
run_id = 'MeriDK/AstroCLIPResults3/2wz4ysvn'
api = wandb.Api()
run = api.run(run_id)
config = run.config
config['use_wandb'] = False
config['save_weights'] = False

train_dataset = PSMDataset(config, split='train')
val_dataset = PSMDataset(config, split='val')

train_dataloader = DataLoader(train_dataset, batch_size=config['batch_size'], shuffle=True, drop_last=True,
                              num_workers=4)
val_dataloader = DataLoader(val_dataset, batch_size=config['batch_size'], shuffle=False)

device = torch.device('cuda:1' if torch.cuda.is_available() else 'cpu')

encoder = AstroModel(config)
encoder = encoder.to(device)

weights_path = os.path.join(config['weights_path'] + '-' + run_id.split('/')[-1], f'weights-best.pth')
encoder.load_state_dict(torch.load(weights_path, weights_only=False))

<All keys matched successfully>

In [51]:
model = Model2D(encoder)
model = model.to(device)

optimizer = Adam(model.parameters(), lr=0.001)
scheduler = ReduceLROnPlateau(optimizer, mode='min', factor=config['factor'], patience=100)
criterion = CLIPLoss()

In [52]:
trainer = Trainer(model=model, optimizer=optimizer, scheduler=scheduler, warmup_scheduler=None,
                  criterion=criterion, device=device, config=config)

In [49]:
trainer.train_epoch(train_dataloader)

100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:15<00:00,  2.28s/it]


(37.09469858805338, 0.006865530303030303)

In [53]:
for _ in range(10):
    print(trainer.train_epoch(train_dataloader))

100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:13<00:00,  2.24s/it]


(37.39053645278468, 0.006865530303030303)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.02s/it]


(37.12201898748224, 0.006036931818181818)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:11<00:00,  2.16s/it]


(36.51737860477332, 0.004853219696969697)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.03s/it]


(35.68340116558653, 0.005504261363636364)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:14<00:00,  2.27s/it]


(34.80293435761423, 0.006273674242424242)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:12<00:00,  2.20s/it]


(33.982115774443656, 0.007990056818181818)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:05<00:00,  1.99s/it]


(33.29389109756007, 0.008937026515151516)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:11<00:00,  2.17s/it]


(32.77563291607481, 0.00946969696969697)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.03s/it]


(32.39620104703036, 0.010179924242424242)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:13<00:00,  2.23s/it]

(32.10403800733162, 0.011955492424242424)





In [54]:
for _ in range(20):
    print(trainer.train_epoch(train_dataloader))

100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:12<00:00,  2.21s/it]


(31.90328257011645, 0.011541193181818182)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:13<00:00,  2.22s/it]


(31.720818664088394, 0.012251420454545454)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:07<00:00,  2.04s/it]


(31.579286806511156, 0.011955492424242424)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:13<00:00,  2.22s/it]


(31.454520081028793, 0.011541193181818182)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:13<00:00,  2.23s/it]


(31.35578658364036, 0.01260653409090909)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:13<00:00,  2.24s/it]


(31.263608412309125, 0.01278409090909091)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:05<00:00,  1.99s/it]


(31.189086451674953, 0.012133049242424242)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:12<00:00,  2.20s/it]


(31.12359717397979, 0.01201467803030303)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:07<00:00,  2.04s/it]


(31.062447114424273, 0.012369791666666666)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.03s/it]


(31.011917287653144, 0.013139204545454546)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.03s/it]


(30.97715123494466, 0.01231060606060606)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:12<00:00,  2.21s/it]


(30.920073769309305, 0.012902462121212122)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:12<00:00,  2.19s/it]


(30.88878024708141, 0.012488162878787878)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.02s/it]


(30.86374230818315, 0.012902462121212122)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.02s/it]


(30.818633744210906, 0.01337594696969697)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:05<00:00,  2.00s/it]


(30.788153619477242, 0.014382102272727272)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:05<00:00,  1.99s/it]


(30.770468162767816, 0.012843276515151516)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:07<00:00,  2.05s/it]


(30.758460073760062, 0.014145359848484848)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:06<00:00,  2.01s/it]


(30.742785309300277, 0.013671875)


100%|██████████████████████████████████████████████████████████████████████████████████| 33/33 [01:11<00:00,  2.16s/it]

(30.720117915760387, 0.014026988636363636)





In [34]:
model.train()

total_loss = []
total_correct_predictions = 0
total_predictions = 0

for photometry, photometry_mask, spectra, metadata, labels in tqdm(train_dataloader):
    photometry, photometry_mask = photometry.to(device), photometry_mask.to(device)
    spectra, metadata = spectra.to(device), metadata.to(device)

    optimizer.zero_grad()
    logits_ps, logits_sm, logits_mp = model(photometry, photometry_mask, spectra, metadata)
    loss_ps, loss_sm, loss_mp = criterion(logits_ps, logits_sm, logits_mp)
    loss = loss_ps + loss_sm + loss_mp
    loss.backward()

    labels = torch.arange(logits_ps.shape[0], dtype=torch.int64, device=self.device)

    prob_ps = (F.softmax(logits_ps, dim=1) + F.softmax(logits_ps.transpose(-1, -2), dim=1)) / 2
    prob_sm = (F.softmax(logits_sm, dim=1) + F.softmax(logits_sm.transpose(-1, -2), dim=1)) / 2
    prob_mp = (F.softmax(logits_mp, dim=1) + F.softmax(logits_mp.transpose(-1, -2), dim=1)) / 2
    prob = (prob_ps + prob_sm + prob_mp) / 3

    _, pred_labels = torch.max(prob, dim=1)
    correct_predictions = (pred_labels == labels).sum().item()

    total_correct_predictions += correct_predictions
    total_predictions += labels.size(0)
    total_loss.append(loss.item())

  0%|                                                                                           | 0/33 [00:17<?, ?it/s]


ValueError: too many values to unpack (expected 3)

In [35]:
photometry, photometry_mask, spectra, metadata

(tensor([[[ 9.7725e-02,  2.4619e+00,  8.6901e-01,  ...,  2.4105e-01,
           -8.0549e-01,  4.9837e+00],
          [ 9.9355e-02,  4.6826e-01,  8.4984e-01,  ...,  2.4105e-01,
           -8.0549e-01,  4.9837e+00],
          [ 1.0100e-01,  7.1747e-01,  8.4984e-01,  ...,  2.4105e-01,
           -8.0549e-01,  4.9837e+00],
          ...,
          [ 8.2572e-01,  2.0274e+00,  8.6262e-01,  ...,  2.4105e-01,
           -8.0549e-01,  4.9837e+00],
          [ 8.2628e-01,  5.9319e-02,  8.4345e-01,  ...,  2.4105e-01,
           -8.0549e-01,  4.9837e+00],
          [ 8.2683e-01,  6.2162e-01,  8.4984e-01,  ...,  2.4105e-01,
           -8.0549e-01,  4.9837e+00]],
 
         [[ 3.7081e-01, -1.4809e+00,  4.9433e-01,  ..., -4.8143e-02,
           -6.5659e-01,  5.7486e+00],
          [ 3.7173e-01, -1.1317e+00,  5.0340e-01,  ..., -4.8143e-02,
           -6.5659e-01,  5.7486e+00],
          [ 3.7320e-01,  3.4533e+00,  5.7143e-01,  ..., -4.8143e-02,
           -6.5659e-01,  5.7486e+00],
          ...,
    

In [28]:
train_loss, train_acc = trainer.train_epoch(train_dataloader)

  0%|                                                                                           | 0/33 [00:16<?, ?it/s]


ValueError: too many values to unpack (expected 3)

In [32]:
photometry, photometry_mask, spectra, metadata, labels = next(iter(train_dataloader))

with torch.no_grad():
    photometry, photometry_mask = photometry.to(device), photometry_mask.to(device)
    spectra, metadata = spectra.to(device), metadata.to(device)

    trainer.model(photometry, photometry_mask, spectra, metadata)