# Specializētā derivatīvās morfoloģijas modeļa prototips

In [None]:
# Autors: Ronalds Turnis
# Specializēta modeļa inicializācija, pamatapmācība un pielāgošana derivatīvās morfoloģijas vajadzībām latviešu valodā

# Importē nepieciešamās bibliotēkas
import os, math, random, optuna, csv, urllib.parse, requests
import torch, torch.nn as nn
import torch.optim as optim
import pandas as pd
from torch.optim import AdamW
from torch.utils.data import Dataset, DataLoader
from torch.utils.tensorboard import SummaryWriter
from transformers import PreTrainedTokenizer
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts, ReduceLROnPlateau
from torch.amp import autocast, GradScaler
from tqdm import tqdm
from sklearn.model_selection import train_test_split
from optuna.exceptions import TrialPruned
from torch.utils.data import Subset
from peft import LoraConfig, get_peft_model, PeftModel

# TF32 režīms ātrākiem aprēķiniem
torch.backends.cuda.matmul.allow_tf32 = True
torch.set_float32_matmul_precision("high")

# Slēdži
run_optuna = False # Optuna hiperparametru algoritma slēdzis
pretrain = False # Pamatapmācības slēdzis
finetune = True # Pielāgošanas slēdzis
experiment = True # Eksperimenta izpildes slēdzis

# Fiksēta sēkla rezultātu atkārtojamībai
def set_seed(seed = 42):
    random.seed(seed)
    torch.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)
    torch.backends.cudnn.deterministic = True
    torch.backends.cudnn.benchmark = False

set_seed()

# Tekstvienību apstrādes klase

In [2]:
class CustomCharTokenizer(PreTrainedTokenizer):
    def __init__(self, vocab, unk_token="[UNK]", pad_token="[PAD]", sos_token="[SOS]", eos_token="[EOS]"):
        object.__setattr__(self, "_vocab", vocab)
        object.__setattr__(self, "_vocab_size", len(vocab))

        # Inicializē speciālās tekstvienības
        super().__init__(unk_token=unk_token, pad_token=pad_token, sos_token=sos_token, eos_token=eos_token)

        # Izveido kartējumu "tekstvienības ID -> tekstvienība"
        self.ids_to_tokens = {i: token for token, i in vocab.items()}

        # Saglabā speciālās tekstvienības
        self.unk_token = unk_token
        self.pad_token = pad_token
        self.sos_token = sos_token
        self.eos_token = eos_token

    @property
    def vocab(self):
        return self._vocab

    @property
    def vocab_size(self):
        return self._vocab_size

    @property
    def pad_token_id(self):
        return self._vocab.get(self.pad_token)

    def get_vocab(self):
        return self._vocab

    def _tokenize(self, text):
        return list(text.lower()) # Ievades un izvades secības ir ar mazajiem alfabēta burtiem

    def _convert_token_to_id(self, token):
        return self._vocab.get(token, self._vocab.get(self.unk_token)) # Ja tekstvienības nav vārdnīcā, atgriež UNK

    def _convert_id_to_token(self, index):
        return self.ids_to_tokens.get(index, self.unk_token) # Atgriež tekstvienību pēc ID

    def convert_tokens_to_string(self, tokens):
        return "".join(tokens) # Savieno tekstvienības vienā teksta virknē

    def encode(self, text, max_length=32):
        # Pārvērš ievades secību uz tekstvienību secību
        tokens = self._tokenize(text)
        ids = [self._convert_token_to_id(t) for t in tokens]

        # Apgriež secību līdz 30 tekstvienībām
        body = ids[: max_length - 2]

        # Pievieno speciālās tekstvienības (kopā 32 tekstvienību secība)
        return [self._vocab[self.sos_token]] + body + [self._vocab[self.eos_token]]


    def decode(self, token_ids):
        # Atgriež tekstvienību secību no tekstvienību ID secības
        tokens = [self._convert_id_to_token(i) for i in token_ids]

        # Noņem SOS, EOS un PAD, lai netraucētu izvades secības lasāmībai
        skip = {self.sos_token, self.eos_token, self.pad_token}
        tokens = [t for t in tokens if t not in skip]

        # Atgriež tekstu
        return self.convert_tokens_to_string(tokens)

# Vārdnīcas definēšana
latvian_letters = list("aābcčdeēfgģhiījkķlļmnņoprsštuūvzž")
digits = list("0123456789")
additional_symbols = list("-")
special_tokens = ["[UNK]", "[PAD]", "[SOS]", "[EOS]"]

# Apvieno visas tekstvienības vienā sarakstā
vocab_tokens = special_tokens + latvian_letters + digits + additional_symbols

# Izveido vārdnīcu ar unikāliem indeksiem
vocab_dict = {token: idx for idx, token in enumerate(vocab_tokens)}

# Inicializē tekstvienību apstrādes instanci
tokenizer = CustomCharTokenizer(vocab_dict)

# Datu kopu apstrādes klase

In [3]:
class WordPairDataset(Dataset):
    def __init__(self, dataframe: pd.DataFrame, tokenizer, max_length = 32):
        # Pārvērš "Lemma" un "Word" kolonnās esošos datus par sarakstiem
        self.lemmas = dataframe["Lemma"].astype(str).tolist()
        self.words = dataframe["Word"].astype(str).tolist()
        self.tokenizer = tokenizer
        self.max_length = max_length
        del dataframe # Atbrīvo atmiņu no dataframe pēc apstrādes

    def __len__(self):
        return len(self.lemmas)

    def __getitem__(self, idx):
        # Pārveido saņemto pāri par tekstvienību secībām un atgriež kā tenzorus
        lemma_ids = self.tokenizer.encode(self.lemmas[idx], self.max_length)
        word_ids = self.tokenizer.encode(self.words[idx], self.max_length)
        return torch.tensor(lemma_ids, dtype=torch.long), torch.tensor(word_ids, dtype=torch.long)

# Funkcija, kas nodrošina, ka visas secības vienā datu porcijā ir vienāda garuma, aizpildot ar PAD tekstvienību
def collate_fn(batch):
    lemmas, targets = zip(*batch)
    pad_id = tokenizer.pad_token_id

    # Atrod garāko secību katrā gadījumā
    max_lemma_len = max(len(x) for x in lemmas)
    max_target_len = max(len(x) for x in targets)

    # Pagarina īsākās secības līdz noteiktajam garumam un atgriež rezultātu
    lemmas_padded = [torch.cat([x, torch.full((max_lemma_len - len(x),), pad_id, dtype=torch.long)]) for x in lemmas]
    targets_padded = [torch.cat([x, torch.full((max_target_len - len(x),), pad_id, dtype=torch.long)]) for x in targets]
    return torch.stack(lemmas_padded), torch.stack(targets_padded)

# Modeļa izveide

In [4]:
# Pozicionālā kodējuma izveide
class PositionalEncoding(nn.Module):
    def __init__(self, d_model: int, max_len: int = 32):
        super().__init__()
        # Izveido sākotnējo pozīciju tabulu (max_len x d_model), sākumā ar nullēm
        pe = torch.zeros(max_len, d_model)

        # Pozīciju vektora izveide
        position = torch.arange(0, max_len, dtype=torch.float).unsqueeze(1)

        # Frekvenču skaitītājs
        div_term = torch.exp(torch.arange(0, d_model, 2, dtype=torch.float) * (-math.log(10000.0) / d_model))

        # Pāra dimensijām sinuss
        pe[:, 0::2] = torch.sin(position * div_term)

        # Nepāra dimensijām kosinuss
        if d_model % 2 == 1:
            pe[:, 1::2] = torch.cos(position * div_term[: pe[:, 1::2].shape[1]])
        else:
            pe[:, 1::2] = torch.cos(position * div_term)

        pe = pe.unsqueeze(0)
        self.register_buffer("pe", pe) # saglabā pe kā nemainīgu daļu no modeļa

    def forward(self, x):
        # Pievieno pozicionālo kodējumu reprezentācijām
        return x + self.pe[:, :x.size(1)]

# Kodētāja-dekodētāja modeļa klases definēšana
class CustomTransformerModel(nn.Module):
    def __init__(self, vocab_size, d_model=192, nhead=12, num_encoder_layers=2, num_decoder_layers=4, dim_feedforward=768, dropout=0.2, max_len=32):
        super(CustomTransformerModel, self).__init__()
        self.d_model = d_model

        # Pārvērš katru tekstvienības ID par {d_model} dimensiju vektoru
        self.embedding = nn.Embedding(vocab_size, d_model)

        # Slāņu normalizācija
        self.embed_ln = nn.LayerNorm(d_model)

        # Pozicionālā kodēšana tiek izmantota gan kodētājā, gan dekodētājā
        self.pos_encoder = PositionalEncoding(d_model, max_len)
        self.pos_decoder = PositionalEncoding(d_model, max_len)

        # Inicializē transformera komponenti ar noteiktajiem parametriem
        self.transformer = nn.Transformer(d_model, nhead, num_encoder_layers, num_decoder_layers, dim_feedforward, dropout, batch_first=True)

        # Lineārais slānis, lai no transformera izejas atgrieztu varbūtības katram tekstvienības ID
        self.fc_out = nn.Linear(d_model, vocab_size)

    def generate_square_subsequent_mask(self, sz):
        # Izveido masku, lai dekodētājs nespētu skatīties nākamās tekstvienības ģenerēšanas laikā
        mask = torch.triu(torch.ones(sz, sz), diagonal=1).bool()
        return mask

    def forward(self, src, tgt, src_key_padding_mask=None, tgt_key_padding_mask=None, tgt_mask=None):
        # Iegūst reprezentācijas un pozicionālos kodējumus ievades un mērķa secībām
        src_emb = self.embed_ln(self.embedding(src)) * math.sqrt(self.d_model)
        src_emb = self.pos_encoder(src_emb)
        tgt_emb = self.embed_ln(self.embedding(tgt)) * math.sqrt(self.d_model)
        tgt_emb = self.pos_decoder(tgt_emb)

        # Izveido dekodētāja masku, lai nodrošinātu atbilstošu tekstvienību ģenerēšanu
        tgt_mask = self.generate_square_subsequent_mask(tgt_emb.size(1)).to(tgt_emb.device)

        # Iegūst izvadi
        output = self.transformer(src_emb, tgt_emb, tgt_mask=tgt_mask, src_key_padding_mask=src_key_padding_mask, tgt_key_padding_mask=tgt_key_padding_mask)

        # Projekcija uz vārdnīcas izmēra dimensiju izvada noteikšanai
        return self.fc_out(output)

# Iegūstam vārdnīcas izmēru un inicializējam modeli uz GPU, ja tas ir pieejams
vocab_size = tokenizer.vocab_size
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = CustomTransformerModel(vocab_size).to(device)
criterion = nn.CrossEntropyLoss(label_smoothing=0.01, ignore_index=tokenizer.pad_token_id) # PAD tokenam zaudējums netiek skaitīts

# Apmācības un vērtēšanas funkcijas

In [5]:
writer = SummaryWriter(log_dir="runs")
ckpt_dir = "checkpoints"
os.makedirs(ckpt_dir, exist_ok=True)
global_step = 0
scaler = GradScaler()

# Apmācības cikls
def train_model(model, dataloader, optimizer, device, val_loader=None, log_every=10000):
    global global_step
    model.train()
    running_loss = 0.0 # kumulatīvais zaudējums pa datu porcijām

    # Iterācija caur datu porcijām
    for i, (src, tgt) in enumerate(tqdm(dataloader, desc="Train", leave=False)):
        # Datu porcijas sagatavošana
        src, tgt = src.to(device), tgt.to(device)
        tgt_in, tgt_gold = tgt[:, :-1], tgt[:, 1:]

        # Maskas PAD tekstvienībām
        src_mask = (src == tokenizer.pad_token_id)
        tgt_mask = (tgt_in == tokenizer.pad_token_id)

        optimizer.zero_grad()

        with autocast(device_type=device.type, enabled=(device.type=="cuda")):
             out = model(src, tgt_in, src_key_padding_mask=src_mask, tgt_key_padding_mask=tgt_mask)
             loss = criterion(out.reshape(-1, vocab_size), tgt_gold.reshape(-1))

        scaler.scale(loss).backward()
        scaler.unscale_(optimizer)
        torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)
        scaler.step(optimizer)

        if scheduler is not None:
            scheduler.step()

        scaler.update()

        # Palielina kumulatīvo zaudējumu un skaitītāju
        running_loss += loss.item()
        global_step += 1

        # Validācija ik pēc noteiktu soļu skaita
        if val_loader and global_step % log_every == 0:
            train_loss = running_loss / log_every
            val_loss = evaluate_loss(model, val_loader, device)

            # Fiksē rezultātus
            if writer is not None:
                writer.add_scalar("loss/train_step", train_loss, global_step)
                writer.add_scalar("loss/val_step", val_loss, global_step)

            print(f"step {global_step}: train = {train_loss:.4f} | val = {val_loss:.4f}")

            # Saglabā modeli ik pēc noteiktā soļu skaita kā pieturpunktu
            if ckpt_dir is not None:
                torch.save(model.state_dict(), f"{ckpt_dir}/step_{global_step}"f"_tr{train_loss:.3f}_val{val_loss:.3f}.pth")

            running_loss = 0.0 # atiestata kumulatīvo skaitītāju

    # Atgriež iterācijas vidējo apmācības zaudējumu
    return running_loss / len(dataloader)


# Apmācība un validācija
def train_and_validate(stage, train_loader, val_loader, optimizer, epochs, patience=0,
                       best_val_loss=float("inf"), prev_val_loss = 0, slow_count = 0, beam_k = 5, min_delta=0.005):
    use_early_stop = (patience > 0) # Agrā apstāšanās tikai tad, ja tā tiek iestatīta

    # Apmācības iterācija
    for ep in range(epochs):
        # Modeļa apmācība
        tr_loss = train_model(model, train_loader, optimizer, device, val_loader)

        # Zaudējuma aprēķināšana un modeļa novērtēšana
        val_loss = evaluate_loss(model, val_loader, device)

        if scheduler is not None:
            if isinstance(scheduler, ReduceLROnPlateau):
                scheduler.step(val_loss)
            else:
                scheduler.step()

        # Piefiksē mērījumu vērtības un izprintē tās
        if writer is not None:
            writer.add_scalars(f"{stage}/loss", {"train": tr_loss, "val": val_loss}, ep)
        print(f"{stage} {ep}/{epochs} | train_loss: {tr_loss:.4f} | val_loss: {val_loss:.4f}")

        # Ja netiek lietota agrā apstāšanās, turpina ar nākamajiem soļiem
        if not use_early_stop:
            continue

        improvement = best_val_loss - val_loss
        if improvement < min_delta:
            slow_count += 1
        else:
            slow_count = 0

        if improvement > 0:
            best_val_loss = val_loss

        # Ja 3× pēc kārtas zaudējums samazinās pārāk lēni, pārtrauc
        if slow_count >= patience:
            print("Notika agrā apstāšanās")
            break

# Funkcija, kas aprēķina vidējo zaudējumu validācijas kopai
def evaluate_loss(model, dataloader, device):
    model.eval()
    total_loss = torch.tensor(0.0, device=device)
    count = 0
    with torch.no_grad(), autocast(device_type=device.type, enabled=(device.type=="cuda")):
        for src, tgt in dataloader:
            src, tgt = src.to(device), tgt.to(device)
            tgt_in  = tgt[:, :-1]
            tgt_gold= tgt[:,  1:]
            src_mask = (src == tokenizer.pad_token_id)
            tgt_mask = (tgt_in == tokenizer.pad_token_id)
            out = model(src, tgt_in, src_key_padding_mask=src_mask, tgt_key_padding_mask=tgt_mask)
            loss = criterion(out.view(-1, out.size(-1)), tgt_gold.reshape(-1))
            total_loss += loss
            count += 1
    return (total_loss / count).item()


# Kandidātu ģenerēšana un atbildēšana

In [6]:
# Atgriež beam search izveidotu sarakstu ar {num_beams} labākajām ģenerētajām virknēm teksta formā.
@torch.no_grad()
def beam_generate(model, src, max_len=32, num_beams=5):
    # Mainīgo sagatavošana
    device = src.device
    beams = [(torch.tensor([[tokenizer._vocab["[SOS]"]]], device=device), 0.0)]
    finished = []

    # Iterē max_length garumā
    for _ in range(max_len):
        new_beams = []

        for seq, score in beams:
            # Ja pēdējā tekstvienība ir EOS, secība ir pabeigta
            if seq[0, -1].item() == tokenizer._vocab["[EOS]"]:
                finished.append((seq, score))
                continue

            # Uztaisa masku dekoderim, lai neredz nākamās tekstvienības
            tgt_mask = model.generate_square_subsequent_mask(seq.size(1)).to(device)

            # Iegūst varbūtības tekstvienībām
            logits = model(src, seq,
                           src_key_padding_mask=(src == tokenizer.pad_token_id),
                           tgt_key_padding_mask=(seq == tokenizer.pad_token_id),
                           tgt_mask=tgt_mask)[:, -1]

            # Pārvērš logitus par log-varbūtībām
            logp = torch.log_softmax(logits, -1)[0]

            # Izvēlas top {num_beams} kandidātus no log-varbūtībām
            top_p, top_i = torch.topk(logp, num_beams)

            # Veido jaunu beamu katram top kandidātam
            for p, idx in zip(top_p, top_i):
                new_seq = torch.cat([seq, idx.view(1,1)], 1)
                new_beams.append((new_seq, score + p.item()))
        beams = sorted(new_beams, key=lambda x: x[1], reverse=True)[:num_beams]
        if not beams: break

    # Apvieno un sakārto pabeigtās secības
    finished += beams
    finished = sorted(finished, key=lambda x: x[1], reverse=True)[:num_beams]

    # Atgriež dekodētās secības kā tekstu, izņemot SOS/EOS/PAD tekstvienības
    return [
        tokenizer.decode(seq[0].tolist())
        for seq, _ in finished
    ]

# *Optuna* hiperparametru optimizācijas algoritms

In [7]:
# Iespējamās vērtības un to amplitūdas modeļa hiperparametriem un arhitektūrai
D_MODELS        = [64, 96, 128, 192, 256]
N_HEADS         = [2, 4, 6, 8, 12]
ENC_LAYERS      = [2, 4, 6]
DEC_LAYERS      = [2, 4, 6]
DIM_FF          = [2, 4, 6]
DROPOUT_BOUNDS  = (0.05, 0.5)
LR_BOUNDS       = (1e-6, 1e-3)
WDECAY_BOUNDS   = (1e-6, 1e-3)

def objective(trial: optuna.Trial):
    # Hiperparametru izloze
    d_model         = trial.suggest_categorical("d_model", D_MODELS)
    nhead           = trial.suggest_categorical("nhead", N_HEADS)
    num_enc_layers  = trial.suggest_categorical("num_encoder_layers", ENC_LAYERS)
    num_dec_layers  = trial.suggest_categorical("num_decoder_layers", DEC_LAYERS)
    dim_feedforward = trial.suggest_categorical("dim_ff", DIM_FF)
    dropout         = trial.suggest_float("dropout", *DROPOUT_BOUNDS)
    lr              = trial.suggest_float("lr", *LR_BOUNDS, log=True)
    weight_decay    = trial.suggest_float("weight_decay", *WDECAY_BOUNDS, log=True)

    # Nederīgo konfigurāciju atmešana (d_model jābūt dalāmam ar nhead)
    if d_model % nhead != 0:
        raise TrialPruned()

    # Modeļa inicializēšana ar izvēlētajiem hiperparametriem
    model = CustomTransformerModel(
        vocab_size=vocab_size,
        d_model=d_model,
        nhead=nhead,
        num_encoder_layers=num_enc_layers,
        num_decoder_layers=num_dec_layers,
        dim_feedforward=dim_feedforward,
        dropout=dropout
    ).to(device)
    optimizer = optim.AdamW(model.parameters(), lr=lr, weight_decay=weight_decay)

    # Ātra apmācība un validācija uz mazas datu kopas
    train_model(model, small_train_loader, optimizer, device, val_loader=None)
    val_loss = evaluate_loss(model, small_val_loader, device)

    return val_loss

if run_optuna:
    # Nolasa pamatapmācības datni
    pretraining_df = pd.read_csv("LVK2022_filtrets.csv", sep=",", encoding="utf-8-sig")

    # Sadala pamatapmācības datu kopu 95% apmācībai un 5% validācijai
    pretraining_train_df, pretraining_val_df = train_test_split(pretraining_df, test_size=0.05)

    # Izveido dataset un dataloader mainīgos
    pretraining_train_dataset = WordPairDataset(pretraining_train_df, tokenizer)
    pretraining_val_dataset = WordPairDataset(pretraining_val_df, tokenizer)

    # Izmanto tikai 1/1000 daļu no pamatapmācības datu kopas ātrākai konfigurāciju meklēšanai
    train_subset_idx = list(range(len(pretraining_train_dataset) // 1000))
    val_subset_idx = list(range(len(pretraining_val_dataset) // 1000))
    small_train_loader = DataLoader(Subset(pretraining_train_dataset, train_subset_idx), batch_size=256, shuffle=True, collate_fn=collate_fn)
    small_val_loader = DataLoader(Subset(pretraining_val_dataset, val_subset_idx), batch_size=256, shuffle=False, collate_fn=collate_fn)

    # Optuna parametru sagatavošana
    pruner = optuna.pruners.MedianPruner(n_warmup_steps=5)
    sampler = optuna.samplers.TPESampler(seed=42)
    study = optuna.create_study(direction="minimize", pruner=pruner, sampler=sampler)

    # Hiperparametru optimizācija 50 mēģinājumos
    study.optimize(objective, n_trials=50)

    print("Labākie parametri:", study.best_params)


# Pamatapmācība

In [8]:
if pretrain:
    # Nolasa pamatapmācības datni
    pretraining_df = pd.read_csv("LVK2022_filtrets.csv", sep=",", encoding="utf-8-sig")

    # Sadala pamatapmācības datu kopu 95% apmācībai un 5% validācijai
    pretraining_train_df, pretraining_val_df = train_test_split(pretraining_df, test_size=0.05)

    # Izveido dataset un dataloader mainīgos
    pretraining_train_dataset = WordPairDataset(pretraining_train_df, tokenizer)
    pretraining_val_dataset = WordPairDataset(pretraining_val_df, tokenizer)
    pretraining_train_loader = DataLoader(pretraining_train_dataset, batch_size=256, shuffle=True, collate_fn=collate_fn, num_workers=0, pin_memory=False)
    pretraining_val_loader = DataLoader(pretraining_val_dataset, batch_size=256, shuffle=False, collate_fn=collate_fn, num_workers=0, pin_memory=False)

    # Modeļa pamatapmācības cikls
    num_pretrain_epochs = 1
    optimizer = optim.AdamW(model.parameters(), lr=4e-4, weight_decay=1e-2)
    total_steps = len(pretraining_train_loader)
    scheduler = CosineAnnealingWarmRestarts(optimizer, T_0 = total_steps // 2, T_mult = 1, eta_min = 1e-6)
    train_and_validate("Pretrained", pretraining_train_loader, pretraining_val_loader, optimizer, epochs=num_pretrain_epochs)

    # Saglabā pamatapmācītā modeļa svarus
    torch.save(model.state_dict(), "Pretrained.pth")

# Modeļa pielāgošana

In [9]:
if finetune:
    finetuning_files = [f"parveidojumi/parveidojums_{i}.csv" for i in range(1, 11)] # Sagatavo sarakstu ar pārveidojumu piemēru datnēm

    for idx, csv_path in enumerate(finetuning_files, start=1):
        # Nolasa pielāgošanas datu kopu
        finetuning_df = pd.read_csv(csv_path, sep=";", encoding="utf-8-sig")

        # Sadala pielāgošanas datu kopu 90% apmācībai un 10% validācijai
        finetuning_train_df, finetuning_val_df = train_test_split(finetuning_df, test_size=0.1)

        # Izveido dataset un dataloader mainīgos
        finetuning_train_dataset = WordPairDataset(finetuning_train_df, tokenizer)
        finetuning_val_dataset = WordPairDataset(finetuning_val_df, tokenizer)
        finetuning_train_loader = DataLoader(finetuning_train_dataset, batch_size=4, shuffle=True, collate_fn=collate_fn)
        finetuning_val_loader = DataLoader(finetuning_val_dataset, batch_size=4, shuffle=False, collate_fn=collate_fn)

        # Pārrakstām svarus izmantojot pamatapmācīto modeli
        model = CustomTransformerModel(vocab_size).to(device)
        model.load_state_dict(torch.load("Pretrained.pth", weights_only=True), strict=True)

        # Iesaldējam modeļa slāņus
        for n, p in model.named_parameters():
            p.requires_grad = False

        # Izmantojam LoRA modeļa pielāgošanai
        lora_cfg = LoraConfig(
            r=8,
            lora_alpha=16,
            lora_dropout=0.1,
            target_modules=[
              "decoder.layers.0.linear1", "decoder.layers.0.linear2", "decoder.layers.0.out_proj",
              "decoder.layers.1.linear1", "decoder.layers.1.linear2", "decoder.layers.1.out_proj",
              "decoder.layers.2.linear1", "decoder.layers.2.linear2", "decoder.layers.2.out_proj",
              "decoder.layers.3.linear1", "decoder.layers.3.linear2", "decoder.layers.3.out_proj", "fc_out"
            ]
        )
        model = get_peft_model(model, lora_cfg)

        # Parametri pielāgošanas procesam
        num_finetune_epochs = 50 # Maksimālais daudzums
        trainable = filter(lambda p: p.requires_grad, model.parameters())
        optimizer = torch.optim.AdamW(trainable, lr=5e-4)
        scheduler = None
        model.zero_grad()

        # Pielāgošana ar agrās apstāšanās kontroli
        train_and_validate(f"parveidojums_{idx}", finetuning_train_loader, finetuning_val_loader, optimizer, epochs=num_finetune_epochs, patience=4)

        # Saglabā PEFT adapteri ar unikālu nosaukumu
        save_dir = f"parveidojums_{idx}"
        model.save_pretrained(save_dir)
        print(f"Saglabāts adapteris: {save_dir}/\n")



parveidojums_1 0/50 | train_loss: 1.6452 | val_loss: 1.0830




parveidojums_1 1/50 | train_loss: 1.0240 | val_loss: 0.4909




parveidojums_1 2/50 | train_loss: 0.7075 | val_loss: 0.2839




parveidojums_1 3/50 | train_loss: 0.5555 | val_loss: 0.2651




parveidojums_1 4/50 | train_loss: 0.5364 | val_loss: 0.2547




parveidojums_1 5/50 | train_loss: 0.4819 | val_loss: 0.2457




parveidojums_1 6/50 | train_loss: 0.4974 | val_loss: 0.2337




parveidojums_1 7/50 | train_loss: 0.4853 | val_loss: 0.2316




parveidojums_1 8/50 | train_loss: 0.4599 | val_loss: 0.2209




parveidojums_1 9/50 | train_loss: 0.4145 | val_loss: 0.2147




parveidojums_1 10/50 | train_loss: 0.4180 | val_loss: 0.2155




parveidojums_1 11/50 | train_loss: 0.3915 | val_loss: 0.2048




parveidojums_1 12/50 | train_loss: 0.4458 | val_loss: 0.1983




parveidojums_1 13/50 | train_loss: 0.3546 | val_loss: 0.1971




parveidojums_1 14/50 | train_loss: 0.4180 | val_loss: 0.1920




parveidojums_1 15/50 | train_loss: 0.3788 | val_loss: 0.1889




parveidojums_1 16/50 | train_loss: 0.3866 | val_loss: 0.1830




parveidojums_1 17/50 | train_loss: 0.3404 | val_loss: 0.1763




parveidojums_1 18/50 | train_loss: 0.3819 | val_loss: 0.1775




parveidojums_1 19/50 | train_loss: 0.3386 | val_loss: 0.1750




parveidojums_1 20/50 | train_loss: 0.3737 | val_loss: 0.1752




parveidojums_1 21/50 | train_loss: 0.3370 | val_loss: 0.1725
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_1/





parveidojums_2 0/50 | train_loss: 1.6649 | val_loss: 1.5240




parveidojums_2 1/50 | train_loss: 1.4568 | val_loss: 1.0892




parveidojums_2 2/50 | train_loss: 1.1342 | val_loss: 0.6471




parveidojums_2 3/50 | train_loss: 0.9244 | val_loss: 0.5407




parveidojums_2 4/50 | train_loss: 0.8352 | val_loss: 0.5010




parveidojums_2 5/50 | train_loss: 0.7720 | val_loss: 0.4424




parveidojums_2 6/50 | train_loss: 0.7927 | val_loss: 0.3945




parveidojums_2 7/50 | train_loss: 0.7388 | val_loss: 0.3558




parveidojums_2 8/50 | train_loss: 0.7609 | val_loss: 0.3306




parveidojums_2 9/50 | train_loss: 0.6548 | val_loss: 0.3038




parveidojums_2 10/50 | train_loss: 0.6714 | val_loss: 0.2916




parveidojums_2 11/50 | train_loss: 0.6608 | val_loss: 0.2761




parveidojums_2 12/50 | train_loss: 0.6101 | val_loss: 0.2661




parveidojums_2 13/50 | train_loss: 0.5772 | val_loss: 0.2529




parveidojums_2 14/50 | train_loss: 0.6057 | val_loss: 0.2477




parveidojums_2 15/50 | train_loss: 0.6047 | val_loss: 0.2413




parveidojums_2 16/50 | train_loss: 0.5762 | val_loss: 0.2360




parveidojums_2 17/50 | train_loss: 0.5546 | val_loss: 0.2358




parveidojums_2 18/50 | train_loss: 0.5524 | val_loss: 0.2303




parveidojums_2 19/50 | train_loss: 0.5037 | val_loss: 0.2337




parveidojums_2 20/50 | train_loss: 0.5061 | val_loss: 0.2307




parveidojums_2 21/50 | train_loss: 0.5066 | val_loss: 0.2220




parveidojums_2 22/50 | train_loss: 0.5135 | val_loss: 0.2202




parveidojums_2 23/50 | train_loss: 0.5353 | val_loss: 0.2195




parveidojums_2 24/50 | train_loss: 0.5779 | val_loss: 0.2204




parveidojums_2 25/50 | train_loss: 0.5078 | val_loss: 0.2210
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_2/





parveidojums_3 0/50 | train_loss: 2.0870 | val_loss: 1.7626




parveidojums_3 1/50 | train_loss: 1.7038 | val_loss: 1.0777




parveidojums_3 2/50 | train_loss: 1.1593 | val_loss: 0.6819




parveidojums_3 3/50 | train_loss: 0.9565 | val_loss: 0.5648




parveidojums_3 4/50 | train_loss: 0.8289 | val_loss: 0.4964




parveidojums_3 5/50 | train_loss: 0.7418 | val_loss: 0.4433




parveidojums_3 6/50 | train_loss: 0.7305 | val_loss: 0.4116




parveidojums_3 7/50 | train_loss: 0.6727 | val_loss: 0.3827




parveidojums_3 8/50 | train_loss: 0.6233 | val_loss: 0.3530




parveidojums_3 9/50 | train_loss: 0.6433 | val_loss: 0.3459




parveidojums_3 10/50 | train_loss: 0.5998 | val_loss: 0.3198




parveidojums_3 11/50 | train_loss: 0.5985 | val_loss: 0.3204




parveidojums_3 12/50 | train_loss: 0.5843 | val_loss: 0.3131




parveidojums_3 13/50 | train_loss: 0.5429 | val_loss: 0.3265




parveidojums_3 14/50 | train_loss: 0.5433 | val_loss: 0.3244




parveidojums_3 15/50 | train_loss: 0.5664 | val_loss: 0.3174




parveidojums_3 16/50 | train_loss: 0.5194 | val_loss: 0.3194
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_3/





parveidojums_4 0/50 | train_loss: 2.3791 | val_loss: 2.5307




parveidojums_4 1/50 | train_loss: 2.3505 | val_loss: 2.3601




parveidojums_4 2/50 | train_loss: 2.0933 | val_loss: 2.0400




parveidojums_4 3/50 | train_loss: 1.7306 | val_loss: 1.6362




parveidojums_4 4/50 | train_loss: 1.4835 | val_loss: 1.2972




parveidojums_4 5/50 | train_loss: 1.3217 | val_loss: 0.9955




parveidojums_4 6/50 | train_loss: 1.1112 | val_loss: 0.7661




parveidojums_4 7/50 | train_loss: 0.9368 | val_loss: 0.6145




parveidojums_4 8/50 | train_loss: 0.8578 | val_loss: 0.4905




parveidojums_4 9/50 | train_loss: 0.7014 | val_loss: 0.4121




parveidojums_4 10/50 | train_loss: 0.7433 | val_loss: 0.3424




parveidojums_4 11/50 | train_loss: 0.6806 | val_loss: 0.3115




parveidojums_4 12/50 | train_loss: 0.6808 | val_loss: 0.2743




parveidojums_4 13/50 | train_loss: 0.5727 | val_loss: 0.2480




parveidojums_4 14/50 | train_loss: 0.5298 | val_loss: 0.2284




parveidojums_4 15/50 | train_loss: 0.5346 | val_loss: 0.2186




parveidojums_4 16/50 | train_loss: 0.5049 | val_loss: 0.2097




parveidojums_4 17/50 | train_loss: 0.5003 | val_loss: 0.1963




parveidojums_4 18/50 | train_loss: 0.4586 | val_loss: 0.1908




parveidojums_4 19/50 | train_loss: 0.4610 | val_loss: 0.1882




parveidojums_4 20/50 | train_loss: 0.4735 | val_loss: 0.1838




parveidojums_4 21/50 | train_loss: 0.4669 | val_loss: 0.1783




parveidojums_4 22/50 | train_loss: 0.4505 | val_loss: 0.1812




parveidojums_4 23/50 | train_loss: 0.4687 | val_loss: 0.1778




parveidojums_4 24/50 | train_loss: 0.4700 | val_loss: 0.1765




parveidojums_4 25/50 | train_loss: 0.5163 | val_loss: 0.1778
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_4/





parveidojums_5 0/50 | train_loss: 2.0835 | val_loss: 1.7337




parveidojums_5 1/50 | train_loss: 1.8894 | val_loss: 1.6849




parveidojums_5 2/50 | train_loss: 1.8502 | val_loss: 1.6019




parveidojums_5 3/50 | train_loss: 1.8389 | val_loss: 1.4830




parveidojums_5 4/50 | train_loss: 1.6202 | val_loss: 1.3159




parveidojums_5 5/50 | train_loss: 1.5827 | val_loss: 1.1118




parveidojums_5 6/50 | train_loss: 1.3598 | val_loss: 0.8663




parveidojums_5 7/50 | train_loss: 1.2666 | val_loss: 0.6922




parveidojums_5 8/50 | train_loss: 1.1689 | val_loss: 0.6035




parveidojums_5 9/50 | train_loss: 1.1026 | val_loss: 0.5449




parveidojums_5 10/50 | train_loss: 1.0834 | val_loss: 0.4964




parveidojums_5 11/50 | train_loss: 0.9197 | val_loss: 0.4437




parveidojums_5 12/50 | train_loss: 0.9025 | val_loss: 0.3841




parveidojums_5 13/50 | train_loss: 0.7685 | val_loss: 0.3262




parveidojums_5 14/50 | train_loss: 0.7392 | val_loss: 0.2792




parveidojums_5 15/50 | train_loss: 0.6243 | val_loss: 0.2355




parveidojums_5 16/50 | train_loss: 0.7205 | val_loss: 0.2061




parveidojums_5 17/50 | train_loss: 0.7319 | val_loss: 0.1910




parveidojums_5 18/50 | train_loss: 0.7043 | val_loss: 0.1807




parveidojums_5 19/50 | train_loss: 0.6241 | val_loss: 0.1685




parveidojums_5 20/50 | train_loss: 0.6608 | val_loss: 0.1614




parveidojums_5 21/50 | train_loss: 0.6389 | val_loss: 0.1597




parveidojums_5 22/50 | train_loss: 0.6550 | val_loss: 0.1570




parveidojums_5 23/50 | train_loss: 0.6048 | val_loss: 0.1549




parveidojums_5 24/50 | train_loss: 0.5630 | val_loss: 0.1547
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_5/





parveidojums_6 0/50 | train_loss: 1.8000 | val_loss: 1.5730




parveidojums_6 1/50 | train_loss: 2.0082 | val_loss: 1.5563




parveidojums_6 2/50 | train_loss: 1.8759 | val_loss: 1.5301




parveidojums_6 3/50 | train_loss: 2.0124 | val_loss: 1.4949




parveidojums_6 4/50 | train_loss: 1.7088 | val_loss: 1.4494




parveidojums_6 5/50 | train_loss: 1.5332 | val_loss: 1.3835




parveidojums_6 6/50 | train_loss: 1.4969 | val_loss: 1.3078




parveidojums_6 7/50 | train_loss: 1.4674 | val_loss: 1.2344




parveidojums_6 8/50 | train_loss: 1.3444 | val_loss: 1.1564




parveidojums_6 9/50 | train_loss: 1.3558 | val_loss: 1.0952




parveidojums_6 10/50 | train_loss: 1.1080 | val_loss: 1.0522




parveidojums_6 11/50 | train_loss: 1.0585 | val_loss: 1.0146




parveidojums_6 12/50 | train_loss: 0.9384 | val_loss: 0.9846




parveidojums_6 13/50 | train_loss: 0.9206 | val_loss: 0.9579




parveidojums_6 14/50 | train_loss: 0.9783 | val_loss: 0.9428




parveidojums_6 15/50 | train_loss: 0.8665 | val_loss: 0.9303




parveidojums_6 16/50 | train_loss: 0.9037 | val_loss: 0.9185




parveidojums_6 17/50 | train_loss: 0.9077 | val_loss: 0.9117




parveidojums_6 18/50 | train_loss: 0.9312 | val_loss: 0.9017




parveidojums_6 19/50 | train_loss: 0.7849 | val_loss: 0.8987




parveidojums_6 20/50 | train_loss: 0.7790 | val_loss: 0.8940




parveidojums_6 21/50 | train_loss: 0.7283 | val_loss: 0.8904




parveidojums_6 22/50 | train_loss: 0.7942 | val_loss: 0.8864
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_6/





parveidojums_7 0/50 | train_loss: 2.5334 | val_loss: 2.7255




parveidojums_7 1/50 | train_loss: 2.5057 | val_loss: 2.6858




parveidojums_7 2/50 | train_loss: 2.2145 | val_loss: 2.6182




parveidojums_7 3/50 | train_loss: 2.2563 | val_loss: 2.5148




parveidojums_7 4/50 | train_loss: 2.1431 | val_loss: 2.3710




parveidojums_7 5/50 | train_loss: 2.0836 | val_loss: 2.1731




parveidojums_7 6/50 | train_loss: 1.8181 | val_loss: 1.9208




parveidojums_7 7/50 | train_loss: 1.4957 | val_loss: 1.6611




parveidojums_7 8/50 | train_loss: 1.4219 | val_loss: 1.4401




parveidojums_7 9/50 | train_loss: 1.3696 | val_loss: 1.3097




parveidojums_7 10/50 | train_loss: 1.2744 | val_loss: 1.2109




parveidojums_7 11/50 | train_loss: 1.1370 | val_loss: 1.1339




parveidojums_7 12/50 | train_loss: 1.0729 | val_loss: 1.0885




parveidojums_7 13/50 | train_loss: 1.2459 | val_loss: 1.0473




parveidojums_7 14/50 | train_loss: 1.0947 | val_loss: 0.9968




parveidojums_7 15/50 | train_loss: 0.9945 | val_loss: 0.9515




parveidojums_7 16/50 | train_loss: 1.0680 | val_loss: 0.9174




parveidojums_7 17/50 | train_loss: 1.0110 | val_loss: 0.8761




parveidojums_7 18/50 | train_loss: 1.0232 | val_loss: 0.8410




parveidojums_7 19/50 | train_loss: 0.8979 | val_loss: 0.8169




parveidojums_7 20/50 | train_loss: 0.8965 | val_loss: 0.7903




parveidojums_7 21/50 | train_loss: 0.9569 | val_loss: 0.7580




parveidojums_7 22/50 | train_loss: 0.9051 | val_loss: 0.7234




parveidojums_7 23/50 | train_loss: 0.9213 | val_loss: 0.6917




parveidojums_7 24/50 | train_loss: 0.8644 | val_loss: 0.6622




parveidojums_7 25/50 | train_loss: 0.9212 | val_loss: 0.6405




parveidojums_7 26/50 | train_loss: 0.8168 | val_loss: 0.6179




parveidojums_7 27/50 | train_loss: 0.8149 | val_loss: 0.6012




parveidojums_7 28/50 | train_loss: 0.7078 | val_loss: 0.5744




parveidojums_7 29/50 | train_loss: 0.6800 | val_loss: 0.5496




parveidojums_7 30/50 | train_loss: 0.8666 | val_loss: 0.5339




parveidojums_7 31/50 | train_loss: 0.7213 | val_loss: 0.5233




parveidojums_7 32/50 | train_loss: 0.7254 | val_loss: 0.5063




parveidojums_7 33/50 | train_loss: 0.6402 | val_loss: 0.5014




parveidojums_7 34/50 | train_loss: 0.8107 | val_loss: 0.4859




parveidojums_7 35/50 | train_loss: 0.7888 | val_loss: 0.4787




parveidojums_7 36/50 | train_loss: 0.6602 | val_loss: 0.4592




parveidojums_7 37/50 | train_loss: 0.6928 | val_loss: 0.4485




parveidojums_7 38/50 | train_loss: 0.7624 | val_loss: 0.4395




parveidojums_7 39/50 | train_loss: 0.5456 | val_loss: 0.4390




parveidojums_7 40/50 | train_loss: 0.5772 | val_loss: 0.4373




parveidojums_7 41/50 | train_loss: 0.6686 | val_loss: 0.4258




parveidojums_7 42/50 | train_loss: 0.6479 | val_loss: 0.4133




parveidojums_7 43/50 | train_loss: 0.6733 | val_loss: 0.4026




parveidojums_7 44/50 | train_loss: 0.5278 | val_loss: 0.4016




parveidojums_7 45/50 | train_loss: 0.6248 | val_loss: 0.4025




parveidojums_7 46/50 | train_loss: 0.6213 | val_loss: 0.3990




parveidojums_7 47/50 | train_loss: 0.5704 | val_loss: 0.4036
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_7/





parveidojums_8 0/50 | train_loss: 2.1564 | val_loss: 1.5498




parveidojums_8 1/50 | train_loss: 2.2995 | val_loss: 1.5286




parveidojums_8 2/50 | train_loss: 2.1527 | val_loss: 1.4950




parveidojums_8 3/50 | train_loss: 1.9994 | val_loss: 1.4497




parveidojums_8 4/50 | train_loss: 2.1091 | val_loss: 1.3915




parveidojums_8 5/50 | train_loss: 1.8521 | val_loss: 1.3162




parveidojums_8 6/50 | train_loss: 1.9632 | val_loss: 1.2305




parveidojums_8 7/50 | train_loss: 1.7318 | val_loss: 1.1434




parveidojums_8 8/50 | train_loss: 1.8367 | val_loss: 1.0552




parveidojums_8 9/50 | train_loss: 1.6385 | val_loss: 0.9638




parveidojums_8 10/50 | train_loss: 1.5095 | val_loss: 0.8680




parveidojums_8 11/50 | train_loss: 1.4320 | val_loss: 0.7688




parveidojums_8 12/50 | train_loss: 1.2769 | val_loss: 0.6620


                                                    

parveidojums_8 13/50 | train_loss: 1.1829 | val_loss: 0.5727




parveidojums_8 14/50 | train_loss: 1.2100 | val_loss: 0.5207




parveidojums_8 15/50 | train_loss: 1.0586 | val_loss: 0.4952




parveidojums_8 16/50 | train_loss: 1.0986 | val_loss: 0.4775




parveidojums_8 17/50 | train_loss: 1.0557 | val_loss: 0.4607




parveidojums_8 18/50 | train_loss: 1.0567 | val_loss: 0.4524




parveidojums_8 19/50 | train_loss: 1.0558 | val_loss: 0.4491




parveidojums_8 20/50 | train_loss: 0.9071 | val_loss: 0.4438




parveidojums_8 21/50 | train_loss: 1.0472 | val_loss: 0.4372




parveidojums_8 22/50 | train_loss: 0.9424 | val_loss: 0.4307




parveidojums_8 23/50 | train_loss: 0.8769 | val_loss: 0.4321




parveidojums_8 24/50 | train_loss: 0.9158 | val_loss: 0.4318




parveidojums_8 25/50 | train_loss: 0.8800 | val_loss: 0.4321




parveidojums_8 26/50 | train_loss: 0.9964 | val_loss: 0.4306
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_8/





parveidojums_9 0/50 | train_loss: 2.3875 | val_loss: 3.3975




parveidojums_9 1/50 | train_loss: 2.5997 | val_loss: 3.3805




parveidojums_9 2/50 | train_loss: 2.4700 | val_loss: 3.3539




parveidojums_9 3/50 | train_loss: 2.4094 | val_loss: 3.3205




parveidojums_9 4/50 | train_loss: 2.5385 | val_loss: 3.2771




parveidojums_9 5/50 | train_loss: 2.3752 | val_loss: 3.2202




parveidojums_9 6/50 | train_loss: 2.3245 | val_loss: 3.1509




parveidojums_9 7/50 | train_loss: 2.1082 | val_loss: 3.0726




parveidojums_9 8/50 | train_loss: 2.3352 | val_loss: 2.9873




parveidojums_9 9/50 | train_loss: 2.1952 | val_loss: 2.8870




parveidojums_9 10/50 | train_loss: 2.0802 | val_loss: 2.7952




parveidojums_9 11/50 | train_loss: 1.8136 | val_loss: 2.7037




parveidojums_9 12/50 | train_loss: 1.8485 | val_loss: 2.6050




parveidojums_9 13/50 | train_loss: 1.5808 | val_loss: 2.5080




parveidojums_9 14/50 | train_loss: 1.5231 | val_loss: 2.4209




parveidojums_9 15/50 | train_loss: 1.6909 | val_loss: 2.3310




parveidojums_9 16/50 | train_loss: 1.6364 | val_loss: 2.2505




parveidojums_9 17/50 | train_loss: 1.4768 | val_loss: 2.1815




parveidojums_9 18/50 | train_loss: 1.5079 | val_loss: 2.1194




parveidojums_9 19/50 | train_loss: 1.3731 | val_loss: 2.0521




parveidojums_9 20/50 | train_loss: 1.3346 | val_loss: 1.9928




parveidojums_9 21/50 | train_loss: 1.2943 | val_loss: 1.9394




parveidojums_9 22/50 | train_loss: 1.1972 | val_loss: 1.9149




parveidojums_9 23/50 | train_loss: 1.3237 | val_loss: 1.9125




parveidojums_9 24/50 | train_loss: 1.1694 | val_loss: 1.9007




parveidojums_9 25/50 | train_loss: 1.3191 | val_loss: 1.8783




parveidojums_9 26/50 | train_loss: 1.1722 | val_loss: 1.8752




parveidojums_9 27/50 | train_loss: 1.1810 | val_loss: 1.8415




parveidojums_9 28/50 | train_loss: 1.1610 | val_loss: 1.8218




parveidojums_9 29/50 | train_loss: 1.1065 | val_loss: 1.7994




parveidojums_9 30/50 | train_loss: 1.1847 | val_loss: 1.7950




parveidojums_9 31/50 | train_loss: 1.1721 | val_loss: 1.7909




parveidojums_9 32/50 | train_loss: 1.2320 | val_loss: 1.7876




parveidojums_9 33/50 | train_loss: 1.1432 | val_loss: 1.7546




parveidojums_9 34/50 | train_loss: 1.0791 | val_loss: 1.7333




parveidojums_9 35/50 | train_loss: 1.1059 | val_loss: 1.7082




parveidojums_9 36/50 | train_loss: 1.1303 | val_loss: 1.7036




parveidojums_9 37/50 | train_loss: 1.1653 | val_loss: 1.7100




parveidojums_9 38/50 | train_loss: 0.9869 | val_loss: 1.6821




parveidojums_9 39/50 | train_loss: 0.9863 | val_loss: 1.6583




parveidojums_9 40/50 | train_loss: 0.9895 | val_loss: 1.6281




parveidojums_9 41/50 | train_loss: 1.0390 | val_loss: 1.6240




parveidojums_9 42/50 | train_loss: 1.0206 | val_loss: 1.6165




parveidojums_9 43/50 | train_loss: 0.9430 | val_loss: 1.6038




parveidojums_9 44/50 | train_loss: 1.0518 | val_loss: 1.5760




parveidojums_9 45/50 | train_loss: 0.8934 | val_loss: 1.5566




parveidojums_9 46/50 | train_loss: 1.0490 | val_loss: 1.5649




parveidojums_9 47/50 | train_loss: 0.9688 | val_loss: 1.5850




parveidojums_9 48/50 | train_loss: 0.9846 | val_loss: 1.5878




parveidojums_9 49/50 | train_loss: 0.9668 | val_loss: 1.5915
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_9/





parveidojums_10 0/50 | train_loss: 2.2867 | val_loss: 2.3243




parveidojums_10 1/50 | train_loss: 2.2232 | val_loss: 2.3151




parveidojums_10 2/50 | train_loss: 2.2325 | val_loss: 2.2998




parveidojums_10 3/50 | train_loss: 2.2581 | val_loss: 2.2783




parveidojums_10 4/50 | train_loss: 2.2426 | val_loss: 2.2468




parveidojums_10 5/50 | train_loss: 2.2164 | val_loss: 2.2115




parveidojums_10 6/50 | train_loss: 2.1013 | val_loss: 2.1656




parveidojums_10 7/50 | train_loss: 2.2448 | val_loss: 2.1082




parveidojums_10 8/50 | train_loss: 2.0395 | val_loss: 2.0524




parveidojums_10 9/50 | train_loss: 2.1751 | val_loss: 1.9930




parveidojums_10 10/50 | train_loss: 1.8002 | val_loss: 1.9441




parveidojums_10 11/50 | train_loss: 1.5733 | val_loss: 1.9013




parveidojums_10 12/50 | train_loss: 1.5689 | val_loss: 1.8693




parveidojums_10 13/50 | train_loss: 1.7835 | val_loss: 1.8435




parveidojums_10 14/50 | train_loss: 1.6320 | val_loss: 1.8246




parveidojums_10 15/50 | train_loss: 1.4472 | val_loss: 1.8068




parveidojums_10 16/50 | train_loss: 1.3816 | val_loss: 1.7818




parveidojums_10 17/50 | train_loss: 1.4410 | val_loss: 1.7481




parveidojums_10 18/50 | train_loss: 1.4063 | val_loss: 1.7158




parveidojums_10 19/50 | train_loss: 1.2947 | val_loss: 1.6791




parveidojums_10 20/50 | train_loss: 1.2564 | val_loss: 1.6400




parveidojums_10 21/50 | train_loss: 1.2082 | val_loss: 1.6010




parveidojums_10 22/50 | train_loss: 1.1595 | val_loss: 1.5631




parveidojums_10 23/50 | train_loss: 1.2140 | val_loss: 1.5277




parveidojums_10 24/50 | train_loss: 1.1653 | val_loss: 1.4954




parveidojums_10 25/50 | train_loss: 1.0744 | val_loss: 1.4613




parveidojums_10 26/50 | train_loss: 0.9690 | val_loss: 1.4304




parveidojums_10 27/50 | train_loss: 1.2789 | val_loss: 1.4026




parveidojums_10 28/50 | train_loss: 1.0555 | val_loss: 1.3710




parveidojums_10 29/50 | train_loss: 1.0353 | val_loss: 1.3497




parveidojums_10 30/50 | train_loss: 1.0507 | val_loss: 1.3372




parveidojums_10 31/50 | train_loss: 1.0676 | val_loss: 1.3289




parveidojums_10 32/50 | train_loss: 0.9208 | val_loss: 1.3184




parveidojums_10 33/50 | train_loss: 0.9592 | val_loss: 1.3078




parveidojums_10 34/50 | train_loss: 0.9227 | val_loss: 1.2923




parveidojums_10 35/50 | train_loss: 1.0051 | val_loss: 1.2766




parveidojums_10 36/50 | train_loss: 0.9223 | val_loss: 1.2646




parveidojums_10 37/50 | train_loss: 1.0328 | val_loss: 1.2488




parveidojums_10 38/50 | train_loss: 0.9180 | val_loss: 1.2414




parveidojums_10 39/50 | train_loss: 0.8419 | val_loss: 1.2431




parveidojums_10 40/50 | train_loss: 0.8070 | val_loss: 1.2399




parveidojums_10 41/50 | train_loss: 0.7185 | val_loss: 1.2333




parveidojums_10 42/50 | train_loss: 0.8456 | val_loss: 1.2239




parveidojums_10 43/50 | train_loss: 0.7906 | val_loss: 1.2087




parveidojums_10 44/50 | train_loss: 0.8038 | val_loss: 1.1990




parveidojums_10 45/50 | train_loss: 0.8456 | val_loss: 1.2018




parveidojums_10 46/50 | train_loss: 0.9507 | val_loss: 1.2079




parveidojums_10 47/50 | train_loss: 0.7784 | val_loss: 1.2104




parveidojums_10 48/50 | train_loss: 0.8068 | val_loss: 1.2167
Notika agrā apstāšanās
Saglabāts adapteris: parveidojums_10/



# Darbā definētās metodes izpilde

In [10]:
if experiment:
    # Vērtēšanas datu kopa formātā <lemma, lemmu grupas apzīmējums, sākotnējā semantiskā kategorija, mērķa semantiskā kategorija>
    lemmas = [
        ("veikt", "V", "Darīt", "Rezultāts"),
        ("zvaigzne", "V", "Priekšmets", "Ietver nosaukto"),
        ("pūst", "V", "Būt procesā", "Process"),
        ("riebt", "V", "Būt stāvoklī", "Stāvoklis"),
        ("medicīna", "V", "Abstrakts nojēgums", "Saistīts ar nosaukto"),
        ("skriet", "V", "Darīt", "Darītājs (dzīvs)"),
        ("ideja", "V", "Abstrakts nojēgums", "Saistīts ar nosaukto"),

        ("nest", "I", "Darīt", "Darbība"),
        ("iet", "I", "Būt procesā", "Process"),
        ("ir", "I", "Būt stāvoklī", "Stāvoklis"),

        ("atklusināt", "J", "Darīt", "Instruments"),
        ("sejauts", "J", "Priekšmets", "Ietver nosaukto"),
        ("telpiskot", "J", "Būt procesā", "Process"),
        ("sliecināt", "J", "Būt stāvoklī", "Stāvoklis"),
        ("aizstājeklis", "J", "Abstrakts nojēgums", "Saistīts ar nosaukto"),

        ("tērbstīt", "N", "Darīt", "Vieta (lietv)"),
        ("plakstule", "N", "Priekšmets", "Ietver nosaukto"),
        ("glimžēt", "N", "Būt procesā", "Process"),
        ("skurpelīgs", "N", "Būt stāvoklī", "Stāvoklis"),
        ("zvilgsme", "N", "Abstrakts nojēgums", "Saistīts ar nosaukto")
    ]

    # Iespējamie pārveidojumu veidi
    POSSIBLE_TRANSFORMATIONS = [
        ("Darīt", "Darbība"),
        ("Darīt", "Rezultāts"),
        ("Darīt", "Darītājs (dzīvs)"),
        ("Priekšmets", "Ietver nosaukto"),
        ("Būt procesā", "Process"),
        ("Būt stāvoklī", "Stāvoklis"),
        ("Abstrakts nojēgums", "Saistīts ar nosaukto"),
        ("Darīt", "Vieta (lietv)"),
        ("Darīt", "Cits"),
        ("Darīt", "Instruments")
    ]

    _model_cache = {}

    # Funkcija, kas automātiski izvēlas modeli atbilstoši pārveidojumam
    def get_finetuned_model(semantic_category_1, semantic_category_2):
        try:
            idx = POSSIBLE_TRANSFORMATIONS.index((semantic_category_1, semantic_category_2))
        except ValueError:
            return None

        ckpt = f"parveidojums_{idx+1}"

        # Ja modelis jau nav saglabāts kešatmiņā, tad saglabā, lai vēlāk atkārtoti to izmantotu
        if ckpt not in _model_cache:
            # Ielādē bāzes svarus
            base = CustomTransformerModel(vocab_size).to(device)
            base.load_state_dict(torch.load("Pretrained.pth", map_location=device, weights_only=True), strict=True)

            # Pieliek PEFT adapteri, kas glabājas mapē `ckpt`
            m = PeftModel.from_pretrained(base, ckpt, local_files_only=True, is_trainable=False).to(device)
            m.eval()
            _model_cache[ckpt] = m
        return _model_cache[ckpt]

    # Funkcija, kas validē kandidātu, izmantojot korpusa API
    def validate_word(word):
        encoded_word = urllib.parse.quote(word)
        url = ("https://nosketch.korpuss.lv/bonito/run.cgi/view?"
              "corpname=CommonCrawl&format=json&pagesize=2&fromp=0&attrs=word&"
              "ctxattrs=word%2Ctag&kwicleftctx=5%23&kwicrightctx=5%23&async=0&"
              f"q=q[lc%3D%22{encoded_word}%22+|+lemma_lc%3D%22{encoded_word}%22]")

        try:
            r = requests.get(url, timeout=10)
            if r.status_code == 200:
                freq = r.json().get("fullsize", 0)
                if freq == 0:
                    typ = "F" # nav sastopams
                elif 1 <= freq <= 5:
                    typ = "M" # maz sastopams - nepieciešama manuāla pārbaude
                else:
                    typ = "T" # daudz sastopams
                return typ, freq
            return "validation_error", None
        except Exception as e:
            print(f"Validācijas kļūda vārdam '{word}': {e}")
            return "validation_error", None

    results = []

    # Iterē caur katru derivējamo lemmu
    for lemma in lemmas:
        word = lemma[0]
        semantic_category_1 = lemma[2]
        semantic_category_2 = lemma[3]

        model = get_finetuned_model(semantic_category_1, semantic_category_2)

        if model is None:
            print(f"Nav modeļa pārveidojumam ({semantic_category_1}→{semantic_category_2})")
            continue

        src_tok = torch.tensor([tokenizer.encode(word)]).to(device)
        response = beam_generate(model, src_tok, num_beams=5)
        print(f"{lemma[0]}, {lemma[2]}, {lemma[3]}, {response}")

        # Validē katru kandidātu pret korpusu kolekciju un pievieno rezultātu sarakstam
        for cand in response:
            typ, freq = validate_word(cand)
            results.append({
                "Lemma": word,
                "Semantiskā_kat_1": semantic_category_1,
                "Kandidāts": cand,
                "Semantiskā_kat_2": semantic_category_2,
                "Biežums": freq,
                "Tips": typ,
                "Grupa": lemma[1]
            })

    # Saglabā rezultātus TSV failā, kas ir formātā '<metode/modelis>.tsv'
    output_tsv = f"special_model_results.tsv"

    with open(output_tsv, "w", newline="", encoding="utf-8-sig") as tsvfile:
        writer = csv.writer(tsvfile, delimiter="\t")
        header = ["Lemma", "Semantiskā_kat_1", "Kandidāts", "Semantiskā_kat_2", "Biežums", "Tips", "Grupa"]
        writer.writerow(header)

        for row in results:
            out_row = [row["Lemma"], row["Semantiskā_kat_1"], row["Kandidāts"], row["Semantiskā_kat_2"],
                      row["Biežums"], row["Tips"], row["Grupa"]]
            writer.writerow(out_row)

    print(f"Rezultāti saglabāti TSV failā: {output_tsv}")

  output = torch._nested_tensor_from_mask(


veikt, Darīt, Rezultāts, ['veikums', 'veicums', 'veiks', 'veikba', 'veiciekums']
zvaigzne, Priekšmets, Ietver nosaukto, ['zvaigžņots', 'zvaigžņains', 'zvaigznins', 'zvaigznots', 'zvaigznains']
pūst, Būt procesā, Process, ['pūšana', 'pūšanās', 'pūsta', 'pūšanā', 'pūšanām']
riebt, Būt stāvoklī, Stāvoklis, ['riebšana', 'rieba', 'riebta', 'riebdana', 'riebšanas']
medicīna, Abstrakts nojēgums, Saistīts ar nosaukto, ['medicīns', 'medicīnis', 'medicīnsks', 'medicīnisks', 'medicīnējs']
skriet, Darīt, Darītājs (dzīvs), ['skrienējs', 'skrienētājs', 'skrienis', 'skrietājs', 'skriecējs']
ideja, Abstrakts nojēgums, Saistīts ar nosaukto, ['ides', 'idesks', 'idejs', 'idejis', 'idejēs']
nest, Darīt, Darbība, ['nesīšana', 'nesta', 'nesšana', 'nestu', 'nests']
iet, Būt procesā, Process, ['iešana', 'ieta', 'iešanā', 'iešanās', 'iets']
ir, Būt stāvoklī, Stāvoklis, ['ires', 'iru', 'irā', 'ira', 'iri']
atklusināt, Darīt, Instruments, ['atklusinātājs', 'atklusinājs', 'atklusināts', 'atklusinātājjs', 'atklusi

# Pamattrenētā modeļa vispārīga pārbaude

In [18]:
# Lietotāja ievade
user_input = input("Ievadi lemmu: ")

model = CustomTransformerModel(vocab_size).to(device)
model.load_state_dict(torch.load("Pretrained.pth", weights_only=True), strict=True)

# Ievades secība dalīšana tekstvienībās
src_tok = torch.tensor([tokenizer.encode(user_input)]).to(device)

# Ģenerējam 5 kandidātus
print(beam_generate(model, src_tok, num_beams=5))

Ievadi lemmu: rakstīt
['raksta', 'rakstīja', 'rakstīta', 'rakstītas', 'rakstīts']
