# T5rus с промптом + LoRA + псевдотекст

T5rus хорошо знает русский язык но не знает json и плохо умеет генерировать структурированные данные (он на них не учился) поэтому следующий этап - делать промежуточное преобразование в псевдокод и обратно, там мы избежим поломки структуры


In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
!ls -la /content/drive/MyDrive/VKR/


total 16
drwx------ 2 root root 4096 Apr 27 05:50 dataset
drwx------ 2 root root 4096 Apr 27 05:53 library
drwx------ 2 root root 4096 Apr 29 09:32 metrics_T5ru
drwx------ 2 root root 4096 Apr 29 09:32 T5ru_lora_outputs


In [3]:
!pip install -U spacy > /dev/null 2>&1
!python -m spacy download ru_core_news_sm > /dev/null 2>&1
!pip install wandb > /dev/null 2>&1
!pip install datasets > /dev/null 2>&1

In [4]:
import transformers
import datasets
import huggingface_hub
import torch
import wandb

print(transformers.__version__)
print(datasets.__version__)
print(huggingface_hub.__version__)
print(torch.__version__)

4.51.3
3.5.1
0.30.2
2.6.0+cu124


Будем напрямую генерировать json по сцене, для этого дообучим T5(Text-To-Text Transfer Transformer) + LoRA

In [5]:
import json
import torch
import os
import sys
import warnings
import random

import numpy as np

from pathlib import Path
from datasets import Dataset
from transformers import T5Tokenizer, T5ForConditionalGeneration, TrainingArguments, Trainer
from transformers import TrainerCallback

from peft import LoraConfig, get_peft_model, TaskType, PeftConfig,PeftModel
from tqdm import tqdm

import matplotlib.pyplot as plt

# отключаем их все чтобы картинку не портили
warnings.filterwarnings("ignore", category=FutureWarning)

DATA_DIR = Path("/content/drive/MyDrive/VKR/dataset/dataset_tmp").expanduser()
#DATA_DIR = Path("/content/drive/MyDrive/VKR/dataset/dataset_small").expanduser()
MODEL_NAME = "sberbank-ai/ruT5-base"

lib_path = os.path.abspath(os.path.join(os.getcwd(), '/content/drive/MyDrive/VKR/'))
sys.path.append(lib_path)

from library.metrics_pseudo import evaluate_all_metrics
from library.safe_compute_metrics import safe_compute_metrics

# перевод в псевдотекст и обратно
from library.utils import json_to_pseudo_text, pseudo_text_to_json

### Промпт с "few shorts" примерами

In [6]:
# промпт очень большой, поэтому нужно чтобы все влезало
PROMPT = """
Ты должен проанализировать описание сцены и вернуть ответ в специальном псевдоформате.

Твоя задача:
- Найди все объекты, упомянутые в описании, и их признаки.
- Верни результат строго в псевдоформате — одной строкой.

Формат:
объект1 (признак1 признак2) объект2 () объект3 (признак)

Требования:
- Каждый объект указывается один раз.
- Признаки пишутся через пробел внутри круглых скобок.
- Если признаки отсутствуют, используй пустые скобки ().
- Не добавляй объектов или признаков, которых нет в описании.
- В ответе не должно быть никаких пояснений, комментариев или заголовков — только одна строка с результатом.

Примеры:

Описание: Маленький красный стол стоит у окна.
Ответ:
стол (маленький красный) окно ()

Описание: {description}

Ответ:
"""

print(len(PROMPT))

750


        # Логируем метрики
        # 'f1_objects': только по объектам,
        # 'f1_attributes_macro': Это среднее значение F1 по атрибутам (признакам),
        #                        рассчитанное отдельно для каждого объекта,
        #                        а потом усреднённое по всем объектам.
        #'f1_attributes_weighted': То же, но взвешенное по числу признаков в эталоне
        #'f1_global_obj_attr_pairs': F1 по всем (объект, признак) парам как единому множеству
        #'f1_combined_simple': простое среднее между двух ключевых компонент качества (F1 объекты и F1 признаки)
        #'f1_combined_weighted': взвешенное среднее двух F1-метрик с учетом числа объектов и числа признаков

In [7]:
def postprocess_text(preds, labels):
    preds_json = []
    labels_json = []

    for pred_str, label_str in zip(preds, labels):
        try:
            pred_json = pseudo_text_to_json(pred_str.strip())
        except Exception as e:
            #print("Ошибка парсинга предсказания:", pred_str, "|", e)
            pred_json = []

        try:
            label_json = pseudo_text_to_json(label_str.strip())
        except Exception as e:
            #print("Ошибка парсинга ground truth:", label_str, "|", e)
            label_json = []

        preds_json.append(pred_json)
        labels_json.append(label_json)

    # посмотрим что выдает
    print(preds_json[0], labels_json[0])

    return preds_json, labels_json

def compute_metrics(eval_pred):
    predictions, labels = eval_pred

    # Если predictions — logits, нужно брать argmax
    if isinstance(predictions, tuple):
        predictions = predictions[0]

    if isinstance(predictions, torch.Tensor):
        predictions = predictions.cpu().numpy()
    if isinstance(labels, torch.Tensor):
        labels = labels.cpu().numpy()

    # logits -> ids
    predictions = np.argmax(predictions, axis=-1)

    # Декодируем токены
    decoded_preds = tokenizer.batch_decode(predictions, skip_special_tokens=True)
    decoded_labels = tokenizer.batch_decode(labels, skip_special_tokens=True)

    # Превращаем строки в JSON-списки через внешний postprocess_text
    preds_json, labels_json = postprocess_text(decoded_preds, decoded_labels)

    # Метрики
    f1_objects_list = []
    f1_attributes_macro_list = []
    f1_attributes_weighted_list = []
    f1_combined_simple_list = []
    f1_combined_weighted_list = []
    f1_global_obj_attr_pairs_list = []

    valid = 0

    for pred, label in zip(preds_json, labels_json):

        #print("pred:", pred, type(pred))
        #print("label:", label, type(label))
        #print("-------------------------------")

        if not isinstance(pred, list) or not isinstance(label, list):
            f1_objects_list.append(0.0)
            f1_attributes_macro_list.append(0.0)
            f1_attributes_weighted_list.append(0.0)
            f1_combined_simple_list.append(0.0)
            f1_combined_weighted_list.append(0.0)
            f1_global_obj_attr_pairs_list.append(0.0)
            #print("bad evaluation")
            continue

        try:
            scores = evaluate_all_metrics(label, pred)
            #print("good:",scores)
            f1_objects_list.append(scores["f1_objects"])
            f1_attributes_macro_list.append(scores["f1_attributes_macro"])
            f1_attributes_weighted_list.append(scores["f1_attributes_weighted"])
            f1_combined_simple_list.append(scores["f1_combined_simple"])
            f1_combined_weighted_list.append(scores["f1_combined_weighted"])
            f1_global_obj_attr_pairs_list.append(scores["f1_global_obj_attr_pairs"])
            valid += 1

        except Exception as e:
            f1_objects_list.append(0.0)
            f1_attributes_macro_list.append(0.0)
            f1_attributes_weighted_list.append(0.0)
            f1_combined_simple_list.append(0.0)
            f1_combined_weighted_list.append(0.0)
            f1_global_obj_attr_pairs_list.append(0.0)

    total = len(decoded_preds)

    aggregated_scores = {
        "f1_objects": round(sum(f1_objects_list) / total, 4),
        "f1_attributes_macro": float(round(sum(f1_attributes_macro_list) / total, 4)),
        "f1_attributes_weighted": float(round(sum(f1_attributes_weighted_list) / total, 4)),
        "f1_combined_simple": float(round(sum(f1_combined_simple_list) / total, 4)),
        "f1_combined_weighted": float(round(sum(f1_combined_weighted_list) / total, 4)),
        "f1_global_obj_attr_pairs": float(round(sum(f1_global_obj_attr_pairs_list) / total, 4)),
        "valid_json_rate": float(round(valid / total, 4)),
        "total_samples": float(total),
        "valid_samples": float(valid),
    }
    print("aggregated_scores:", aggregated_scores)
    return aggregated_scores

### Параметры модели и обучения

инъекции будем делать во все слои связанные с вниманием - это должно сделать модель гибче

In [8]:
lora_rank = 8
lora_alpha = 16
lora_target_modules=["q", "v"]   # в какие слои делаем инъекции
lora_dropout=0.1

per_device_train_batch_size = 8
num_train_epochs = 50

INPUT_SEQ_LENGTH = 1100
OUTPUT_SEQ_LENGTH = 512

# параметры генерации
NUM_BEAMS = 6

# лучше beam подлиннее чем температура, тк у нас структурированный текст
#TEMPERATURE = 0.7

In [9]:
run = wandb.init(
    entity="shiltsov-da",
    # Set the wandb project where this run will be logged.
    project="vkr-hse-object-detection",
    # Track hyperparameters and run metadata.
    group="T5LoRAtext2textPsC",
    tags=["text2text", "lora", MODEL_NAME],
    config={
        "architecture": "FlanT5-LoRA-text2text-PsC",
        "notebook":"T5ru-LoRA-text2text-parser-v3-Colab.ipynb",
        "base_model": MODEL_NAME,
        "lora_rank": lora_rank,
        "lora_alpha": lora_alpha,
        "lora_target_modules": lora_target_modules,
        "per_device_train_batch_size": per_device_train_batch_size,
        "num_train_epochs": num_train_epochs
    },
)



<IPython.core.display.Javascript object>

[34m[1mwandb[0m: Logging into wandb.ai. (Learn how to deploy a W&B server locally: https://wandb.me/wandb-server)
[34m[1mwandb[0m: You can find your API key in your browser here: https://wandb.ai/authorize?ref=models
wandb: Paste an API key from your profile and hit enter:

 ··········


[34m[1mwandb[0m: No netrc file found, creating one.
[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc
[34m[1mwandb[0m: Currently logged in as: [33mshiltsov[0m ([33mshiltsov-da[0m) to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


In [10]:
# Грузим батчи
def make_target(scene_objects):
    objects_dict = {}
    for obj in scene_objects:
        for name, attrs in obj.items():
            objects_dict[name] = attrs
    ps_text = json_to_pseudo_text([objects_dict])
    return ps_text

data = []
for path in sorted(DATA_DIR.glob("*.jsonl")):
    with open(path, "r", encoding="utf-8") as f:
        for line in f:
            item = json.loads(line)
            description = item["description"]
            target = make_target(item["scene"]["objects"])
            data.append({
                "input": PROMPT.format(description=description),
                "target": target,
            })


# Делаем датасет
dataset = Dataset.from_list(data)
dataset = dataset.train_test_split(test_size=0.05, seed=42)
train_ds, val_ds = dataset["train"], dataset["test"]

print(train_ds[0])

{'input': '\nТы должен проанализировать описание сцены и вернуть ответ в специальном псевдоформате.\n\nТвоя задача:\n- Найди все объекты, упомянутые в описании, и их признаки.\n- Верни результат строго в псевдоформате — одной строкой.\n\nФормат:\nобъект1 (признак1 признак2) объект2 () объект3 (признак)\n\nТребования:\n- Каждый объект указывается один раз.\n- Признаки пишутся через пробел внутри круглых скобок.\n- Если признаки отсутствуют, используй пустые скобки ().\n- Не добавляй объектов или признаков, которых нет в описании.\n- В ответе не должно быть никаких пояснений, комментариев или заголовков — только одна строка с результатом.\n\nПримеры:\n\nОписание: Маленький красный стол стоит у окна.\nОтвет:\nстол (маленький красный) окно ()\n\nОписание: Чемодан стоит рядом с цветным телевизором, возле которого лежит ключ.\n\nОтвет:\n', 'target': 'ключ () телевизор (цветной) чемодан ()'}


In [11]:
# Токенайзер
tokenizer = T5Tokenizer.from_pretrained(MODEL_NAME)

def preprocess(example):
    inputs = tokenizer(example["input"], padding="max_length", truncation=True, max_length=INPUT_SEQ_LENGTH)
    targets = tokenizer(example["target"], padding="max_length", truncation=True, max_length=OUTPUT_SEQ_LENGTH)
    inputs["labels"] = targets["input_ids"]

    # сохраняем оригинал обратно в пример
    # inputs["target_raw"] = example["target_raw"]
    return inputs

train_ds = train_ds.map(preprocess, batched=False)
val_ds = val_ds.map(preprocess, batched=False)

# Грузим модель + LoRA
model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)

lora_config = LoraConfig(
    r=lora_rank, # ранг низкоранговой матрицы
    lora_alpha=lora_alpha,
    target_modules=lora_target_modules,
    # target_modules=["q", "k", "v", "o"]
    lora_dropout=lora_dropout,
    bias="none",
    task_type=TaskType.SEQ_2_SEQ_LM
)

model = get_peft_model(model, lora_config)

# Обучение
training_args = TrainingArguments(
    output_dir="/content/drive/MyDrive/VKR/T5ru_PsC_lora_outputs",
    per_device_train_batch_size=per_device_train_batch_size,
    per_device_eval_batch_size=4,
    num_train_epochs=num_train_epochs,
    logging_dir="/content/drive/MyDrive/VKR/logs_T5ru_PsC",
    logging_steps=50,
    eval_strategy="epoch",
    eval_accumulation_steps=10, # для маленькой памяти GPU - ск бачей одновременно грузить
    save_strategy="epoch",
    save_total_limit=2,
    load_best_model_at_end=True,
    report_to="wandb",
    fp16=True
)


trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_ds,
    eval_dataset=val_ds,
    tokenizer=tokenizer,
    compute_metrics=compute_metrics,
)

# грузим уже обученную
#trainer.train(resume_from_checkpoint=True)

trainer.train()
model.save_pretrained("/content/drive/MyDrive/VKR/T5ru_PsC_lora_outputs")
run.finish()


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/20.4k [00:00<?, ?B/s]

spiece.model:   0%|          | 0.00/1.00M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/2.20k [00:00<?, ?B/s]

You are using the default legacy behaviour of the <class 'transformers.models.t5.tokenization_t5.T5Tokenizer'>. This is expected, and simply means that the `legacy` (previous) behavior will be used so nothing changes for you. If you want to use the new behaviour, set `legacy=False`. This should only be set if you understand what it means, and thoroughly read the reason why this was added as explained in https://github.com/huggingface/transformers/pull/24565


Map:   0%|          | 0/4801 [00:00<?, ? examples/s]

Map:   0%|          | 0/253 [00:00<?, ? examples/s]

config.json:   0%|          | 0.00/1.39k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/892M [00:00<?, ?B/s]

No label_names provided for model class `PeftModelForSeq2SeqLM`. Since `PeftModel` hides base models input arguments, if label_names is not given, label_names can't be set automatically within `Trainer`. Note that empty label_names list will be used instead.
Passing a tuple of `past_key_values` is deprecated and will be removed in Transformers v4.48.0. You should pass an instance of `EncoderDecoderCache` instead, e.g. `past_key_values=EncoderDecoderCache.from_legacy_cache(past_key_values)`.


Epoch,Training Loss,Validation Loss,F1 Objects,F1 Attributes Macro,F1 Attributes Weighted,F1 Combined Simple,F1 Combined Weighted,F1 Global Obj Attr Pairs,Valid Json Rate,Total Samples,Valid Samples
1,0.1643,0.089051,0.245,0.0052,0.0158,0.1251,0.2312,0.0078,1.0,253.0,253.0
2,0.09,0.049482,0.5138,0.0713,0.1662,0.2926,0.4376,0.1251,1.0,253.0,253.0
3,0.0723,0.040061,0.5416,0.1401,0.2918,0.3409,0.4394,0.2175,1.0,253.0,253.0
4,0.062,0.033005,0.5691,0.1811,0.3707,0.3751,0.4841,0.2794,1.0,253.0,253.0
5,0.0562,0.028521,0.5898,0.2414,0.4389,0.4156,0.5133,0.3507,1.0,253.0,253.0
6,0.0474,0.025599,0.6415,0.2785,0.4773,0.46,0.5563,0.3983,1.0,253.0,253.0
7,0.042,0.024079,0.6637,0.3022,0.5115,0.483,0.581,0.4255,1.0,253.0,253.0
8,0.0395,0.019308,0.7272,0.3594,0.5446,0.5433,0.63,0.4841,1.0,253.0,253.0
9,0.0387,0.0192,0.7388,0.3714,0.5552,0.5551,0.6505,0.4963,1.0,253.0,253.0
10,0.0342,0.016282,0.7712,0.4009,0.5733,0.586,0.6691,0.529,1.0,253.0,253.0


[{'сиденьеь': []}, {'стул': []}, {'(': []}] [{'сиденье': ['мягкое']}, {'поручень': ['металлический', 'длинный', 'гладкий']}, {'окно': ['прозрачное', 'большое']}, {'дверь': []}]
aggregated_scores: {'f1_objects': 0.245, 'f1_attributes_macro': 0.0052, 'f1_attributes_weighted': 0.0158, 'f1_combined_simple': 0.1251, 'f1_combined_weighted': 0.2312, 'f1_global_obj_attr_pairs': 0.0078, 'valid_json_rate': 1.0, 'total_samples': 253.0, 'valid_samples': 253.0}
[{'сиденье': []}, {'дверьь': []}, {'дверь': []}, {'дверь': []}] [{'сиденье': ['мягкое']}, {'поручень': ['металлический', 'длинный', 'гладкий']}, {'окно': ['прозрачное', 'большое']}, {'дверь': []}]
aggregated_scores: {'f1_objects': 0.5138, 'f1_attributes_macro': 0.0713, 'f1_attributes_weighted': 0.1662, 'f1_combined_simple': 0.2926, 'f1_combined_weighted': 0.4376, 'f1_global_obj_attr_pairs': 0.1251, 'valid_json_rate': 1.0, 'total_samples': 253.0, 'valid_samples': 253.0}
[{'сиденье': ['гладгкое']}, {'дверь': ['прозрачное']}] [{'сиденье': ['мяг

Epoch,Training Loss,Validation Loss,F1 Objects,F1 Attributes Macro,F1 Attributes Weighted,F1 Combined Simple,F1 Combined Weighted,F1 Global Obj Attr Pairs,Valid Json Rate,Total Samples,Valid Samples
1,0.1643,0.089051,0.245,0.0052,0.0158,0.1251,0.2312,0.0078,1.0,253.0,253.0
2,0.09,0.049482,0.5138,0.0713,0.1662,0.2926,0.4376,0.1251,1.0,253.0,253.0
3,0.0723,0.040061,0.5416,0.1401,0.2918,0.3409,0.4394,0.2175,1.0,253.0,253.0
4,0.062,0.033005,0.5691,0.1811,0.3707,0.3751,0.4841,0.2794,1.0,253.0,253.0
5,0.0562,0.028521,0.5898,0.2414,0.4389,0.4156,0.5133,0.3507,1.0,253.0,253.0
6,0.0474,0.025599,0.6415,0.2785,0.4773,0.46,0.5563,0.3983,1.0,253.0,253.0
7,0.042,0.024079,0.6637,0.3022,0.5115,0.483,0.581,0.4255,1.0,253.0,253.0
8,0.0395,0.019308,0.7272,0.3594,0.5446,0.5433,0.63,0.4841,1.0,253.0,253.0
9,0.0387,0.0192,0.7388,0.3714,0.5552,0.5551,0.6505,0.4963,1.0,253.0,253.0
10,0.0342,0.016282,0.7712,0.4009,0.5733,0.586,0.6691,0.529,1.0,253.0,253.0


[{'сиденье': ['мягкое']}, {'поручень': ['металлический', 'длинный', 'гладкий']}, {'дверь': ['прозрачное', 'большое']}, {'дверь': []}] [{'сиденье': ['мягкое']}, {'поручень': ['металлический', 'длинный', 'гладкий']}, {'окно': ['прозрачное', 'большое']}, {'дверь': []}]
aggregated_scores: {'f1_objects': 0.8982, 'f1_attributes_macro': 0.6, 'f1_attributes_weighted': 0.7853, 'f1_combined_simple': 0.7491, 'f1_combined_weighted': 0.8373, 'f1_global_obj_attr_pairs': 0.7625, 'valid_json_rate': 1.0, 'total_samples': 253.0, 'valid_samples': 253.0}
[{'сиденье': ['мягкое']}, {'поручень': ['гладлический', 'длинный', 'гладкий']}, {'дверь': ['прозрачное', 'большое']}, {'дверь': []}] [{'сиденье': ['мягкое']}, {'поручень': ['металлический', 'длинный', 'гладкий']}, {'окно': ['прозрачное', 'большое']}, {'дверь': []}]
aggregated_scores: {'f1_objects': 0.9035, 'f1_attributes_macro': 0.6068, 'f1_attributes_weighted': 0.7935, 'f1_combined_simple': 0.7552, 'f1_combined_weighted': 0.8419, 'f1_global_obj_attr_pair

0,1
eval/f1_attributes_macro,▁▂▃▃▄▄▅▅▅▆▆▆▆▇▇▇▇▇▇▇▇▇█▇▇███████████████
eval/f1_attributes_weighted,▁▂▃▄▅▅▆▆▆▆▆▆▇▇▇▇▇▇▇▇████████████████████
eval/f1_combined_simple,▁▃▃▄▄▅▆▆▆▆▇▇▇▇▇▇▇▇▇▇▇███████████████████
eval/f1_combined_weighted,▁▃▃▄▄▅▆▆▆▆▆▇▇▇▇▇▇▇▇▇▇▇██████████████████
eval/f1_global_obj_attr_pairs,▁▂▃▃▄▅▅▅▆▆▆▆▆▇▇▇▇▇▇▇▇▇██████████████████
eval/f1_objects,▁▄▄▄▅▆▆▇▇▇▇▇▇▇▇█████████████████████████
eval/loss,█▅▄▃▃▂▂▂▂▂▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
eval/runtime,▁▃▃▄▃▆▆▄▆▆▇▇▇▆█▅▇▇▇▇▇▇██▅▇██▆▇▇█▇█▇██▅▆█
eval/samples_per_second,█▆▆▅▅▃▃▅▃▃▂▂▂▃▁▄▂▂▂▁▂▂▃▁▁▂▂▁▁▃▂▁▂▁▂▁▁▄▂▁
eval/steps_per_second,█▆▆▅▆▃▃▅▃▃▂▂▂▂▃▄▂▂▂▂▂▂▃▁▁▂▂▁▁▃▂▂▁▂▁▃▁▄▃▁

0,1
eval/f1_attributes_macro,0.6198
eval/f1_attributes_weighted,0.8003
eval/f1_combined_simple,0.7647
eval/f1_combined_weighted,0.8492
eval/f1_global_obj_attr_pairs,0.7848
eval/f1_objects,0.9097
eval/loss,0.00774
eval/runtime,77.3527
eval/samples_per_second,3.271
eval/steps_per_second,0.827


In [12]:
run.finish()

### Проверка

In [13]:
MODEL_DIR = "/content/drive/MyDrive/VKR/T5ru_PsC_lora_outputs"  # путь к fine-tuned модели
DEVICE = "cuda" if torch.cuda.is_available() else "cpu"

# Загрузка модели и токенизатора
print("Loading model...")
config = PeftConfig.from_pretrained(MODEL_DIR)
base_model = T5ForConditionalGeneration.from_pretrained(config.base_model_name_or_path)
model = PeftModel.from_pretrained(base_model, MODEL_DIR)
model = model.to(DEVICE)
model.eval()

tokenizer = T5Tokenizer.from_pretrained(config.base_model_name_or_path)

# Генерация
def predict(description, max_length=OUTPUT_SEQ_LENGTH):
    prompt = PROMPT.format(description=description)
    inputs = tokenizer(
        prompt,
        return_tensors="pt",
        truncation=True,
        padding=True,
        max_length=INPUT_SEQ_LENGTH
    ).to(DEVICE)

    with torch.no_grad():
        output_ids = model.generate(
            input_ids=inputs["input_ids"],
            attention_mask=inputs["attention_mask"],
            max_length=max_length,
            num_beams=NUM_BEAMS, # попробовать меньше
            #temperature=TEMPERATURE, # параметризовать
            early_stopping=True
        )

    output_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
    #print(output_text)
    #print(pseudo_text_to_json(output_text))
    try:
        parsed_json = pseudo_text_to_json(output_text)
    except Exception as e:
        print(f"Ошибка парсинга JSON: {e}")
        print("Сырые данные:", output_text)
        parsed_json = None

    return parsed_json


text = input("Введите описание сцены: ")
result = predict(text)
print("\nПредсказание:\n")
print(json.dumps(result, indent=2, ensure_ascii=False))


Loading model...
Введите описание сцены: Черный кот сидел рядом с пустой кастрюлей

Предсказание:

[
  {
    "кот": [
      "чёрный"
    ]
  },
  {
    "кастрюля": [
      "пустая"
    ]
  }
]


In [None]:
pseudo_text_to_json("кот (черный) кот (черный) кот (черный) дерево (красное) дерево ()")

## Просмотр сколько параметров учили

In [14]:
def print_trainable_parameters(model):
    trainable_params = 0
    total_params = 0

    for param in model.parameters():
        total_params += param.numel()
        if param.requires_grad:
            trainable_params += param.numel()

    print(f"Всего параметров: {total_params / 1e6:.2f}M")
    print(f"Обучаемых параметров: {trainable_params / 1e6:.2f}M")
    print(f"Доля обучаемых параметров: {100 * trainable_params / total_params:.2f}%")

# Вызов функции после создания модели

model = get_peft_model(model, lora_config)
print_trainable_parameters(model)

Всего параметров: 223.79M
Обучаемых параметров: 0.88M
Доля обучаемых параметров: 0.40%


