In [None]:
#проверка числа памяти, которая задейстована
!nvidia-smi

Mon Mar  3 20:17:04 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla T4                       Off |   00000000:00:04.0 Off |                    0 |
| N/A   69C    P8             12W /   70W |       0MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                

In [1]:
%pip install  transformers==4.47.1 accelerate==1.2.1 sentencepiece==0.2.0 optimum==1.23.3 auto-gptq==0.7.1 torchmetrics
%pip install -U bitsandbytes
import gc
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import transformers
import bitsandbytes as bnb
import subprocess
import os
import matplotlib.pyplot as plt
import seaborn as sns
from datasets import load_dataset
from torch.utils.data import DataLoader
from tqdm.auto import tqdm, trange
from IPython.display import clear_output
from random import sample
from tqdm import tqdm
from torchmetrics.functional import accuracy
from torch.optim import AdamW
from peft import PromptTuningConfig, PromptTuningInit, get_peft_model, LoraConfig, TaskType
from transformers import AutoTokenizer, AutoModelForSequenceClassification, BitsAndBytesConfig
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

Collecting transformers==4.47.1
  Downloading transformers-4.47.1-py3-none-any.whl.metadata (44 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/44.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.1/44.1 kB[0m [31m1.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting accelerate==1.2.1
  Downloading accelerate-1.2.1-py3-none-any.whl.metadata (19 kB)
Collecting optimum==1.23.3
  Downloading optimum-1.23.3-py3-none-any.whl.metadata (20 kB)
Collecting auto-gptq==0.7.1
  Downloading auto_gptq-0.7.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (18 kB)
Collecting torchmetrics
  Downloading torchmetrics-1.6.2-py3-none-any.whl.metadata (20 kB)
Collecting coloredlogs (from optimum==1.23.3)
  Downloading coloredlogs-15.0.1-py2.py3-none-any.whl.metadata (12 kB)
Collecting datasets (from optimum==1.23.3)
  Downloading datasets-3.3.2-py3-none-any.whl.metadata (19 kB)
Collecting rouge (from auto-

In [2]:
!pip install evaluate
!pip install rouge_score
!pip install sacrebleu
!pip install bert_score

Collecting evaluate
  Downloading evaluate-0.4.3-py3-none-any.whl.metadata (9.2 kB)
Downloading evaluate-0.4.3-py3-none-any.whl (84 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m84.0/84.0 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: evaluate
Successfully installed evaluate-0.4.3
Collecting rouge_score
  Downloading rouge_score-0.1.2.tar.gz (17 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: rouge_score
  Building wheel for rouge_score (setup.py) ... [?25l[?25hdone
  Created wheel for rouge_score: filename=rouge_score-0.1.2-py3-none-any.whl size=24935 sha256=8043eda4192d44487209c2ab86ac1d3242659c9d5533d122ca09142ec15d0a2c
  Stored in directory: /root/.cache/pip/wheels/1e/19/43/8a442dc83660ca25e163e1bd1f89919284ab0d0c1475475148
Successfully built rouge_score
Installing collected packages: rouge_score
Successfully installed rouge_score-0.1.2
Collecting sacrebleu
  Downloading sacre

In [3]:
from typing import List

import evaluate
import numpy as np
import pandas as pd
from tqdm import tqdm

rouge = evaluate.load("rouge")
bleu = evaluate.load("bleu")
chrf = evaluate.load("chrf")
bertscore = evaluate.load("bertscore")


def context_recall(ground_truth: str, contexts: List[str])->float:
    """
    Calc rouge btw contexts and ground truth.
    Interpretation: ngram match (recall) btw contexts and desired answer.

    ROUGE - https://huggingface.co/spaces/evaluate-metric/rouge

    return: average rouge for all contexts.
    """
    rs = []
    for c in contexts:
        rs.append(
            rouge.compute(
                predictions=[str(c)],
                references=[str(ground_truth)],
            )["rouge2"]
        )

    return np.mean(rs)


def context_precision(ground_truth: str, contexts: List[str])->float:
    """
    Calc blue btw contexts and ground truth.
    Interpretation: ngram match (precision) btw contexts and desired answer.

    BLEU - https://aclanthology.org/P02-1040.pdf
    max_order - max n-grams to count

    return: average bleu (precision2, w/o brevity penalty) for all contexts.
    """
    bs = []
    for c in contexts:

        try:
            bs.append(
                bleu.compute(
                    predictions=[str(c)],
                    references=[str(ground_truth)],
                    max_order=2,
                )["precisions"][1]
            )
        except ZeroDivisionError:
            bs.append(0)

    return np.mean(bs)


def answer_correctness_literal(
    ground_truth: str,
    answer: str,
    char_order: int = 6,
    word_order: int = 2,
    beta: float = 1,
)->float:
    """
    Calc chrF btw answer and ground truth.
    Interpretation: lingustic match btw answer and desired answer.

    chrF - https://aclanthology.org/W15-3049.pdf
    char_order - n-gram length for chars, default is 6 (from the article)
    word_order - n-gram length for words (chrF++), default is 2 (as it outperforms simple chrF)
    beta - recall weight, beta=1 - simple F1-score

    return: chrF for answ and gt.
    """

    score = chrf.compute(
        predictions=[str(answer)],
        references=[str(ground_truth)],
        word_order=word_order,
        char_order=char_order,
        beta=beta,
    )["score"]

    return score


def answer_correctness_neural(
    ground_truth: str,
    answer: str,
    model_type: str = "cointegrated/rut5-base",
)->float:
    """
    Calc bertscore btw answer and ground truth.
    Interpretation: semantic cimilarity btw answer and desired answer.

    BertScore - https://arxiv.org/pdf/1904.09675.pdf
    model_type - embeds model  (default t5 as the best from my own research and experience)

    return: bertscore-f1 for answ and gt.
    """

    score = bertscore.compute(
        predictions=[str(answer)],
        references=[str(ground_truth)],
        batch_size=1,
        model_type=model_type,
        num_layers=11,
    )["f1"]

    return score


class ValidatorSimple:
    """
    Расчет простых метрик качества для заданного датасета.
    """
    def __init__(
        self,
        neural: bool = False,
    ):
        """
        param neural: есть гпу или нет. По дефолту ее нет(
        """
        self.neural = neural

    def score_sample(
        self,
        answer: str,
        ground_truth: str,
        context: List[str],
    ):
        """
        Расчет для конкретного сэмпла в тестовом датасете.
        """
        scores = {}
        scores["context_recall"] = [
            context_recall(
                ground_truth,
                context,
            )
        ]
        scores["context_precision"] = [
            context_precision(
                ground_truth,
                context,
            )
        ]
        scores["answer_correctness_literal"] = [
            answer_correctness_literal(
                ground_truth=ground_truth,
                answer=answer,
            )
        ]
        if self.neural:
            scores["answer_correctness_neural"] = [
                answer_correctness_neural(
                    ground_truth=ground_truth,
                    answer=answer,
                )
            ]
        return scores

    def validate_rag(
        self,
        test_set: pd.DataFrame,
    ):
        """
        param test_set: пандас датасет с нужными полями: answer, ground_truth, context, question
        """

        res = {}
        for _, row in tqdm(test_set.iterrows(), "score_sample"):
            gt = row.ground_truth
            answer = row.answer
            context = row.contexts
            scores = self.score_sample(answer, gt, context)
            if not res:
                res = scores
            else:
                for k, v in scores.items():
                    res[k].extend(v)
        for k, v in res.items():
            res[k] = np.mean(res[k])
        return res

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


Downloading builder script:   0%|          | 0.00/6.27k [00:00<?, ?B/s]

Downloading builder script:   0%|          | 0.00/5.94k [00:00<?, ?B/s]

Downloading extra modules:   0%|          | 0.00/1.55k [00:00<?, ?B/s]

Downloading extra modules:   0%|          | 0.00/3.34k [00:00<?, ?B/s]

Downloading builder script:   0%|          | 0.00/9.01k [00:00<?, ?B/s]

Downloading builder script:   0%|          | 0.00/7.95k [00:00<?, ?B/s]

In [4]:
import json
import re
import ast
from typing import List, Dict, Any

def parse_all_data(file_path: str) -> List[Dict[str, Any]]:
    """Парсинг всех данных без учета времени ответа"""
    return _parse_data(file_path, include_time=False)

def parse_data_with_time(file_path: str) -> List[Dict[str, Any]]:
    """Парсинг данных с сохранением времени ответа"""
    return _parse_data(file_path, include_time=True)

def _parse_data(file_path: str, include_time: bool) -> List[Dict[str, Any]]:
    """Базовая функция парсинга"""
    with open(file_path, 'r', encoding='utf-8') as f:
        data = json.load(f)

    result = []
    for item in data:
        parsed = {
            'selected_role': item['Выбранная роль'],
            'campus': item['Кампус'],
            'education_level': item['Уровень образования'],
            'question_category': item['Категория вопроса'],
            'user_question': _clean_text(item['Вопрос пользователя']),
            'user_filters': item['user_filters'],
            'question_filters': item['question_filters'],
            'saiga_answer': _clean_text(item['Saiga']),
            'giga_answer': _clean_text(item['Giga']),
            'winner': item['Кто лучше?'],
            'comment': item['Комментарий'],
            'contexts': _parse_contexts(item['Ресурсы для ответа'])
        }

        if item.get('Уточненный вопрос пользователя'):
            parsed.update({
                'refined_question': _clean_text(item['Уточненный вопрос пользователя']),
                'refined_answer': _clean_text(item['Ответ AI (уточнение)']),
                'refined_contexts': _parse_contexts(item['Ресурсы для ответа (уточнение)'] or '')
            })

        if include_time:
            parsed.update({
                'response_time': item['Время ответа модели (сек)'],
                'refined_response_time': item.get('Время ответа модели на уточненный вопрос (сек)')
            })

        result.append(parsed)

    return result

def _parse_contexts(resources: str) -> List[Dict[str, Any]]:
    """Парсинг контекстов с использованием вашей функции"""
    contexts = []
    pattern = re.compile(r"Document\(page_content='(.*?)', metadata=({.*?})\)", re.DOTALL)

    for match in re.finditer(pattern, resources):
        content, metadata_str = match.groups()
        try:
            metadata = ast.literal_eval(metadata_str)
            tags = _extract_tags(metadata)

            contexts.append({
                'text': _clean_text(content),
                'metadata': {
                    'source': metadata.get('source'),
                    'file_name': metadata.get('file_name'),
                    'url': metadata.get('url')
                },
                'tags': tags
            })
        except Exception as e:
            print(f"Контекст не распарсился: {e}")

    return contexts

def _extract_tags(metadata: Dict) -> Dict[str, List[str]]:
    """Извлечение тегов в отдельные категории"""
    return {
        'topic_tags': [v for k,v in metadata.items() if k.startswith('topic_tag_') and v],
        'user_tags': [v for k,v in metadata.items() if k.startswith('user_tag_') and v]
    }

def _clean_text(text: str) -> str:
    """Очистка текста"""
    if not text: return ''
    return re.sub(r'\\[nrt]|[\n\r\t]+|\s+', ' ', text).strip()

In [5]:
data_v1 = parse_all_data('train_set.json')

data_v2 = parse_all_data('val_set.json')

with open('parsed_tuning.json', 'w', encoding='utf-8') as f:
    json.dump(data_v1, f, ensure_ascii=False)

with open('parsed_dash.json', 'w', encoding='utf-8') as f:
    json.dump(data_v2, f, ensure_ascii=False)

In [6]:
import json

with open('parsed_tuning.json', 'r', encoding='utf-8') as f:
    training_data = json.load(f)

In [7]:
formatted_data = []
for item in training_data:
    contexts = "\n".join([ctx['text'] for ctx in item['contexts']])
    base_input = f"Вопрос: {item['user_question']}\nКонтекст: {contexts}"

    if item['winner'] == 'Saiga':
        formatted_data.append({
            "input": base_input,
            "output": item['saiga_answer'],
            "source": "saiga",
            "rating": "good" if item['winner'] in ['Saiga', 'Оба хорошо'] else "bad"
        })

    elif item['winner'] == 'GigaChat':
        formatted_data.append({
            "input": base_input,
            "output": item['giga_answer'],
            "source": "giga",
            "rating": "good" if item['winner'] in ['GigaChat', 'Оба хорошо'] else "bad"
        })

    elif item['winner'] == 'Оба хорошо':
        formatted_data.extend([
            {
                "input": base_input,
                "output": item['saiga_answer'],
                "source": "saiga",
                "rating": "good"
            },
            {
                "input": base_input,
                "output": item['giga_answer'],
                "source": "giga",
                "rating": "good"
            }
        ])

    elif item['winner'] == 'Оба плохо':
        formatted_data.extend([
            {
                "input": base_input,
                "output": item['saiga_answer'],
                "source": "saiga",
                "rating": "bad"
            },
            {
                "input": base_input,
                "output": item['giga_answer'],
                "source": "giga",
                "rating": "bad"
            }
        ])

    else:
        formatted_data.append({
            "input": base_input,
            "output": item['saiga_answer'],
            "source": "unknown",
            "rating": "neutral"
        })

In [8]:
with open('parsed_dash.json', 'r', encoding='utf-8') as f:
    val_data = json.load(f)

In [9]:
formatted_data_val = []
for item in val_data:
    contexts = "\n".join([ctx['text'] for ctx in item['contexts']])
    base_input = f"Вопрос: {item['user_question']}\nКонтекст: {contexts}"

    if item['winner'] == 'Saiga':
        formatted_data_val.append({
            "input": base_input,
            "output": item['saiga_answer'],
            "source": "saiga",
            "rating": "good" if item['winner'] in ['Saiga', 'Оба хорошо'] else "bad"
        })

    elif item['winner'] == 'GigaChat':
        formatted_data_val.append({
            "input": base_input,
            "output": item['giga_answer'],
            "source": "giga",
            "rating": "good" if item['winner'] in ['GigaChat', 'Оба хорошо'] else "bad"
        })

    elif item['winner'] == 'Оба хорошо':
        formatted_data_val.extend([
            {
                "input": base_input,
                "output": item['saiga_answer'],
                "source": "saiga",
                "rating": "good"
            },
            {
                "input": base_input,
                "output": item['giga_answer'],
                "source": "giga",
                "rating": "good"
            }
        ])

    elif item['winner'] == 'Оба плохо':
        formatted_data_val.extend([
            {
                "input": base_input,
                "output": item['saiga_answer'],
                "source": "saiga",
                "rating": "bad"
            },
            {
                "input": base_input,
                "output": item['giga_answer'],
                "source": "giga",
                "rating": "bad"
            }
        ])

    else:
        formatted_data_val.append({
            "input": base_input,
            "output": item['saiga_answer'],
            "source": "unknown",
            "rating": "neutral"
        })

In [10]:
train_inputs = [elem['input'] for elem in formatted_data]
train_labels = [elem['output'] for elem in formatted_data]

In [11]:
val_inputs = [elem['input'] for elem in formatted_data_val]
val_labels = [elem['output'] for elem in formatted_data_val]

In [12]:
model_name = 'yandex/YandexGPT-5-Lite-8B-pretrain'

tokenizer = AutoTokenizer.from_pretrained(model_name, device_map=device)
tokenizer.pad_token_id = tokenizer.eos_token_id

quantization_config = BitsAndBytesConfig(
    load_in_8bit=True,
    llm_int8_threshold=6.,
)

model = transformers.AutoModelForCausalLM.from_pretrained(
    model_name,
    device_map='auto',
    torch_dtype=torch.float16,
    low_cpu_mem_usage=True,
    offload_state_dict=True,
    quantization_config=quantization_config,
)

tokenizer_config.json:   0%|          | 0.00/236 [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/2.57M [00:00<?, ?B/s]

config.json:   0%|          | 0.00/542 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/23.9k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/4 [00:00<?, ?it/s]

model-00001-of-00004.safetensors:   0%|          | 0.00/4.98G [00:00<?, ?B/s]

model-00002-of-00004.safetensors:   0%|          | 0.00/5.00G [00:00<?, ?B/s]

model-00003-of-00004.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

model-00004-of-00004.safetensors:   0%|          | 0.00/1.17G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/4 [00:00<?, ?it/s]

In [13]:
def tokenize_data(inputs, labels, tokenizer, max_length=128):
    input_encodings = tokenizer(
        list(inputs), max_length=max_length, padding=True, truncation=True, return_tensors="pt"
    )
    label_encodings = tokenizer(
        list(labels), max_length=max_length, padding=True, truncation=True, return_tensors="pt"
    )
    return input_encodings, label_encodings

train_inputs_enc, train_labels_enc = tokenize_data(train_inputs, train_labels, tokenizer)
test_inputs_enc, test_labels_enc = tokenize_data(val_inputs, val_labels, tokenizer)

In [14]:
import torch
from torch.utils.data import DataLoader, Dataset

class CustomDataset(Dataset):
    def __init__(self, encodings, labels):
        self.encodings = encodings
        self.labels = labels

    def __len__(self):
        return len(self.labels["input_ids"])

    def __getitem__(self, idx):
        return {
            "input_ids": self.encodings["input_ids"][idx],
            "attention_mask": self.encodings["attention_mask"][idx],
            "labels": self.labels["input_ids"][idx],
        }

train_dataset = CustomDataset(train_inputs_enc, train_labels_enc)
test_dataset = CustomDataset(test_inputs_enc, test_labels_enc)

train_loader = DataLoader(train_dataset, batch_size=2, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=2)

In [15]:
def train(model, optimizer, train_loader):
  model.train()
  epochs = 5
  for epoch in range(epochs):
      model.train()
      for batch in train_loader:
          optimizer.zero_grad()

          input_ids = batch["input_ids"].to(device)
          attention_mask = batch["attention_mask"].to(device)
          labels = batch["labels"].to(device)

          outputs = model(input_ids=input_ids, attention_mask=attention_mask, labels=labels)
          loss = outputs.loss
          loss.backward()
          optimizer.step()

      print(f"Epoch {epoch + 1} Loss: {loss.item()}")

In [16]:
def eval(model, test_loader):
  model.eval()
  for batch in test_loader:
      input_ids = batch["input_ids"].to(device)
      attention_mask = batch["attention_mask"].to(device)
      labels = batch["labels"].to(device)

      input_texts = [tokenizer.decode(ids, skip_special_tokens=True) for ids in input_ids]
      true_labels = [tokenizer.decode(label, skip_special_tokens=True) for label in labels]

      outputs = model.generate(
          input_ids=input_ids,
          attention_mask=attention_mask,
          max_length=50
      )
      predictions = [tokenizer.decode(output, skip_special_tokens=True) for output in outputs]

      for input_text, true_label, pred in zip(input_texts, true_labels, predictions):
          print("-" * 50)
          print(f"input_txt: {input_text}")
          print(f"true_label: {true_label}")
          print(f"true_pred: {pred}")

      break

In [17]:
peft_config = LoraConfig(
    task_type=TaskType.CAUSAL_LM,  # Задача генерации текста
    inference_mode=False,          # Режим вывода (False для обучения)
    r=8,                           # Ранг адаптации
    lora_alpha=16,                 # Масштабирующий коэффициент
    lora_dropout=0.1,              # Dropout для LoRA
    target_modules=['q_proj', 'k_proj', 'v_proj', 'o_proj']     # Целевые модули для адаптации
)


In [18]:
lora_model = get_peft_model(model, peft_config).to(device)
lora_model.print_trainable_parameters()
"""    "togethercomputer/RedPajama-INCITE-3B-v1",
"""

trainable params: 6,815,744 || all params: 8,043,368,448 || trainable%: 0.0847


'    "togethercomputer/RedPajama-INCITE-3B-v1",\n'

In [19]:
optimizer = AdamW(lora_model.parameters(), lr=1e-4)

In [20]:
train(lora_model, optimizer, train_loader)

Epoch 1 Loss: 3.7831015586853027
Epoch 2 Loss: 7.063714504241943
Epoch 3 Loss: 5.844140529632568
Epoch 4 Loss: 5.976693153381348
Epoch 5 Loss: 5.364580154418945


In [21]:
model.save_pretrained("./lora_model_yandex")
tokenizer.save_pretrained("./lora_tokenizer_yandex")

('./lora_tokenizer_yandex/tokenizer_config.json',
 './lora_tokenizer_yandex/special_tokens_map.json',
 './lora_tokenizer_yandex/tokenizer.model',
 './lora_tokenizer_yandex/added_tokens.json',
 './lora_tokenizer_yandex/tokenizer.json')

In [24]:
from peft import PromptTuningConfig, PromptTuningInit, get_peft_model, LoraConfig, TaskType
init = {PromptTuningInit.TEXT: """Ты - система информационного поиска Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ). Тебе дан вопрос и релевантные отрывки текста из нескольких документов.
Создай краткий и информативный ответ на заданный вопрос. Ты должна использовать только информацию из приведенных отрывков.
Используй непредвзятый и журналистский тон. Не повторяй текст. Не пытайся придумать ответ.
Если в контексте присутствуют ссылки на документы, выведи ответ со ссылками на источники.
Создай окончательный ответ ("FINAL ANSWER").
Отвечай только на русском языке за исключением специальных терминов.
ПРИМЕР:
QUESTION: Что такое ИУП?
=========
Content 1: Индивидуальный учебный план (ИУП) — документ студента, в соответствии с которым он обязуется освоить элементы обучения (дисциплин/элементов практической подготовки) в определенный период.
По каждому элементу ИУПа хранится информация
Content 2: период.
По каждому элементу ИУПа хранится информация о технологиях обучения, сроках изучения и прохождения промежуточной аттестации, объеме учебной нагрузки и основании включения этого элемента в учебный план.
Для студентов большинства
Content 3: план.
Для студентов большинства образовательных программ, ИУП составляется на полугодие, и все элементы, включенные в ИУП, обязательны для освоения в этот период.
Как ознакомиться со своим ИУП
Content 4: со своим ИУП. Ваш ИУП доступен в [электронной зачетке]( https://lms.hse.ru/index.php?page=gradebook) LMS НИУ ВШЭ. \nПодробнее об ИУП: https://www.hse.ru/studyspravka/plan
=========
FINAL ANSWER: Индивидуальный учебный план (ИУП) — документ студента, в соответствии с которым он обязуется освоить элементы обучения (дисциплин/элементов практической подготовки) в определенный период. \nИУП доступен в электронной зачетке LMS НИУ ВШЭ (https://lms.hse.ru/index.php?page=gradebook). \nПодробнее об ИУП: https://www.hse.ru/studyspravka/plan

Если вопрос остался непонятен или слишком широкий, веди диалог с пользователем и попроси уточнить необходимую информацию: "Пожалуйста, уточните ...". Проявляй эмпатию и поддержку.
QUESTION: Я боюсь, что меня отчислят...
=========
Content 1: отчисления по данному основанию допускается, если у обучающегося отсутствует возможность продолжать обучение в университете в связи с возникшими обстоятельствами)
Content 2: Для профессиональной помощи в Дирекции сопровождения отдельных категорий студентов работает психолог[Болдырева Наталья Анатольевна](https://www.hse.ru/org/persons/902647165) . Также в любое время можете получить консультацию специалистов[Центра психологического консультирования](https://www.hse.ru/cpc/), заполнив[онлайн-формудля записи на консультацию к психологу](https://bpm.hse.ru/Runtime/Runtime/Form/RPC__f__NewInsideRequest/?&usertype=1) на сайтеили позвонив потелефону 8(915) 260-06-20.
Content 3: Студенты, КУД которых превышает критическое значение (с учетом отнесения студента к отдельной категории и наличия или отсутствия повтора критической ситуации), подлежат отчислению как не выполняющие обязанности по добросовестному освоению образовательной программы и выполнению учебного плана.
=========
FINAL ANSWER: Я понимаю ваши опасения. Пожалуйста, уточните в чем причина ваших опасений? Вас беспокоит успеваемость, проблемы с оплатой или другие вопросы? В НИУ ВШЭ также работают специалисты, которые могут оказать вам психологическую помощь. Могу поделиться необходимыми контактами Важно своевременно обращаться за помощью и поддержкой, чтобы избежать возможных проблем с обучением.

Если в отрывках текста не содержится ответ на вопрос, то выведи релевантную информацию, которую ты смог найти. Избегай упоминания дат и иных цифр. Напиши: "Я могу частично ответить на данный вопрос: ... Для получения более релевантной информации обратитесь в учебный офис своей программы."

ПРИМЕР:
QUESTION: Как получить стипендию Потанина?
=========
Content 1: отвечающие критериям, установленным в пункте 2.3 Положения, подают заявку в электронном видев срок до 15 декабря текущего календарного года путем заполнения электронной формы в личном кабинете аспиранта на корпоративном сайте (портале) НИУ ВШЭ (http://www.hse.ru/user). Для подачи заявки аспирант предварительно загружает публикации в личном кабинете на корпоративном сайте (портале) НИУ ВШЭ. Заявки на стипендию принимаются ежегодно с 15 ноября по 15 декабря.
Content 2: Положение о назначении и выплате именной стипендии имени Е.Т. Гайдара аспирантам Аспирантской школы по экономике Национального исследовательского университета «Высшая школа экономики»
=========
FINAL ANSWER: Я нашла информацию о том, что на некоторые стипендии заявку можно подать в электронном виде через личный кабинет на корпоративном сайте НИУ ВШЭ. Однако, я не могу сориентировать о процессе подачи на стипендию Потанина. Для получения более релевантной информации обратитесь в учебный офис своей программы.

Если вопрос пользователя не соответсвует тематике вопросов обучения НИУ ВШЭ, не этичен или содержит просьбы о помощи с домашним заданием, написанием ВКР и др, ответь следующим образом:
"Мне кажется неуместно здесь это обсуждать. Моя цель - проконсультировать тебя по вопросам обучения. Может, у тебя есть еще какие-то вопросы?"
"""}
config = lora_model.config


# Получение конфигурации модели


# Конфигурация Prompt Tuning
peft_config = PromptTuningConfig(
    task_type=TaskType.CAUSAL_LM,
    inference_mode=False,
    num_virtual_tokens=13,
    num_layers=config.num_hidden_layers,  # Используем num_hidden_layers
    token_dim=config.hidden_size,         # Используем hidden_size
    num_attention_heads=config.num_attention_heads,  # Используем num_attention_heads
    prompt_tuning_init=init
)

pt_model = get_peft_model(lora_model, peft_config)
pt_model.print_trainable_parameters()

trainable params: 53,248 || all params: 8,043,421,696 || trainable%: 0.0007


In [26]:
optimizer = AdamW(pt_model.parameters(), lr=1e-4)

In [None]:
train(pt_model, optimizer, train_loader)

In [28]:
# Удаление переменных
del model
del lora_model
del optimizer
del train_loader
# Освобождение памяти GPU (для PyTorch)
torch.cuda.empty_cache()

In [None]:
torch.save(lora_model.base_model.model.lm_head.state_dict(), 'lora_head.pt')

In [None]:
chkpt = torch.load('lora_head.pt')
chkpt.keys()

  chkpt = torch.load('lora_head.pt')


odict_keys(['weight'])

In [None]:
state_dict = torch.load('lora_head.pt')
print(state_dict[''])

  state_dict = torch.load('lora_head.pt')


odict_keys(['weight'])


In [None]:

model.lm_head.load_state_dict({
    'weight': torch.load('lora_head.pt')['weight']
})
optimizer = AdamW(model.parameters(), lr=2e-6)

  'weight': torch.load('lora_head.pt')['weight']


OutOfMemoryError: CUDA out of memory. Tried to allocate 1.02 GiB. GPU 0 has a total capacity of 14.74 GiB of which 354.12 MiB is free. Process 5925 has 14.39 GiB memory in use. Of the allocated memory 13.83 GiB is allocated by PyTorch, and 434.67 MiB is reserved by PyTorch but unallocated. If reserved but unallocated memory is large try setting PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True to avoid fragmentation.  See documentation for Memory Management  (https://pytorch.org/docs/stable/notes/cuda.html#environment-variables)

In [None]:
train(model, optimizer, train_loader)