In [None]:
# Ячейка 1: Установка необходимых библиотек
%pip install -q transformers accelerate huggingface_hub

имопрт


In [None]:
# Ячейка 2: Импорт библиотек и настройка
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from huggingface_hub import login
import logging
from typing import Optional

# Настройка логирования
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

# Проверка доступности GPU
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"Используемое устройство: {device}")

Используемое устройство: cuda


In [None]:
# Ячейка 3: Класс для генерации диалогов
class Generator:
    """Класс для генерации диалогов с использованием языковой модели"""

    def __init__(self, model_name: str = "sambanovasystems/SambaLingo-Russian-Chat"):
        """
        Инициализация генератора диалогов
        """
        self.model_name = model_name
        self.model = None
        self.tokenizer = None
        self.device = device

    def load_model(self) -> bool:
        """
        Загрузка модели и токенизатора

        """
        try:
            login("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")
            self.tokenizer = AutoTokenizer.from_pretrained(
                self.model_name,
                use_fast=False
            )
            self.model = AutoModelForCausalLM.from_pretrained(
                self.model_name,
                device_map=self.device,
                torch_dtype="auto",
                low_cpu_mem_usage=True
            )
            if hasattr(self.model, 'tie_weights'):
                self.model.tie_weights()
            logger.info("Модель успешно загружена на устройство: %s", self.device)
            return True

        except Exception as e:
            logger.error("Ошибка при загрузке модели: %s", str(e))
            return False

    def generate_dialog(
        self,
        prompt: str,
        max_new_tokens: int = 500,
        temperature: float = 0.7,
        top_p: float = 0.9,
        repetition_penalty: float = 1.1
    ) -> Optional[str]:
        """
        Генерация диалога на основе промпта
        prompt: Текст для генерации диалога
        max_new_tokens: Максимальное количество токенов
        temperature: Параметр творчества (0.1-1.0)
        top_p: Параметр nucleus sampling
        repetition_penalty: Штраф за повторения
        """
        if not self.model or not self.tokenizer:
            logger.error("Модель не загружена")
            return None

        try:
            # Форматирование промпта согласно требованиям модели
            red_promt = f"<|user|>\n{prompt}\n<|assistant|>\n"

            # Кодирование входных данных
            inputs = self.tokenizer(
                red_promt,
                return_tensors="pt",
                truncation=True,
                max_length=1024
            ).to(self.device)

            # Генерация текста
            with torch.no_grad():
                outputs = self.model.generate(
                    **inputs,
                    max_new_tokens=max_new_tokens,
                    do_sample=True,
                    temperature=temperature,
                    top_p=top_p,
                    repetition_penalty=repetition_penalty,
                    pad_token_id=self.tokenizer.eos_token_id
                )

            # Декодирование и очистка результата
            generated_text = self.tokenizer.decode(
                outputs[0],
                skip_special_tokens=True
            )

            # Извлечение ответа модели
            res = generated_text.split("<|assistant|>")[-1].strip()
            return res

        except Exception as e:
            logger.error("Ошибка при генерации текста: %s", str(e))
            return None

In [None]:
# Ячейка 4: Вспомогательные функции
def format_dialog(dialog: str) -> str:
    """ Форматирование диалога для вывода"""

    lines = []
    for line in dialog.split('\n'):
        if line.strip() and not line.strip().startswith('<|'):
            lines.append(line.strip())
    return '\n'.join(lines)

def runandshow(prompt: str, **kwargs):
    """
    Функция для генерации и отображения диалога
    """
    # Инициализация и загрузка модели
    generator = Generator()
    if not generator.load_model():
        print("Не удалось загрузить модель")
        return

    # Генерация диалога
    dialog = generator.generate_dialog(prompt, **kwargs)

    if not dialog:
        print("Не удалось сгенерировать диалог")
        return

    # Вывод результата
    print("\n" + "="*50)
    print(f"Диалог на тему: {prompt.upper()}")
    print("="*50)
    print(format_dialog(dialog))

    # Очистка памяти (важно для Colab)
    del generator
    torch.cuda.empty_cache() if torch.cuda.is_available() else None

In [None]:
# Ячейка 5: Пример использования
# Параметры генерации
promt = "Диалог между котом и собакой о еде"
params = {
    "max_new_tokens": 500,
    "temperature": 0.7,
    "top_p": 0.9,
    "repetition_penalty": 1.1
}

# Генерация и отображение диалога
runandshow(promt, **params)

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json: 0.00B [00:00, ?B/s]

tokenizer.model:   0%|          | 0.00/1.00M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/547 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/780 [00:00<?, ?B/s]

`torch_dtype` is deprecated! Use `dtype` instead!


model.safetensors.index.json: 0.00B [00:00, ?B/s]

Fetching 3 files:   0%|          | 0/3 [00:00<?, ?it/s]

model-00001-of-00003.safetensors:   0%|          | 0.00/4.99G [00:00<?, ?B/s]

model-00003-of-00003.safetensors:   0%|          | 0.00/3.98G [00:00<?, ?B/s]

model-00002-of-00003.safetensors:   0%|          | 0.00/4.92G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/154 [00:00<?, ?B/s]


Диалог на тему: ДИАЛОГ МЕЖДУ КОТОМ И СОБАКОЙ О ЕДЕ
Кошка: Эй, ты не видел мою еду? Я только что закончил ужинать!
Собака: О нет, я понятия не имел. Прости, приятель. Могу ли я принести тебе немного из своего миски с кормом для щенков? Ты выглядишь голодным.
Кошка: Спасибо, но мне это не понадобится. Мой рацион специально разработан для удовлетворения потребностей моего организма в питательных веществах. А твой корм для щенков слишком богат белком, а это означает, что он содержит больше калорий и жиров, чем мне нужно.
Собака: Понятно. Но разве моя миска с лакомствами не подойдет вам как раз по вкусу? В них полно белка, который вам нужен для поддержания здоровья шерсти и мышц. И они просто восхитительны на вкус!
Кошка: Ну, мои мясные деликатесы содержат все необходимые питательные вещества без каких-либо дополнительных добавок или ароматизаторов. Они также очень вкусные и помогают поддерживать мое идеальное телосложение.
Собака: Честно говоря, иногда мне трудно понять ваши кошачьи привы

In [None]:
# Ячейка 6: Дополнительные примеры (опционально)
# Вы можете создать несколько ячеек с разными промптами
example_prompts = [
    "Диалог между драконом и динозавром о математике",
    "Диалог между белкой и скунсом о медведях",
    "Беседа между марсианином и школьником о Марсе"
]

for prompt in example_prompts:
    runandshow(prompt, max_new_tokens=300)
    print("\n\n")

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]


Диалог на тему: ДИАЛОГ МЕЖДУ ДРАКОНОМ И ДИНОЗАВРОМ О МАТЕМАТИКЕ
Дракон: Эй, ты видел эти новые математические задачи в последнем выпуске журнала?
Динозавр: Нет, я не разбираюсь ни во всяких цифрах.
Дракон: Ну, это совсем другая история! Эти головоломки — настоящее испытание для ума. Хотите попробовать вместе со мной?
Динозавр: (скептически) Думаю, мне лучше придерживаться того, что я знаю.
Дракон: Не волнуйся, это просто немного сложно. Вот первая задача. Какое число следует за 123 при счете по возрастанию?
Динозавр: Э-э... Я думаю, это 131 или 111.
Дракон: (удивленно) Ты прав, но ответ действительно 124. Давай попробуем следующую задачу. Если 6 умножить на 2, получится ли результат 10?
Динозавр: О нет, кажется, это слишком много математики для меня.
Дракон: (смеется) Это нормально. На самом деле ответ – 12. Ух ты, давай еще раз попробую одну из моих любимых задач. У меня есть три яйца в одной корзине и четыре в другой. Сколько яиц у меня всего?
Динозавр: (думая) Хмм… Возможно, шесть?

Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]


Диалог на тему: ДИАЛОГ МЕЖДУ БЕЛКОЙ И СКУНСОМ О МЕДВЕДЯХ
Белка: Эй, ты слышал новости? Медведи вышли из спячки!
Скунс: Правда? О нет, я не хочу иметь с ними дело. Они такие вонючие.
Белка: Да ладно, они просто защищаются от хищников. Но давай обсудим это позже. Я так взволнован этим событием. Знаешь, что мне нравится в медведях? У них такое милое поведение.
Скунс: Хм, я не знаю. Мне кажется, им следовало бы держаться подальше от моего дерева.
Белка: Не волнуйся, у меня есть план. Мы можем принести нашим друзьям-животным угощение и вместе посмотреть на медведей.
Скунс: Хорошо, но только если мы держимся на расстоянии. И нам следует избегать их запаха.
Белка: Абсолютно! И давайте также запомним места их кормления, чтобы мы могли избежать встречи с ними во время сбора еды.
Скунс: Звучит как план. Давайте поделимся этой информацией со всеми животными в лесу.
Белка: Согласен. Вместе мы сможем сделать наш лес гостеприимным для всех существ.





Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]


Диалог на тему: БЕСЕДА МЕЖДУ МАРСИАНИНОМ И ШКОЛЬНИКОМ О МАРСЕ
Марсианин: Добро пожаловать на Красную планету, юный исследователь! Меня зовут Малик.
Школьник: Привет, Малик! Я очень рад узнать больше о вашей планете. Каково это — жить на Марсе?
Малик: Это непросто, но я привык к среде с низкой гравитацией и резким перепадом температур. На самом деле мы адаптировались к этим условиям благодаря нашей уникальной физиологии и технологиям.
Ученик: Удивительно! Можете ли вы рассказать мне больше об атмосфере Марса?
Малаки: Конечно! Наша атмосфера невелика по сравнению с земной атмосферой. Он состоит в основном из углекислого газа (CO2) с небольшой примесью азота, кислорода и других газов. Эта атмосфера может создавать пылевые бури, которые могут длиться неделями или даже месяцами.
Студент: Ого, какая погода! Есть ли жизнь на Марсе?
Малаки: В настоящее время нет никаких признаков жизни на поверхности планеты, кроме бактерий, которым удалось выжить под поверхностью в небольших подледных озерах