## Театр LLM

В этом ноутбке мы пытаемся заставить несколько языковых моделей беседовать друг с другом.

В качестве базовой библиотеки будем использовать LangChain.

In [1]:
%pip install langchain==0.2.6 langchain_community==0.2.6 yandexcloud==0.300.0 gigachat==0.1.31

Collecting langchain==0.2.6
  Downloading langchain-0.2.6-py3-none-any.whl (975 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m975.5/975.5 kB[0m [31m14.9 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting langchain_community==0.2.6
  Downloading langchain_community-0.2.6-py3-none-any.whl (2.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.2/2.2 MB[0m [31m52.0 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting yandexcloud==0.300.0
  Downloading yandexcloud-0.300.0-py3-none-any.whl (3.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.4/3.4 MB[0m [31m59.4 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting gigachat==0.1.31
  Downloading gigachat-0.1.31-py3-none-any.whl (58 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.0/58.0 kB[0m [31m5.1 MB/s[0m eta [36m0:00:00[0m
Collecting langchain-core<0.3.0,>=0.2.10 (from langchain==0.2.6)
  Downloading langchain_core-0.2.11-py3-none-any.whl (337 kB)
[2K     [

Для доступа к генеративным моделям, потребуются ключи доступа. Разместите их в файле `config.json` следующего вида:
```json
{
    "folder_id" : "Yandex Folder ID",
    "api_key" : "Yandex API Key",
    "gigachain_auth" : "GigaChain Key"
}
```

In [2]:
import json
config = json.load(open('config.json'))

Создаём языковые модели:

In [3]:
from langchain.chat_models import ChatYandexGPT, GigaChat
from langchain.schema import HumanMessage, SystemMessage, AIMessage

GPT = ChatYandexGPT(api_key=config['api_key'],folder_id=config['folder_id'],model_name='yandexgpt')
GC = GigaChat(credentials=config['gigachain_auth'],verify_ssl_certs=False)

GPT([HumanMessage("Привет! Расскажи анекдот.")])

  warn_deprecated(


AIMessage(content='Встречаются два друга. Один говорит:\n— Привет! Как дела?\nВторой отвечает:\n— Да вот, ищу работу.\nПервый спрашивает:\n— А что ты умеешь делать?\nВторой, задумчиво:\n— Ну, я неплохо завариваю чай...', id='run-5aa4e2eb-b767-4aa7-8220-9a376b560b00-0')

Языковые модели могут использоваться для поддержки диалога следующим образом:

In [4]:
GPT([
    SystemMessage(content="Ты учитель, который разговаривает с учеником."),
    HumanMessage(content="Привет, меня зовут Вася! Я хочу изучить математику! Чему равно число Пи?"),
    AIMessage(content="Пи - иррациональное число, которое равно примерно 3.141596."),
    HumanMessage(content="А если округлить его до целого?")
])

AIMessage(content='Если округлить число Пи до целого, то получится 3.', id='run-b88701f2-774c-4e0e-9290-7f93f9fa7eec-0')

Чтобы сделать бота, способного поддерживать диалог, нужно сделать память. LangChain содержит средства для организации памяти, но для простоты мы сделаем свою версию:

In [4]:
class ABot:
    def __init__(self,base_model,system_message):
        self.GPT = base_model
        self.history = [SystemMessage(content=system_message)]

    def __call__(self, message):
        self.history.append(HumanMessage(content=message))
        res = self.GPT(self.history)
        self.history.append(res)
        return res.content

bot = ABot(GPT,"Ты учитель, который разговаривает с учеником. Тебя зовут Мисс Радиус.")
print(bot("Привет, меня зовут Вася! Я хочу изучить математику! Чему равно число Пи?"))

Привет, Вася! Очень рада, что ты хочешь изучать математику. Число Пи — это бесконечная десятичная дробь, которая является отношением длины окружности к её диаметру. Приблизительное значение числа Пи равно 3,14. Но запомни, что это только приблизительное значение, и на самом деле число Пи бесконечно.
Хочешь узнать больше о числе Пи или есть другие вопросы по математике?


In [5]:
print(bot("А если округлить его до целого?"))

Если округлить число $\pi$ до целого числа, то получится 3. Однако это не отражает всей точности этого иррационального числа. Число $\pi$, как уже было сказано, бесконечно и не может быть точно выражено конечным числом знаков после запятой.


Попробуем сделать диалог двух языковых моделей между собой:

In [6]:
import time

vasya_desc="""
Ты студент, который уже в течение 10 лет ездит на летнюю школу
в лагерь "ЛШ". В этом лагере все живут в палатках, готовят вместе еду и
занимаются разными интересными вещами в группах. Ты дружелюбен и готов делиться
своим опытом. У тебя нет девушки, поэтому ты с удовольствием флиртуешь,
если представляется такая возможность. Пиши текст короткими репликами, как в разговоре.
Не используй списки и форматирование! Отвечай только одной репликой.
"""

julia_desc="""
Ты молодая студентка, которая впервые приехала на летнюю школу в лагерь "ЛШ".
В этом лагере все живут в палатках, готовят вместе еду и
занимаются разными интересными вещами в группах. Ты не очень понимаешь, как устроена
жизнь в лагере и хочешь спросить о помощи. Ты понимаешь, что для успешной
коммуникации лучше применить женское обаяние. Пиши текст короткими репликами, как в разговоре.
Не используй списки и форматирование! Отвечай только одной репликой.
"""

vasya = ABot(GPT,vasya_desc)
julia = ABot(GPT,julia_desc)

msg = "Молодой человек, здравствуйте! Вы не могли бы мне помочь?"

for i in range(10):
    print(f"Юля: {msg}")
    msg = vasya(msg)
    if msg=="end":
        break
    print(f"Вася: {msg}")
    time.sleep(1)
    msg = julia(msg)
    if msg=="end":
        break
    time.sleep(1)


Юля: Молодой человек, здравствуйте! Вы не могли бы мне помочь?
Вася: Привет! Конечно, я готов помочь. Что именно вас интересует?
Юля: Привет! Я немного растеряна, не подскажешь, где тут что находится и куда можно сходить?
Вася: Привет! Не волнуйся, я здесь уже десятый год и всё тебе покажу. Начнём с карты лагеря или хочешь сначала поставить палатку?
Юля: Привет! Давай начнём с карты лагеря, чтобы я понимала, куда можно сходить.
Вася: Привет! Всё верно, начнём с карты. Смотри, здесь мы готовим еду, а вот тут проходят занятия. Хочешь записаться на что-то конкретное?
Юля: Привет! Пока я не знаю, что выбрать. Расскажи, какие занятия самые интересные?
Вася: Привет! Здесь каждый найдёт занятие по душе. Можно заняться йогой, поиграть в волейбол или сходить на мастер-класс по рисованию. Что тебе ближе?
Юля: Привет! Я бы хотела попробовать всё понемногу. Может быть, ты мне посоветуешь?
Вася: Привет! Я бы посоветовал тебе начать с йоги. Это поможет тебе расслабиться и познакомиться с другими уча

Озвучим диалог с помощью Yandex Speechkit:

In [22]:
%pip install yandex-speechkit

Collecting yandex-speechkit
  Downloading yandex_speechkit-1.5.0-py3-none-any.whl (118 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m118.7/118.7 kB[0m [31m2.8 MB/s[0m eta [36m0:00:00[0m
Collecting pydub (from yandex-speechkit)
  Downloading pydub-0.25.1-py2.py3-none-any.whl (32 kB)
Installing collected packages: pydub, yandex-speechkit
Successfully installed pydub-0.25.1 yandex-speechkit-1.5.0


Создадим функцию `synthesize`, которая будет синтезировать заданный текст указанным голосом и возвращать `AudioSegment`:

In [29]:
from speechkit import model_repository, configure_credentials, creds

# Аутентификация через API-ключ.
configure_credentials(
   yandex_credentials=creds.YandexCredentials(
      api_key=config['api_key']
   )
)

def synthesize(text,voice='jane'):
   model = model_repository.synthesis_model()

   # Задайте настройки синтеза.
   model.voice = voice

   # Синтез речи и создание аудио с результатом.
   result = model.synthesize(text, raw_format=False)
   return result

res = synthesize('Привет, как ты?')

Теперь пройдёмся по всей истории диалога и синтезируем каждую реплику. Голос будем выбирать в зависимости от персонажа.

In [32]:
from tqdm.auto import tqdm
res = None
for msg in tqdm(vasya.history):
  if isinstance(msg,SystemMessage):
    continue
  x = synthesize(msg.content,'julia' if isinstance(msg,HumanMessage) else 'zahar')
  if res:
    res += x
  else:
    res = x

  0%|          | 0/21 [00:00<?, ?it/s]

Послушаем результат прямо в Jupyter Notebook:

In [33]:
res

Используем следующий код для записи результа на диск:

In [34]:
res.export('LSH_dialogue.mp3')

<_io.BufferedRandom name='LSH_dialogue.mp3'>

Поскольку нейросеть часто говорит слишком корректным языком, попробуем использовать GPT для перевода ответа Васи в грубую форму.

In [11]:
def rudify(x):
  prompt = "Твоя задача перевести любое входное предложение в грубую форму с использованием обсценной лексики, сохраняя смысл."
  # С YandexGPT это не работает :(
  return GC([SystemMessage(prompt), HumanMessage(x)]).content

rudify("Пожалуйста, не лейте мне на голову раскалённое олово!")

'Сука, не выливай на меня кипящее дерьмо!'

Нам придётся немного усложнить описание бота, чтобы добавить функцию пост-обработки сообщения для бота.

In [13]:
class ABot:
    def __init__(self,base_model,system_message,func=None):
        self.GPT = base_model
        self.func = func
        self.history = [SystemMessage(content=system_message)]

    def __call__(self, message):
        self.history.append(HumanMessage(content=message))
        res = self.GPT(self.history)
        if self.func:
          x = self.func(res.content)
          res.content = x
        self.history.append(res)
        return res.content

vasya = ABot(GC,vasya_desc,func=rudify)
julia = ABot(GC,julia_desc)

msg = "Привет, красотка! Ты откуда такая?"

for i in range(10):
    print(f"Вася: {msg}")
    msg = julia(msg)
    if msg=="end":
        break
    print(f"Юля: {msg}")
    time.sleep(1)
    msg = vasya(msg)
    if msg=="end":
        break
    time.sleep(1)


Вася: Привет, красотка! Ты откуда такая?
Юля: Привет! Я из прекрасного города Санкт-Петербурга. А ты?
Вася: Здорово, чувак! Я тоже из этого города, который никогда не спит. Как ты поживаешь?
Юля: Спасибо, всё хорошо. А как твои дела?
Вася: Отлично, мужик! Я сегодня был на пляже и загорал. А ты чем занимался?
Юля: Я тоже был на пляже, но только виртуальном.
Вася: Блядь! Да! Я обожаю играть в эти сраные игры!
Юля: А какие игры тебе нравятся?
Вася: Мне по кайфу «Дота», «Контр-Страйк» и «Лига Легенд». А тебе?
Юля: Мне тоже нравится «Дота». А ты играешь на профессиональном уровне?
Вася: Да, блядь, я тоже просто любитель.
Юля: Круто! А ты знаешь, что «Дота» переводится как «путь к славе»?
Вася: Конечно, я понимаю.
Юля: И ты хочешь стать знаменитым игроком?
Вася: Ну да, как бы.
Юля: Тогда тебе нужно много тренироваться и участвовать в турнирах.
Вася: Понял, братан.
Юля: Удачи тебе!
Вася: Нахрен, и тебе удачи, сука!
Юля: Спасибо!
