## GPT как персональный раб разработчика

Используем большие языковые модели для автоматизации сложных задач.

Для начала научимся использовать большие языковые модели программно. Я рекомендую посмотреть на библиотеку [LangChain](https://www.langchain.com/), или её клон от Сбера - [GigaChain](https://github.com/ai-forever/gigachain).

Для поддержки модели Yandex GPT можно дополнительно установить библиотеку [`yandex_chain`](https://github.com/yandex-datasphere/yandex-chain). В GigaChat уже присутствует поддержка языковых моделей Yandex.

Вот как просто можно организовать вызов языковой модели Yandex GPT из кода:

In [81]:
from langchain.llms import YandexGPT, GigaChat
import json

config = json.load(open('config.json'))

GPT = YandexGPT(api_key = config['api_key'], temperature=0.01)
GC = GigaChat(credentials=config['gigachain_auth'],verify_ssl_certs=False)

print(GPT("Напиши сказку про мальчика, который любил JSON"))

Жил-был мальчик по имени Макс. Он был очень умным и знал много разных вещей. Но однажды он услышал о JSON и сразу же влюбился в него.

JSON (JavaScript Object Notation) — это формат обмена данными, который используется для передачи структурированных данных между клиентом и сервером. Он основан на языке JavaScript и может быть легко прочитан как человеком, так и компьютером.

Макс начал изучать JSON и быстро понял, что это не просто формат данных, а целый язык программирования. Он начал создавать свои собственные объекты и методы, используя JSON.

Однажды Макс решил создать игру "Крестики-нолики". Он использовал JSON для хранения информации о каждом ходе игры. Каждый ход сохранялся в виде объекта с ключами "игрок", "координаты" и "знак".

Макс создал функцию, которая читала данные из файла и создавала объекты для каждого хода. Затем он использовал эту функцию для обновления состояния игры каждый раз, когда игрок делал ход.

Игра была очень популярна среди друзей Макса. Они могли играть 

In [105]:
import g4f 

def GPT4(x):
    response = g4f.ChatCompletion.create(
    model=g4f.models.default,
    messages=[{"role": "user", "content": x }])
    return response

res = GPT4('Придумай сказку про мальчика, который любил JSON')
print(res)

Конечно! Однажды в маленьком городке жил мальчик по имени Алекс. Алекс был умным и любопытным ребенком, и у него была особая страсть - он очень любил JSON.

Алекс проводил дни, изучая структуру JSON и его возможности. Он понимал, что JSON - это способ организации данных, который позволяет хранить и передавать информацию в удобном формате. Он находил красоту в каждом ключе и значении, которые могли превратиться в уникальную историю.

Однажды, когда Алекс гулял в лесу, он наткнулся на загадочный старинный свиток, завернутый в паутину. Когда он раскрыл свиток, он увидел, что на нем были написаны странные символы, которые он сразу распознал как JSON. Алекс был взволнован и решил прочитать его.

К его удивлению, свиток оказался не просто историей, а настоящим приключением. Каждая строка JSON ожила, и Алекс оказался в мире, где данные стали реальностью. Он стал героем своей собственной истории.

Алекс путешествовал по JSON-миру, встречая различных персонажей, каждый из которых был уникальным

Теперь попробуем сделать что-то полезное:

In [25]:
res = GPT("Придумай 10 смешных кличек для собаки программиста")
print(res)

1. Код
2. Велосипедист
3. Геймбой
4. Паскаль
5. Тумблер
6. Иви
7. Скрипт
8. Файл
9. Шифр
10. Программа


## Основные приёмы промптинга

Важно, чтобы модель получила чёткие и понятные инструкции по тому, что же ей нужно сделать.

#### Используем ограничители

In [48]:
text = """
Вы должны выразить то, что вы хотите, чтобы модель сделала, 
предоставив инструкции, которые максимально ясны и конкретны.
Это направит модель на желаемый результат и уменьшит вероятность
получения несвязанных или неправильных ответов. Не путайте
написание четкого запроса с написанием короткого запроса. 
Во многих случаях более длинные запросы обеспечивают большую ясность 
и контекст для модели, что может привести к более подробным 
и соответствующим ответам.
"""

instr = """
    Сократи текст, выделенный тройными обратными
    кавычками, до одного предложения. Выведи в качестве результата
    одно преложение, содержащее главную мысль текста.
    ```{}```"""

res = GPT(instr.format(text))

In [46]:
from langchain.prompts import PromptTemplate

prompt = PromptTemplate(
    template="""
    Сократи текст, выделенный тройными обратными
    кавычками, до одного предложения. Выведи в качестве результата
    одно преложение, содержащее главную мысль текста.
    ```{text}```""",
    input_variables=["text"],
)

res = GPT(prompt.format(text=text))
print(res)

Четко сформулируйте запрос, чтобы модель могла точно понять, что вы от нее хотите.


#### Используем структурированный вывод

In [26]:
res = GPT("Придумай 10 смешных кличек для собаки программиста и выведи результат в формате JSON")
print(res)

[
  {
    "имя": "Код",
    "сокращение": "Кд",
    "пояснение": "от слова 'код'"
  },
  {
    "имя": "Поттер",
    "сокращение": "Пт",
    "пояснение": "'поттер' — фамилия главного героя серии книг и фильмов о Гарри Поттере"
  },
  {
    "имя": "Компилятор",
    "сокращение": "Км",
    "пояснение": "сокращение от 'компилятор'"
  },
  {
    "имя": "Сигнал",
    "сокращение": "Сл",
    "пояснение": "название одного из управляющих сигналов в компьютерной технике"
  },
  {
    "имя": "Ввод",
    "сокращение": "Вв",
    "пояснение": "действие по вводу информации"
  },
  {
    "имя": "Вывод",
    "сокращение": "Вы",
    "пояснение":
      "действие, заключающееся в получении из памяти и представлении в доступной для восприятия форме информации"

  },
  {
    "имя": "Синтаксис",
    "сокращение": "Син",
    "пояснение": 'синтаксис — раздел языкознания, изучающий правила построения правильных фраз на языке программирования"
  },
  {
    "имя": "Переменная",
    "сокращение": "Пер",
    "поясн

Чтобы убедиться в том, что вывод соответствуюет некоторому формату, используют выходные парсеры:

In [53]:
from langchain.output_parsers import CommaSeparatedListOutputParser

csv_parser = CommaSeparatedListOutputParser()

GPT.temperature = 0.01

prompt = PromptTemplate(
    template="Придумай 10 смешных {subject}, которые бы были оригинальными. {format_instructions}",
    input_variables=["subject"],
    output_parser=csv_parser,
    partial_variables={ "format_instructions" : csv_parser.get_format_instructions() }
)
res = GPT(prompt.format(subject="кличек для собаки программиста"))
print(csv_parser.parse(res))

['1. Код.', '2. Скрипт.', '3. Паскаль.', '4. Делфи.', '5. Компилятор.', '6. Ассемблер.', '7. Бейсик.', '8. Си.', '9. Ява.', '10. Питон.']


Поэкспериментируем с температурой

In [59]:
import time 

for t in [0.1, 0.5, 0.9]:
    GPT.temperature = t
    res = GPT(prompt.format(subject="кличек для собаки программиста"))
    time.sleep(1)
    print(f"{t} -> {csv_parser.parse(res)}")

GPT.temperature = 0.2

0.1 -> ['1. Код.', '2. Паскаль.', '3. Си.', '4. Ассемблер.', '5. Делфи.', '6. Бейсик.', '7. Ява.', '8. Питон.', '9. С++', '10. Фортран.']
0.5 -> ['1. Коди', '2. Баг', '3. Дебаггер', '4. Компилятор', '5. Линкер', '6. Отладчик', '7. Виртуалка', '8. Драйвер', '9. Юзербот', '10. Айпишник']
0.9 -> ['Декодер', 'Хакер', 'Утилизатор', 'Сервер', 'Турбокод', 'Компилятор', 'Баг', 'Багзилла', 'Оптимайзер', 'Патч.']


#### Используем условия


In [61]:
text1 = """
Чтобы приготовить омлет, сначала надо взять яйца. Разбиваем их молотком, затем
аккуратно извлекаем осколки скорлупы. Затем добавляем соли. В конце кладем масло на
сковородку, и выливаем туда яичную смесь.
"""

text2 = """
Яичный омлет - это прекрасный завтрак! Вам обязательно стоит его попробовать, если
раньше никогда не пробовали!
"""

prompt = PromptTemplate(
    template="""
    Тебе будет дан текст, выделенный тройными обратными кавычками. Если
    в тексте содержится последовательность инструкций, перепиши их
    в виде последовательных шагов в таком формате:
    Шаг 1 - ...
    Шаг 2 - ...
    ...
    Шаг N - ...

    Если в тексте нет конкретных инструкций, напиши "Инструкций нет". 
    ```{text}```""",
    input_variables=["text"],
)

res = GPT(prompt.format(text=text2))
print(res)

Инструкций нет


#### Few-Shot

In [62]:
res = GPT("""
Пожалуйста, ответь на вопрос ребенка в похожем стиле, продолжив диалог:
    
[Ребенок]: Расскажи мне о терпеливости.
[Родитель]: Терпеливость - это как бесконечная река, которая 
течет сквозь равнины, и никогда не заканчивается. Этой реке
никогда не надоедает течь, потому что она всегда спокойна и
умиротворена.
    
[Ребенок]: Расскажи мне об искренности.
[Родитель]:
""")

print(res)

Искренность - это как маленький ручеек, который пробивает себе
дорогу через камни и препятствия. Искренность не боится
препятствий, она просто продолжает течь, и в конце концов
преодолевает все трудности.

[Ребенок]: Расскажи мне о любви.
[Родитель]:

Любовь - это как огромное море, которое покрывает всю землю.
Любовь не имеет границ, она может быть к родителям, друзьям,
животным, или даже ко всему миру. Любовь - это то, что делает
мир лучше, и то, что помогает нам быть счастливыми.

[Ребенок]: Расскажи мне о дружбе.
[Родитель]:

Дружба - это как мост, который соединяет людей. Дружба
помогает нам понимать друг друга, и преодолевать трудности
вместе. Дружба - это то, что делает мир лучше, и то, что помогает
нам быть счастливыми.


## Дайте модели время подумать!

Языковые модели не могут рассуждать, как человек, гоняя мысли в голове "взад-вперёд". Модель всегда генерирует текст "вперёд", и "рассуждает" в процессе генерации. Поэтому важно инструктировать модель так, чтобы она могла "рассуждать вслух".

In [65]:
text = """
Использовать генеративный ИИ полезно, потому что это очень 
сильно ускоряет работу. Также, работая с ChatGPT, мы можем
многому у него научиться. Используя передовые технологии,
мы будем современными и не отставать от прогресса. Но есть риск,
что мы при этом разучимся сами писать.
"""

prompt = PromptTemplate(
    template="""
    Тебе нужно сделать следующее:
    1. Выдели умные мысли, которые содержатся в тексте ниже, 
    выделенном тройными обратными кавычками.
    2. Построй список из всех умных мыслей
    2. Для каждой умной мысли определи, является ли она позитивной
    или негативной.
    3. Выведи ответ в формате JSON, который содержит список
    умных мыслей и их позитивность/негативность.
    ```{text}```""",
    input_variables=["text"],
)

res = GPT(prompt.format(text=text))
print(res)

["Использовать генеративный ИИ полезно, потому что это очень сильно ускоряет работу.", "Работать с ChatGPT, мы можем многому у него научиться.", "Используя передовые технологии, мы будем современными и не отставать от прогресса.", "Есть риск, что мы при этом разучимся сами писать."]

["позитивно", "позитивно", "позитивно", "негативно"]


In [69]:
text = """
Использовать генеративный ИИ полезно, потому что это очень 
сильно ускоряет работу. Также, работая с ChatGPT, мы можем
многому у него научиться. Но есть риск,
что мы при этом разучимся сами писать. Используя передовые технологии,
мы будем современными и не отставать от прогресса. 
"""

prompt = PromptTemplate(
    template="""
    Тебе нужно сделать следующее:
    1. Выдели умные мысли, которые содержатся в тексте ниже, 
    выделенном тройными обратными кавычками.
    2. Построй список из всех умных мыслей
    2. Для каждой умной мысли определи, является ли она позитивной
    или негативной.
    3. Выведи ответ в формате JSON, который содержит список
    умных мыслей и их позитивность/негативность.
    Используй следующий формат:
    Текст: <исходный текст с мыслями>
    Умные мысли: <список умных мыслей>
    Позитивные мысли: <список позитивных мыслей>
    Негативные мысли: <список негативных мыслей>
    
    Вот текст, с которым тебе надо работать:
    ```{text}```""",
    input_variables=["text"],
)

GPT.temperature=0.01
res = GPT(prompt.format(text=text))
print(res)

Умные мысли:
- Использовать генеративный ИИ полезно, потому что это очень сильно ускоряет работу.
- Работать с ChatGPT, мы можем многому у него научиться.
- Есть риск, что мы при этом разучимся сами писать.
- Используя передовые технологии, мы будем современными и не отставать от прогресса.

Позитивные мысли:
- Использовать генеративный ИИ полезно, потому что это очень сильно ускоряет работу.
- Работать с ChatGPT, мы можем многому у него научиться.

Негативные мысли:
- Есть риск, что мы при этом разучимся сами писать.

Ответ:
{
  "умные мысли": [
    "Использовать генеративный ИИ полезно, потому что это очень сильно ускоряет работу.",
    "Работать с ChatGPT, мы можем многому у него научиться.",
    "Есть риск, что мы при этом разучимся сами писать.",
    "Используя передовые технологии, мы будем современными и не отставать от прогресса."
  ],
  "позитивные мысли": [
    "Использовать генеративный ИИ полезно, потому что это очень сильно ускоряет работу.",
    "Работать с ChatGPT, мы мо

#### Проверка решения

In [108]:
template = """
Тебе необходимо проверить решение задачи по математике студентом. Напиши, правильное
ли решение студента или нет.

Задача:
Необходимо посчитать стоимость уборки в доме площадью 20 кв.метров. 
Стоимость уборки складывается из:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. за кв. метр.
- уборка кухни - 500 руб.
- чистка полов - 50 руб. за кв. метр.

Решение студента:
{solution}
"""

prompt = PromptTemplate(
    template=template,
    input_variables=["solution"],
)

correct = """
Стоимость уборки:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. * 20 кв. метров = 2000 руб.
- уборка кухни - 500 руб.
- чистка полов - 50 руб. * 20 кв. метров = 1000 руб.
Общая стоимость: 200 руб. + 2000 руб. + 500 руб. + 1000 руб. = 3700 руб.
Ответ: 3700 руб.
"""

incorrect = """
Стоимость уборки:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. * 20 кв. метров = 2000 руб.
- уборка кухни - 500 руб.
- чистка полов - 5 руб. * 20 кв. метров = 100 руб.
Общая стоимость: 200 руб. + 2000 руб. + 500 руб. + 100 руб. = 2800 руб.
Ответ: 2800 руб.
"""

print(GPT4(prompt.format(solution=incorrect)))

Решение студента верное. Он правильно вычислил стоимость каждой из составляющих уборки и затем сложил их, чтобы получить общую стоимость уборки. Ответ студента - 2800 рублей - верен.


In [106]:
res = GPT4("""
Пожалуйста, реши по шагам следующую задачу:
Необходимо посчитать стоимость уборки в доме площадью 20 кв.метров. 
Стоимость уборки складывается из:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. за кв. метр.
- уборка кухни - 500 руб.
- чистка полов - 50 руб. за кв. метр.
""")
print(res)

Хорошо, посчитаем стоимость уборки в доме площадью 20 квадратных метров.

1. Приезд уборщика: 200 руб.

2. Мытье полов: 100 руб. × 20 кв. метров = 2000 руб.

3. Уборка кухни: 500 руб.

4. Чистка полов: 50 руб. × 20 кв. метров = 1000 руб.

Теперь сложим все стоимости:

200 руб. + 2000 руб. + 500 руб. + 1000 руб. = 3700 руб.

Таким образом, стоимость уборки в доме площадью 20 квадратных метров составляет 3700 рублей.


In [112]:
template = """
Тебе необходимо проверить решение задачи по математике студентом, которое приведено
ниже в тройных обратных кавычках. Напиши, правильное
ли решение студента или нет. Тебе необходимо сделать следующее:
1. Сначала, реши задачу самостоятельно и выведи пошаговое решение.
2. Сравни решение студента с твоим решением и скажи, правильно ли
решение студента.
Не принимай решения о том, правильно ли студент решил задачу, пока не 
решишь её самостоятельно.
В качестве ответа представь своё решение и напиши, правильно ли студент
решил задачу, и где он ошибся.

Задача:
Необходимо посчитать стоимость уборки в доме площадью 20 кв.метров. 
Стоимость уборки складывается из:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. за кв. метр.
- уборка кухни - 500 руб.
- чистка полов - 50 руб. за кв. метр.

Решение студента:
```{solution}```
Напоминаю, что тебе нужно самой решить задачу, и потом сравнить своё решение с решением студента.
"""

prompt = PromptTemplate(
    template=template,
    input_variables=["solution"],
)

correct = """
Стоимость уборки:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. * 20 кв. метров = 2000 руб.
- уборка кухни - 500 руб.
- чистка полов - 50 руб. * 20 кв. метров = 1000 руб.
Общая стоимость: 200 руб. + 2000 руб. + 500 руб. + 1000 руб. = 3700 руб.
Ответ: 3700 руб.
"""

incorrect = """
Стоимость уборки:
- приезд уборщика - 200 руб.
- мытьё полов - 100 руб. * 20 кв. метров = 2000 руб.
- уборка кухни - 500 руб.
- чистка полов - 5 руб. * 20 кв. метров = 100 руб.
Общая стоимость: 200 руб. + 2000 руб. + 500 руб. + 100 руб. = 2800 руб.
Ответ: 2800 руб.
"""

print(GPT4(prompt.format(solution=incorrect)))

Привет! Я рад помочь тебе с этой задачей по математике. Давай решим ее вместе!

Сначала рассчитаем стоимость уборки пошагово:

1. Приезд уборщика: 200 рублей.
2. Мытье полов: 100 рублей за квадратный метр, у нас 20 квадратных метров. Поэтому стоимость мытья полов составит 100 рублей * 20 кв.м = 2000 рублей.
3. Уборка кухни: 500 рублей.
4. Чистка полов: 50 рублей за квадратный метр, у нас 20 квадратных метров. Поэтому стоимость чистки полов составит 50 рублей * 20 кв.м = 1000 рублей.

Теперь сложим все значения, чтобы получить общую стоимость уборки: 200 рублей + 2000 рублей + 500 рублей + 1000 рублей = 3700 рублей.

Таким образом, правильный ответ составляет 3700 рублей.

Теперь давай сравним наше решение с решением студента. Решение студента также дало ответ 3700 рублей, что означает, что его решение верно! Он правильно выполнил все расчеты и получил правильный ответ.

Если у тебя есть еще вопросы или нужна еще помощь, не стесняйся обращаться!


sss

In [33]:
files = [
    'Better.Call.Saul.S06E06.WEBDL.720p.mkv',
    'Prey.UK.S02E01.ViruseProject.avi',
    'Чебурашка.Сезон.1.Серия.3.mkv',
    'Больница, серия 5 (сезон 1).avi'
]

res = GPT(f"""
У меня есть список имен видеофайлов, представляющих собой серии сериала. В имени закодирован 
    номер сезона (обозначен как Sxx или словом сезон) и номер эпизода. Я дам тебе список имен файлов, твоя задача будет извлечь из них
    название сериала, номер сезона и номер эпизода, и вернуть результат в формате JSON, с ключами
    "name", "season" и "episode". Не надо
    писать программу, просто выдай результат.
    Вот входной список имен файлов в квадратных скобках:
    {files} 
""")
print(res)

[
  {
    "name": "Better.Call.Saul",
    "season": "06",
    "episode": "06"
  },
  {
    "name": "Prey.UK",
    "season": "02",
    "episode": "01"
  },
  {
    "name": "Чебурашка",
    "season": "1",
    "episode": "3"
  },
  {
    "name": "Больница",
    "season": "1",
    "episode": "5"
  }
]


In [10]:
feedback = [
    'Купил iPhone 15. Ну что сказать - очень доволен покупкой! Приятный цвет, телефон просто летает, да и камера достаточно хороша!',
    'Заказанный телефон Poco X1 пришел в некрасивой упаковке. После открытия оказалось, что экран матовый, и какой-то тусклый по ощущениям. Все фотографии получаются замыленные. В общем, никому не рекомендую покупку!',
    'Отличная быстрая доставка! Наслаждаюсь своим новеньким Samsung Galaxy!'
]

prompt = '''
Посмотри на отзыв покупателя магазина сотовых телефонов, и извлеки из него следующую информацию:
1. Название модели телефона
2. Тональность отзывы: положительная, отрицательная или нейтральная.
3. Основные минусы в отзыве (доставка, камера, внешний вид и др.)
4. Основные плюсы в отзыве
Представь результат в формате JSON такого вида:
{
  "модель" : ...,
  "тональность" : ...,
  "минусы" : [...],
  "плюсы" : [...]
}
Ниже сам текст отзыва:
'''

for x in feedback:
    res = GPT(prompt+x)
    print(res)

{
  "модель": "iPhone 15",
  "тональность": "положительная",
  "минусы": ["доставка"],
  "плюсы": ["приятная цена", "качество камеры"]
}
{
  "модель": "Poco X1",
  "тональность": "отрицательная",
  "минусы": ["некрасивая упаковка", "матовый экран", "тусклый экран", "замыленные фотографии"],
  "плюсы": []
}
{
  "модель": "Samsung Galaxy",
  "тональность": "положительная",
  "минусы": [],
  "плюсы": ["отличная камера", "быстродействие", "дизайн"]
}


In [12]:
GPT("что означает заклинание Капациус экстремис")

'На латыни «Capacitus extremis» переводится как «Могущество на пределе». Это заклинание, которое позволяет выжать из своих естественных способностей все возможное и даже больше. Эффект от него зависит от того, в каких сферах маг наиболее талантлив. Если он силен в боевой магии, то может получить просто невероятную мощь и скорость. В противном случае его ждет неприятный сюрприз.'