# 🚀 Практика работы с OpenAI API ч1: Основы

## 📚 Что вы узнаете в этом notebook:

- ✅ Как делать первый запрос к OpenAI API
- ✅ Разбор структуры запроса и ответа
- ✅ Основные параметры для управления поведением модели
- ✅ Работа с ролями в диалоге (system, user, assistant)
- ✅ Как легко переключаться между разными моделями и провайдерами
- ✅ Сравнение сильных и слабых моделей
- ✅ Управление историей диалога

## 🎯 Цель:

Показать основы работы с OpenAI API и легкость смены разных моделей и провайдеров.

---


## 📦 Установка и подготовка

Для работы нам понадобится библиотека `openai` - официальный клиент для работы с OpenAI API.


In [27]:
# Установка библиотеки (если еще не установлена)
%pip install openai python-dotenv



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.3.1[0m[39;49m -> [0m[32;49m25.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [74]:
# Импортируем необходимые библиотеки
import os
from openai import OpenAI
from dotenv import load_dotenv

# Загружаем переменные окружения из .env файла
load_dotenv()

# Получаем API ключ из переменных окружения
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

print("✅ Библиотеки импортированы успешно!")
print(f"🔑 API ключ загружен: {'Да' if OPENAI_API_KEY else 'Нет'}")


✅ Библиотеки импортированы успешно!
🔑 API ключ загружен: Да


### 💡 Важно!

Создайте файл `.env` в корне проекта и добавьте туда свой API ключ:

```
OPENAI_API_KEY=sk-your-api-key-here
```

Получить API ключ можно на сайте: https://platform.openai.com/api-keys


---

# Раздел 1: Первый запрос к OpenAI API

Начнем с самого простого - отправим один запрос и получим ответ от модели.


## 1.1 Инициализация клиента

Первым делом нужно создать клиент для работы с API.


In [29]:
# Создаем клиент OpenAI
client = OpenAI(
    api_key=OPENAI_API_KEY  # Передаем наш API ключ
)

print("✅ Клиент OpenAI создан!")


✅ Клиент OpenAI создан!


## 1.2 Простейший запрос

Отправим самый простой запрос к модели.


In [30]:
# Отправляем запрос к модели
response = client.chat.completions.create(
    model="gpt-4o-mini",  # Какую модель используем (быстрая и недорогая)
    messages=[
        {"role": "user", "content": "Привет! Расскажи в одном предложении, что ты умеешь делать?"}  # Наше сообщение
    ]
)

print("✅ Запрос выполнен успешно!")


✅ Запрос выполнен успешно!


## 1.3 Извлечение текста ответа

Самый простой способ получить текст ответа:


In [31]:
# Получаем текст ответа от модели
answer = response.choices[0].message.content

print("💬 Ответ модели:")
print(answer)


💬 Ответ модели:
Привет! Я умею отвечать на вопросы, предоставлять информацию, помогать с изучением языков, генерировать идеи и советы, а также обсуждать различные темы.


## 1.4 Подробный разбор структуры ответа

Теперь давайте разберем, что именно нам вернула модель. Объект ответа содержит много полезной информации!


In [32]:
# Смотрим весь объект ответа
print("📦 Полный объект ответа:")
print(response)
print("\n" + "="*80 + "\n")


📦 Полный объект ответа:
ChatCompletion(id='chatcmpl-CTpPg3I7w3xtGapOjRhD5HOX4SXbb', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='Привет! Я умею отвечать на вопросы, предоставлять информацию, помогать с изучением языков, генерировать идеи и советы, а также обсуждать различные темы.', refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None))], created=1761225180, model='gpt-4o-mini-2024-07-18', object='chat.completion', service_tier='default', system_fingerprint='fp_560af6e559', usage=CompletionUsage(completion_tokens=37, prompt_tokens=24, total_tokens=61, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)))




### 🔍 Разбор полей ответа:

Давайте детально рассмотрим каждое поле:


In [33]:
print("🆔 ID запроса:")
print(f"   {response.id}")
print("   ↳ Уникальный идентификатор этого запроса")
print()

print("🏷️  Тип объекта:")
print(f"   {response.object}")
print("   ↳ Всегда 'chat.completion' для обычных запросов")
print()

print("📅 Время создания (timestamp):")
print(f"   {response.created}")
print("   ↳ Unix timestamp - когда был создан ответ")
print()

print("🤖 Модель:")
print(f"   {response.model}")
print("   ↳ Какая именно модель ответила (может отличаться от запрошенной)")
print()

print("💡 Choices (варианты ответов):")
print(f"   Количество вариантов: {len(response.choices)}")
print("   ↳ Обычно один вариант, но можно запросить несколько (параметр n)")
print()

print("   Первый вариант ответа:")
choice = response.choices[0]
print(f"   - index: {choice.index}")
print(f"   - finish_reason: {choice.finish_reason}")
print("     ↳ Причина завершения: 'stop' = нормальное завершение")
print(f"   - message.role: {choice.message.role}")
print("     ↳ Роль ответившего (всегда 'assistant')")
print(f"   - message.content: {choice.message.content[:50]}...")
print("     ↳ Сам текст ответа")
print()

print("📊 Usage (использование токенов):")
print(f"   - prompt_tokens: {response.usage.prompt_tokens}")
print("     ↳ Сколько токенов в нашем запросе")
print(f"   - completion_tokens: {response.usage.completion_tokens}")
print("     ↳ Сколько токенов в ответе модели")
print(f"   - total_tokens: {response.usage.total_tokens}")
print("     ↳ Всего токенов использовано")
print()

print("💰 Стоимость:")
print("   GPT-4o-mini цены (на март 2024):")
print("   - Input: $0.150 / 1M токенов")
print("   - Output: $0.600 / 1M токенов")
cost = (response.usage.prompt_tokens * 0.150 / 1_000_000 + 
        response.usage.completion_tokens * 0.600 / 1_000_000)
print(f"   Примерная стоимость этого запроса: ${cost:.6f}")


🆔 ID запроса:
   chatcmpl-CTpPg3I7w3xtGapOjRhD5HOX4SXbb
   ↳ Уникальный идентификатор этого запроса

🏷️  Тип объекта:
   chat.completion
   ↳ Всегда 'chat.completion' для обычных запросов

📅 Время создания (timestamp):
   1761225180
   ↳ Unix timestamp - когда был создан ответ

🤖 Модель:
   gpt-4o-mini-2024-07-18
   ↳ Какая именно модель ответила (может отличаться от запрошенной)

💡 Choices (варианты ответов):
   Количество вариантов: 1
   ↳ Обычно один вариант, но можно запросить несколько (параметр n)

   Первый вариант ответа:
   - index: 0
   - finish_reason: stop
     ↳ Причина завершения: 'stop' = нормальное завершение
   - message.role: assistant
     ↳ Роль ответившего (всегда 'assistant')
   - message.content: Привет! Я умею отвечать на вопросы, предоставлять ...
     ↳ Сам текст ответа

📊 Usage (использование токенов):
   - prompt_tokens: 24
     ↳ Сколько токенов в нашем запросе
   - completion_tokens: 37
     ↳ Сколько токенов в ответе модели
   - total_tokens: 61
     ↳ Вс

### 📝 Важные моменты:

1. **`finish_reason`** может быть:
   - `stop` - модель завершила ответ естественным образом
   - `length` - достигнут лимит токенов (параметр `max_tokens`)
   - `content_filter` - ответ заблокирован фильтром контента
   - `tool_calls` - модель вызвала инструменты (об этом в других уроках)

2. **Токены** - это не слова! Один токен ≈ 0.75 слова для английского, ≈ 0.5 слова для русского

3. **Стоимость** зависит от:
   - Модели (GPT-4 дороже, чем GPT-3.5)
   - Количества токенов
   - Input токены обычно дешевле output токенов


## 1.5 Практика: еще несколько примеров

Попробуем разные запросы и посмотрим на изменения в ответах:


In [34]:
# Пример 1: Короткий вопрос
response1 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Сколько будет 2+2?"}]
)

print("❓ Вопрос: Сколько будет 2+2?")
print(f"💬 Ответ: {response1.choices[0].message.content}")
print(f"📊 Токены: {response1.usage.prompt_tokens} (in) + {response1.usage.completion_tokens} (out)")
print()


❓ Вопрос: Сколько будет 2+2?
💬 Ответ: 2 + 2 будет равняться 4.
📊 Токены: 15 (in) + 11 (out)



In [35]:
# Пример 2: Задача посложнее
response2 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{
        "role": "user", 
        "content": "Объясни простыми словами, что такое машинное обучение. Максимум 2 предложения."
    }]
)

print("❓ Вопрос: Объясни простыми словами, что такое машинное обучение")
print(f"💬 Ответ: {response2.choices[0].message.content}")
print(f"📊 Токены: {response2.usage.prompt_tokens} (in) + {response2.usage.completion_tokens} (out)")
print()


❓ Вопрос: Объясни простыми словами, что такое машинное обучение
💬 Ответ: Машинное обучение — это область информатики, которая занимается созданием алгоритмов, позволяющих компьютерам обучаться на данных и делать предсказания или принимать решения без явного программирования. Оно позволяет системам улучшать свою работу с течением времени на основе полученного опыта.
📊 Токены: 26 (in) + 59 (out)



In [36]:
# Пример 3: Генерация текста
response3 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{
        "role": "user", 
        "content": "Напиши короткое стихотворение про кота (4 строки)"
    }]
)

print("❓ Вопрос: Напиши короткое стихотворение про кота")
print(f"💬 Ответ:\n{response3.choices[0].message.content}")
print(f"\n📊 Токены: {response3.usage.prompt_tokens} (in) + {response3.usage.completion_tokens} (out)")


❓ Вопрос: Напиши короткое стихотворение про кота
💬 Ответ:
Как кот в окне, он солнце ждет,  
Мурлычет тихо, мечты плетет.  
Вдаль глядит, где птицы вьются,  
В его глазах — весна смеется.  

📊 Токены: 21 (in) + 53 (out)


---

## ✅ Итоги Раздела 1:

Мы научились:
- ✅ Создавать клиент OpenAI
- ✅ Отправлять простейший запрос
- ✅ Извлекать текст ответа
- ✅ Разбирать структуру ответа и понимать все поля
- ✅ Считать токены и примерную стоимость

**Следующий шаг:** Изучим основные параметры для управления поведением модели!


---

# Раздел 2: Основные параметры запроса

Помимо модели и сообщений, API предоставляет множество параметров для тонкой настройки поведения модели. Рассмотрим самые важные из них.


## 2.1 Temperature - управление креативностью

**Temperature** (температура) - один из самых важных параметров!

- **Диапазон:** от 0 до 2
- **По умолчанию:** 1.0
- **Что делает:**
  - `0` = Детерминированный, предсказуемый ответ (всегда выбирает самый вероятный токен)
  - `1` = Баланс между креативностью и предсказуемостью
  - `2` = Максимальная креативность и случайность

**Когда использовать:**
- `0-0.3` - для задач требующих точности: анализ данных, извлечение информации, классификация
- `0.7-1.0` - для обычных диалогов и генерации текста
- `1.5-2.0` - для творческих задач: написание стихов, генерация идей


### Практика: сравним разные значения temperature

Зададим одинаковый вопрос с разными значениями temperature:


In [37]:
question = "Придумай название для кофейни"

# Temperature = 0 (детерминированный)
response_t0 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=0
)

print("🌡️ Temperature = 0 (максимально предсказуемый)")
print(f"💬 {response_t0.choices[0].message.content}")
print()


🌡️ Temperature = 0 (максимально предсказуемый)
💬 Вот несколько идей для названия кофейни:

1. "Кофейный уголок"
2. "Ароматный момент"
3. "Кофе и уют"
4. "Заварка счастья"
5. "Кофейная симфония"
6. "Чашка вдохновения"
7. "Кофейный рай"
8. "Эспрессо и мечты"
9. "Кофе с душой"
10. "Тепло чашки"

Надеюсь, одно из этих названий вам понравится!



In [38]:
# Temperature = 1 (стандартный)
response_t1 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=1.0
)

print("🌡️ Temperature = 1.0 (стандартный, сбалансированный)")
print(f"💬 {response_t1.choices[0].message.content}")
print()


🌡️ Temperature = 1.0 (стандартный, сбалансированный)
💬 "Кофейный уголок"



## 2.2 Max Tokens - ограничение длины ответа

**max_tokens** - максимальное количество токенов в ответе модели.

- **Что делает:** Ограничивает длину генерируемого ответа
- **По умолчанию:** Зависит от модели (обычно inf - без ограничений)
- **Важно:** Это НЕ количество слов! Токен ≈ 0.5-0.75 слова

**Когда использовать:**
- Когда нужен короткий ответ (да/нет, одно слово)
- Для контроля затрат (меньше токенов = меньше стоимость)
- Для предсказуемости длины ответа


### Практика: ограничиваем длину ответа


In [43]:
question = "Расскажи про машинное обучение за 10 слов"

# Без ограничений
response_unlimited = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=0.7
)

print("♾️  Без ограничения max_tokens:")
print(f"💬 {response_unlimited.choices[0].message.content}")
print(f"📊 Использовано токенов: {response_unlimited.usage.completion_tokens}")
print(f"✅ finish_reason: {response_unlimited.choices[0].finish_reason}")
print()


♾️  Без ограничения max_tokens:
💬 Машинное обучение — это алгоритмы, обучающиеся на данных для предсказаний.
📊 Использовано токенов: 21
✅ finish_reason: stop



In [41]:
# С ограничением 50 токенов
response_50 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=0.7,
    max_tokens=50  # Ограничиваем длину ответа
)

print("🔢 max_tokens = 50:")
print(f"💬 {response_50.choices[0].message.content}")
print(f"📊 Использовано токенов: {response_50.usage.completion_tokens}")
print(f"✅ finish_reason: {response_50.choices[0].finish_reason}")
print("   ↳ 'length' = ответ обрезан из-за достижения лимита!")
print()


🔢 max_tokens = 50:
💬 Машинное обучение (МЛ) — это область искусственного интеллекта, которая сосредоточена на разработке алгоритмов и моделей, позволяющих компьютерам обучаться на основе данных и делать предсказания или принимать решения без
📊 Использовано токенов: 50
✅ finish_reason: length
   ↳ 'length' = ответ обрезан из-за достижения лимита!



In [42]:
# Очень короткий ответ (10 токенов)
response_10 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=0.7,
    max_tokens=10
)

print("🔢 max_tokens = 10:")
print(f"💬 {response_10.choices[0].message.content}")
print(f"📊 Использовано токенов: {response_10.usage.completion_tokens}")
print(f"✅ finish_reason: {response_10.choices[0].finish_reason}")


🔢 max_tokens = 10:
💬 Машинное обучение — это подмнож
📊 Использовано токенов: 10
✅ finish_reason: length


## 2.3 Top P - альтернативное управление разнообразием

**top_p** (nucleus sampling) - еще один способ контроля случайности генерации.

- **Диапазон:** от 0 до 1
- **По умолчанию:** 1.0
- **Что делает:** Модель выбирает из токенов, чья совокупная вероятность составляет p

**Как работает:**
- `top_p=0.1` - выбор только из топ 10% наиболее вероятных токенов (консервативно)
- `top_p=0.9` - выбор из топ 90% вероятных токенов (сбалансированно)
- `top_p=1.0` - рассматриваются все возможные токены (максимальное разнообразие)

**⚠️ Важно:** OpenAI рекомендует использовать либо `temperature`, либо `top_p`, но не оба одновременно!


### Практика: сравнение top_p


In [44]:
question = "Придумай слоган для стартапа по доставке еды"

# top_p = 0.1 (консервативный)
response_p01 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=1.0,  # Оставляем temperature стандартным
    top_p=0.1  # Сильное ограничение разнообразия
)

print("📊 top_p = 0.1 (консервативный выбор)")
print(f"💬 {response_p01.choices[0].message.content}")
print()


📊 top_p = 0.1 (консервативный выбор)
💬 "Вкусно, быстро, с любовью — еда, которая всегда рядом!"



In [45]:
# top_p = 0.9 (сбалансированный)
response_p09 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": question}],
    temperature=1.0,
    top_p=0.9
)

print("📊 top_p = 0.9 (сбалансированный)")
print(f"💬 {response_p09.choices[0].message.content}")
print()

print("📝 Примечание: top_p даёт более стабильные результаты для точных задач, "
      "в то время как temperature лучше для творческих задач.")


📊 top_p = 0.9 (сбалансированный)
💬 "Вкус на doorstep: наслаждайся каждой минутой!"

📝 Примечание: top_p даёт более стабильные результаты для точных задач, в то время как temperature лучше для творческих задач.


## 2.4 Другие полезные параметры

Есть еще несколько параметров, которые стоит знать:


In [46]:
# n - количество вариантов ответа
response_multiple = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Придумай название для приложения"}],
    n=3,  # Запрашиваем 3 варианта
    temperature=1.0
)

print("🎲 Параметр n=3 (получаем несколько вариантов):")
for i, choice in enumerate(response_multiple.choices, 1):
    print(f"   Вариант {i}: {choice.message.content}")
print()

print(f"💰 Внимание: стоимость умножается на n! Токенов: {response_multiple.usage.total_tokens}")


🎲 Параметр n=3 (получаем несколько вариантов):
   Вариант 1: Вот несколько идей для названия приложения:

1. **LifeHub** – для приложения, которое помогает организовать повседневные задачи.
2. **MoodTracker** – если это приложение для отслеживания настроения.
3. **EcoPlanner** – для приложения по планированию устойчивого образа жизни.
4. **QuickCook** – для рецептов и приготовления пищи.
5. **FitBuddy** – для фитнес-приложения с элементами сообщества.
6. **DreamWeaver** – если приложение связано с планами и мечтами.
7. **ReadWise** – для приложения для чтения и рекомендаций книг.
8. **TravelMate** – для планирования путешествий и маршрутов.

Если у вас есть определённая тематика, дайте знать, и я придумаю названия, учитывая её!
   Вариант 2: Конечно! Чтобы предложить лучшее название, можно узнать немного больше о функционале и целевой аудитории вашего приложения. Но вот несколько универсальных идей:

1. **LifeSync** - для приложений, помогающих организовать жизнь и задачи.
2. **FitTrac

In [47]:
# presence_penalty и frequency_penalty - штрафы за повторения
# presence_penalty: штраф за использование уже встречавшихся токенов (независимо от частоты)
# frequency_penalty: штраф пропорциональный частоте появления токена

# Диапазон: от -2.0 до 2.0
# Положительные значения уменьшают повторения
# Отрицательные - наоборот, поощряют повторения

response_no_penalty = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Напиши 5 причин заниматься спортом"}],
    temperature=0.7
)

response_with_penalty = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Напиши 5 причин заниматься спортом"}],
    temperature=0.7,
    presence_penalty=0.6,  # Штрафуем за повторения
    frequency_penalty=0.3   # Дополнительный штраф за частые повторения
)

print("🔄 Без штрафов за повторения:")
print(response_no_penalty.choices[0].message.content)
print("\n" + "="*80 + "\n")

print("✨ С штрафами (presence_penalty=0.6, frequency_penalty=0.3):")
print(response_with_penalty.choices[0].message.content)
print("\n📝 Обратите внимание: текст стал более разнообразным, меньше повторяющихся слов и структур")


🔄 Без штрафов за повторения:
Вот пять причин заниматься спортом:

1. **Улучшение физического здоровья**: Регулярные физические нагрузки способствуют укреплению сердечно-сосудистой системы, улучшению обмена веществ и повышению иммунитета. Это снижает риск развития хронических заболеваний, таких как диабет и гипертония.

2. **Психологическое благополучие**: Занятия спортом способствуют выработке эндорфинов, которые улучшают настроение и снижают уровень стресса. Это помогает бороться с тревожностью и депрессией.

3. **Формирование дисциплины и настойчивости**: Регулярные тренировки требуют самоорганизации и целеустремленности. Эти качества, развиваемые в спорте, могут быть полезны и в других аспектах жизни, включая учебу и карьеру.

4. **Социальные связи**: Спорт часто является коллективным занятием, что позволяет завести новых друзей и укрепить старые связи. Командные виды спорта особенно способствуют развитию социальной активности и командного духа.

5. **Улучшение физической формы и ув

---

## ✅ Итоги Раздела 2:

Мы изучили основные параметры запроса:

| Параметр | Диапазон | Назначение | Когда использовать |
|----------|----------|------------|-------------------|
| **temperature** | 0-2 | Креативность | 0-0.3 для точных задач, 0.7-1.0 для диалогов, 1.5-2.0 для творчества |
| **max_tokens** | 1-∞ | Ограничение длины | Для коротких ответов и контроля затрат |
| **top_p** | 0-1 | Разнообразие выбора | Альтернатива temperature (не использовать вместе!) |
| **n** | 1-∞ | Количество вариантов | Когда нужно несколько альтернатив |
| **presence_penalty** | -2 до 2 | Штраф за повторения | Для более разнообразного текста |
| **frequency_penalty** | -2 до 2 | Штраф за частые повторения | Вместе с presence_penalty |

**💡 Главный совет:** Начинайте с простых параметров (temperature, max_tokens) и добавляйте другие только при необходимости!

**Следующий шаг:** Изучим роли в диалоге (system, user, assistant)!


---

# Раздел 3: Структура диалога и роли

В OpenAI API диалог состоит из сообщений с разными ролями. Понимание ролей критически важно для эффективной работы с моделью!


## 3.1 Три основные роли

В OpenAI Chat API есть три роли сообщений:

### 🎭 **system** - Системное сообщение
- **Назначение:** Задает контекст, правила поведения и роль ассистента
- **Когда используется:** В начале диалога (обычно первое сообщение)
- **Примеры:** "Ты опытный программист Python", "Отвечай кратко и по делу", "Ты дружелюбный помощник"
- **Важно:** Сильно влияет на поведение модели на протяжении всего диалога!

### 👤 **user** - Сообщение пользователя
- **Назначение:** Запросы и вопросы от пользователя
- **Когда используется:** Каждый раз, когда пользователь что-то спрашивает
- **Примеры:** "Как создать список в Python?", "Расскажи про машинное обучение"

### 🤖 **assistant** - Ответ модели
- **Назначение:** Ответы модели на запросы пользователя
- **Когда используется:** Автоматически в ответах, или вручную при передаче истории
- **Примеры:** Ответы модели, которые вы хотите включить в контекст для следующего запроса


## 3.2 Запрос без system роли (только user)

Самый простой вариант - просто задать вопрос от пользователя:


In [48]:
# Только роль user
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "user", "content": "Объясни что такое рекурсия"}
    ],
    temperature=0.7
)

print("👤 Только USER роль (без системного промпта):")
print(response.choices[0].message.content)


👤 Только USER роль (без системного промпта):
Рекурсия — это метод решения задач, при котором функция вызывает саму себя для обработки подзадач. Это позволяет разбивать сложные проблемы на более простые и решать их последовательно. Рекурсия часто используется в программировании, математике и алгоритмах.

Примером рекурсивной функции может служить вычисление факториала числа. Факториал числа n (обозначается n!) равен произведению всех целых чисел от 1 до n. Он может быть определен рекурсивно следующим образом:

- Если n = 0, то 0! = 1 (база рекурсии).
- Если n > 0, то n! = n * (n - 1)! (рекурсивный случай).

Таким образом, функция для вычисления факториала может выглядеть так:

```python
def factorial(n):
    if n == 0:
        return 1
    else:
        return n * factorial(n - 1)
```

Важно помнить, что рекурсия требует наличия условия выхода (базы рекурсии), чтобы избежать бесконечного вызова функции. В противном случае это приведет к переполнению стека и ошибке выполнения.


## 3.3 Добавляем system роль

System роль позволяет задать поведение и стиль ответов модели:


In [49]:
# С system ролью - объясняем как для ребенка
response_child = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты учитель, который объясняет сложные вещи простым языком для детей 7 лет. Используй примеры из жизни и аналогии."},
        {"role": "user", "content": "Объясни что такое рекурсия"}
    ],
    temperature=0.7
)

print("🎭 SYSTEM + USER (объяснение для ребенка):")
print(response_child.choices[0].message.content)
print("\n" + "="*80 + "\n")


🎭 SYSTEM + USER (объяснение для ребенка):
Представь, что у тебя есть очень высокая лестница, и ты хочешь забраться на самый верх. Но вместо того, чтобы сразу прыгнуть на верхнюю ступеньку, ты поднимаешься по одной ступеньке за раз. 

Рекурсия — это как если бы ты встречал себя на каждой ступеньке и спрашивал: "Как мне подняться на следующую ступеньку?" И твой "внутренний голос" говорит: "Поднимись на одну ступеньку выше, а потом снова спроси меня, как подняться на следующую."

Таким образом, каждый раз, когда ты поднимаешься на одну ступеньку, ты задаешь тот же вопрос, пока не достигнешь самой верхней ступеньки. Это как если бы ты повторял одно и то же действие снова и снова, пока не достигнешь своей цели.

Вот еще один пример: представь, что ты играешь в игру, где нужно сложить все игрушки в комнате. Ты можешь взять одну игрушку и сказать: "Теперь я уберу остальные игрушки." И когда ты уберешь одну, ты снова смотришь на остальные и спрашиваешь: "Как мне убрать их?" И так ты продолжаеш

In [50]:
# С system ролью - технический стиль
response_tech = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты опытный программист. Отвечай технически точно, с примерами кода. Будь кратким и конкретным."},
        {"role": "user", "content": "Объясни что такое рекурсия"}
    ],
    temperature=0.7
)

print("🎭 SYSTEM + USER (технический стиль):")
print(response_tech.choices[0].message.content)
print("\n" + "="*80 + "\n")


🎭 SYSTEM + USER (технический стиль):
Рекурсия — это метод программирования, при котором функция вызывает саму себя для решения подзадачи. Рекурсия часто используется для решения задач, которые можно разбить на более мелкие подзадачи того же типа.

Ключевые моменты рекурсии:

1. **Базовый случай**: Условие, при котором рекурсия прекращается.
2. **Рекурсивный случай**: Условие, при котором функция вызывает саму себя.

Пример рекурсивной функции для вычисления факториала числа:

```python
def factorial(n):
    if n == 0:  # Базовый случай
        return 1
    else:  # Рекурсивный случай
        return n * factorial(n - 1)

# Пример вызова
print(factorial(5))  # Вывод: 120
```

В этом примере `factorial(5)` вызывает `factorial(4)`, затем `factorial(3)`, и так далее, пока не достигнет базового случая `factorial(0)`, после чего начинает возвращать значения обратно.




In [51]:
# С system ролью - поэтический стиль  
response_poet = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты поэт и философ. Отвечай красиво, метафорично, используя художественные образы."},
        {"role": "user", "content": "Объясни что такое рекурсия"}
    ],
    temperature=0.9
)

print("🎭 SYSTEM + USER (поэтический стиль):")
print(response_poet.choices[0].message.content)

print("\n📝 Вывод: System роль КАРДИНАЛЬНО меняет стиль и содержание ответов!")


🎭 SYSTEM + USER (поэтический стиль):
Рекурсия — это словно сказочный лес, в который вы входите и находите не только себя, но и отражения своих мыслей, каждое из которых ведёт к новому, ожидая, что вы разрешите загадку. 

Представьте себе, что вы стоите перед зеркалом и видите своё собственное отражение. Но это не простое отражение — оно указывает на ещё одно зеркало, в котором вы снова видите себя, и так далее, вплоть до бесконечности. В этом танце отражений, каждое ваше движение становится преддверием нового открытия, каждый шаг — шагом вглубь, к сути, скрытой за занавесом простоты.

Так и рекурсия в программировании: функция, обращаясь к самой себе, ставит перед собой задачу, словно искатель находит себя в лабиринте, где каждое решение помогает продвигаться к выходу. Это бесконечный процесс, способный разложить самую сложную задачу на простые элементы, как новый листик на ветке, который растёт из корня, прорастая к свету.

В этом круговороте повторений сокрыта великая истина: через с

## 3.4 Роль assistant - направляем диалог

Роль `assistant` используется двумя способами:
1. **Автоматически** - модель отвечает от роли assistant
2. **Вручную** - мы можем задать желаемый стиль ответа через "пример" от assistant

Второй способ особенно полезен для задания формата и стиля ответов:


In [52]:
# Пример: задаем начало ответа через assistant роль
response_guided = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты эксперт по Python."},
        {"role": "user", "content": "Расскажи про списки в Python"},
        {"role": "assistant", "content": "Списки в Python - это:"} # Начинаем ответ за модель
    ],
    temperature=0.7
)

print("🎯 Направляем ответ через частичный assistant:")
print("Ассистент начал: 'Списки в Python - это:'")
print("Модель продолжила:", response_guided.choices[0].message.content)
print("\n" + "="*80 + "\n")


🎯 Направляем ответ через частичный assistant:
Ассистент начал: 'Списки в Python - это:'
Модель продолжила: Списки в Python - это встроенные структуры данных, которые позволяют хранить последовательности элементов. Они являются изменяемыми (мутабельными), что означает, что вы можете изменять их содержимое после создания. Основные характеристики и функции списков в Python включают:

### 1. Создание списков
Списки создаются с помощью квадратных скобок `[]`, внутри которых элементы разделяются запятыми. Например:

```python
my_list = [1, 2, 3, 4, 5]
fruits = ["apple", "banana", "cherry"]
mixed_list = [1, "hello", 3.14, True]
```

### 2. Индексация
Элементы списка индексируются, начиная с 0. Вы можете получить доступ к элементам списка, используя их индексы:

```python
print(my_list[0])  # Вывод: 1
print(fruits[1])   # Вывод: banana
```

Вы также можете использовать отрицательные индексы для доступа к элементам с конца списка:

```python
print(my_list[-1])  # Вывод: 5 (последний элемент)
``

In [53]:
# Пример: принудительное форматирование JSON через assistant
response_json = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты API, который всегда отвечает в формате JSON."},
        {"role": "user", "content": "Какая сейчас погода в Москве?"},
        {"role": "assistant", "content": "{"} # Принуждаем начать с JSON
    ],
    temperature=0.7,
    max_tokens=100
)

print("🎯 Принуждаем к JSON формату через assistant:")
print("Ассистент начал: '{'")
print("Модель продолжила:", response_json.choices[0].message.content)
print("\n💡 Этот трюк помогает получать структурированные ответы!")


🎯 Принуждаем к JSON формату через assistant:
Ассистент начал: '{'
Модель продолжила: {
  "error": "Не удается получить данные о погоде в реальном времени."
}

💡 Этот трюк помогает получать структурированные ответы!


---

## ✅ Итоги Раздела 3:

Мы изучили три роли в диалоге:

| Роль | Назначение | Когда использовать |
|------|------------|-------------------|
| **system** | Задает контекст и правила | В начале диалога, для настройки поведения модели |
| **user** | Запросы пользователя | Каждый вопрос или команда от пользователя |
| **assistant** | Ответы модели | Автоматически в ответах, или вручную для направления формата |

**💡 Ключевые выводы:**
- System роль - мощный инструмент управления поведением!
- Одинаковый вопрос с разными system промптами даст совершенно разные ответы
- Assistant роль можно использовать для "подсказки" желаемого формата ответа

**Следующий шаг:** Создадим простой чат и посмотрим на разные типы задач!


---

# Раздел 4: Простой чат без истории

Давайте посмотрим на разные типы задач, которые можно решать с помощью OpenAI API. Пока без сохранения истории - каждый запрос независимый.


## 4.1 Генерация контента

Модель отлично справляется с созданием различного контента:


In [54]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты креативный копирайтер."},
        {"role": "user", "content": "Напиши короткий пост для Instagram о новом кафе с видом на море"}
    ],
    temperature=0.8
)

print("📝 Генерация контента (Instagram пост):")
print(response.choices[0].message.content)
print()


📝 Генерация контента (Instagram пост):
🌊✨ Открытие нового кафе с захватывающим видом на море! ☕️🥐

Дорогие друзья! Мы рады пригласить вас в наше уютное место, где каждый глоток ароматного кофе и каждая вкусная закуска становятся настоящим удовольствием. Наслаждайтесь свежим бризом и панорамными видами на океан, сидя на террасе с любимыми людьми. 🌅❤️

Приходите на дегустацию наших авторских блюд и напитков! Мы уверены, что это станет вашим новым любимым местом. 🍽️💙

#КафеНаМорe #КофеСВидом #Уют #НоваяЛокация #МорскиеВпечатления



## 4.2 Анализ и классификация

Модель может анализировать текст и классифицировать его:


In [55]:
review_text = "Ужасное обслуживание! Ждали заказ 2 часа, еда пришла холодная. Больше никогда сюда не вернемся!"

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты анализируешь тональность отзывов. Отвечай одним словом: позитивный, негативный или нейтральный."},
        {"role": "user", "content": f"Определи тональность отзыва: {review_text}"}
    ],
    temperature=0  # Детерминированный ответ для классификации
)

print("🔍 Анализ тональности отзыва:")
print(f"Отзыв: {review_text}")
print(f"Тональность: {response.choices[0].message.content}")
print()


🔍 Анализ тональности отзыва:
Отзыв: Ужасное обслуживание! Ждали заказ 2 часа, еда пришла холодная. Больше никогда сюда не вернемся!
Тональность: Негативный



## 4.3 Извлечение информации

Модель может извлекать структурированную информацию из неструктурированного текста:


In [57]:
text = """
Меня зовут Иван Петров, мне 28 лет. Работаю software engineer в компании TechCorp. 
Мой email: ivan.petrov@techcorp.com, телефон: +7-999-123-45-67.
Живу в Москве, люблю программировать на Python и играть на гитаре.
"""

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Извлеки из текста информацию и верни в формате: Имя, Возраст, Профессия, Email, Телефон, Город, Хобби. Каждый пункт с новой строки."},
        {"role": "user", "content": text}
    ],
    temperature=0
)

print("📋 Извлечение структурированных данных:")
print(response.choices[0].message.content)
print()


📋 Извлечение структурированных данных:
Имя: Иван Петров  
Возраст: 28  
Профессия: software engineer  
Email: ivan.petrov@techcorp.com  
Телефон: +7-999-123-45-67  
Город: Москва  
Хобби: программировать на Python, играть на гитаре  



## 4.4 Перевод

Модель превосходно переводит между языками:


In [58]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты профессиональный переводчик. Переводи точно, сохраняя стиль и смысл."},
        {"role": "user", "content": "Переведи на английский: 'Я люблю изучать искусственный интеллект и машинное обучение. Это удивительная область, которая меняет мир!'"}
    ],
    temperature=0.3
)

print("🌐 Перевод:")
print(response.choices[0].message.content)
print()


🌐 Перевод:
"I love studying artificial intelligence and machine learning. It's an amazing field that is changing the world!"



## 4.5 Помощь с кодом

Модель отлично помогает с программированием:


In [59]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты эксперт по Python. Пиши чистый, понятный код с комментариями."},
        {"role": "user", "content": "Напиши функцию, которая находит все простые числа до N"}
    ],
    temperature=0.2
)

print("💻 Генерация кода:")
print(response.choices[0].message.content)
print()


💻 Генерация кода:
Конечно! Вот пример функции на Python, которая находит все простые числа до заданного числа \( N \). Мы будем использовать алгоритм "Решето Эратосфена", который является эффективным способом нахождения всех простых чисел до заданного предела.

```python
def find_primes_up_to_n(n):
    """
    Находит все простые числа до заданного числа n.

    :param n: Верхний предел (включительно) для поиска простых чисел.
    :return: Список простых чисел до n.
    """
    if n < 2:
        return []  # Простых чисел нет, если n меньше 2

    # Инициализируем список, где индекс будет представлять число,
    # а значение - True (число простое) или False (число составное)
    is_prime = [True] * (n + 1)
    is_prime[0] = is_prime[1] = False  # 0 и 1 не являются простыми числами

    # Начинаем с первого простого числа, 2
    for i in range(2, int(n**0.5) + 1):
        if is_prime[i]:  # Если i - простое число
            # Обнуляем все кратные i, начиная с i*i
            for j in r

---

## ✅ Итоги Раздела 4:

Мы рассмотрели основные типы задач для LLM:

| Тип задачи | Temperature | Примеры |
|-----------|-------------|---------|
| **Генерация контента** | 0.7-1.2 | Посты, статьи, стихи, идеи |
| **Анализ и классификация** | 0-0.3 | Тональность, категории, метки |
| **Извлечение информации** | 0-0.2 | Парсинг текста, выделение данных |
| **Перевод** | 0.2-0.5 | Перевод между языками |
| **Помощь с кодом** | 0-0.3 | Генерация, объяснение, рефакторинг кода |

**💡 Правило:** Чем точнее нужен результат, тем ниже temperature!

**Следующий шаг:** Сравним разные модели и провайдеров на одной задаче!


---

# Раздел 5: Сравнение моделей и провайдеров

Одна из главных фишек OpenAI API - это то, что он стал стандартом де-факто. Множество провайдеров используют совместимый интерфейс, что позволяет легко переключаться между моделями!

В этом разделе мы:
- Сравним разные модели OpenAI
- Подключим OpenRouter для доступа к моделям других провайдеров (Anthropic, Google, Meta)
- Увидим разницу между сильными и слабыми моделями
- Попробуем reasoning модель (o1-mini)

**🎯 Цель:** Показать, что смена модели - это всего 2 строки кода!


## 5.1 Тестовая задача

Используем задачу, где видна разница между моделями - логическую головоломку:


In [66]:
# Задача, которая покажет разницу между моделями
test_prompt = """
У Маши было 5 яблок. Она отдала 2 яблока Пете, а потом купила еще 3 яблока.
Петя съел 1 яблоко и отдал половину оставшихся яблок обратно Маше.

Вопросы:
1. Сколько яблок сейчас у Маши?
2. Сколько яблок сейчас у Пети?
3. Покажи пошаговое решение.

Отвечай кратко и структурированно.
"""

print("📝 Тестовая задача для сравнения моделей:")
print(test_prompt)


📝 Тестовая задача для сравнения моделей:

У Маши было 5 яблок. Она отдала 2 яблока Пете, а потом купила еще 3 яблока.
Петя съел 1 яблоко и отдал половину оставшихся яблок обратно Маше.

Вопросы:
1. Сколько яблок сейчас у Маши?
2. Сколько яблок сейчас у Пети?
3. Покажи пошаговое решение.

Отвечай кратко и структурированно.



## 5.2 Модели OpenAI

Начнем с моделей OpenAI - просто меняем параметр `model`:


In [67]:
# GPT-3.5-turbo - базовая модель
response_gpt35 = client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 GPT-3.5-turbo (базовая, старая модель):")
print(response_gpt35.choices[0].message.content)
print(f"\n📊 Токены: {response_gpt35.usage.total_tokens}")
print("="*80 + "\n")


🤖 GPT-3.5-turbo (базовая, старая модель):
Ответы:
1. У Маши сейчас 6 яблок.
2. У Пети сейчас 1 яблоко.

Пошаговое решение:
1. У Маши было 5 яблок.
2. Она отдала 2 яблока Пете, осталось 5 - 2 = 3 яблока.
3. Потом Маша купила еще 3 яблока, итого 3 + 3 = 6 яблок у Маши.
4. Петя съел 1 яблоко, осталось 6 - 1 = 5 яблок у Маши.
5. Петя отдал половину оставшихся яблок обратно Маше, то есть 5 / 2 = 2 яблока.
6. Итого у Пети осталось 1 яблоко.

📊 Токены: 401



In [68]:
# GPT-4o-mini - быстрая и умная модель
response_gpt4mini = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 GPT-4o-mini (быстрая, умная, дешевая):")
print(response_gpt4mini.choices[0].message.content)
print(f"\n📊 Токены: {response_gpt4mini.usage.total_tokens}")
print("="*80 + "\n")


🤖 GPT-4o-mini (быстрая, умная, дешевая):
### Пошаговое решение:

1. **Начальное количество яблок у Маши:**
   - У Маши было 5 яблок.

2. **Маша отдала 2 яблока Пете:**
   - Яблоки у Маши: 5 - 2 = 3 яблока.
   - Яблоки у Пети: 2 яблока.

3. **Маша купила еще 3 яблока:**
   - Яблоки у Маши: 3 + 3 = 6 яблок.

4. **Петя съел 1 яблоко:**
   - Яблоки у Пети: 2 - 1 = 1 яблоко.

5. **Петя отдал половину оставшихся яблок Маше:**
   - Половина яблок у Пети: 1 / 2 = 0.5 (но он не может отдать половину яблока, поэтому он отдает 0 яблок).
   - Яблоки у Пети остаются: 1 яблоко.
   - Яблоки у Маши: 6 + 0 = 6 яблок.

### Ответы:
1. **Сколько яблок сейчас у Маши?** 6 яблок.
2. **Сколько яблок сейчас у Пети?** 1 яблоко.

📊 Токены: 406



In [63]:
# GPT-4o - топовая модель
response_gpt4o = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 GPT-4o (топовая модель OpenAI):")
print(response_gpt4o.choices[0].message.content)
print(f"\n📊 Токены: {response_gpt4o.usage.total_tokens}")
print("="*80 + "\n")


🤖 GPT-4o (топовая модель OpenAI):
1. Сколько яблок сейчас у Маши?

- У Маши было 5 яблок.
- Она отдала 2 яблока Пете: 5 - 2 = 3 яблока.
- Купила еще 3 яблока: 3 + 3 = 6 яблок.
- Петя отдал половину оставшихся яблок обратно Маше. Сначала найдем, сколько яблок у Пети.

2. Сколько яблок сейчас у Пети?

- Петя получил 2 яблока от Маши.
- Съел 1 яблоко: 2 - 1 = 1 яблоко.
- Отдал половину оставшихся (1 яблоко) обратно Маше: 1 / 2 = 0.5, но так как яблоки целые, он отдал 1 яблоко.

Теперь вернемся к Маше:

- Маше вернулось 1 яблоко от Пети: 6 + 1 = 7 яблок.

Итак, окончательные ответы:

1. У Маши сейчас 7 яблок.
2. У Пети сейчас 0 яблок.

📊 Токены: 355



## 5.3 Подключаем OpenRouter

OpenRouter - это агрегатор, который дает доступ к моделям разных провайдеров через единый API, совместимый с OpenAI!

**Преимущества:**
- Единый API для десятков моделей (OpenAI, Anthropic, Google, Meta, и др.)
- Не нужно регистрироваться у каждого провайдера
- Единая система оплаты
- Легкое переключение между моделями

**Как подключить:**
1. Зарегистрируйтесь на https://openrouter.ai/
2. Получите API ключ
3. Добавьте в `.env`: `OPENROUTER_API_KEY=sk-or-...`


In [75]:
# Получаем API ключ OpenRouter
OPENROUTER_API_KEY = os.getenv("OPENROUTER_API_KEY")

# Создаем клиент для OpenRouter
# Обратите внимание: меняем только base_url и api_key!
openrouter_client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key=OPENROUTER_API_KEY
)

print("✅ OpenRouter клиент создан!")
print("🎯 Теперь у нас доступ к моделям: Anthropic, Google, Meta, и многим другим!")


✅ OpenRouter клиент создан!
🎯 Теперь у нас доступ к моделям: Anthropic, Google, Meta, и многим другим!


## 5.4 Модели через OpenRouter

Теперь протестируем модели других провайдеров. Код остается тот же - меняется только название модели!


In [76]:
# Anthropic Claude 3.5 Sonnet - конкурент GPT-4
response_claude = openrouter_client.chat.completions.create(
    model="openai/gpt-oss-20b",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 Anthropic Claude 3.5 Sonnet (топовая модель, конкурент GPT-4):")
print(response_claude.choices[0].message.content)
print(f"\n📊 Токены: {response_claude.usage.total_tokens}")
print("="*80 + "\n")


🤖 Anthropic Claude 3.5 Sonnet (топовая модель, конкурент GPT-4):
**Пошаговый расчёт**

| Шаг | Что происходит | У Маши | У Пети |
|-----|----------------|--------|--------|
| 1   | Изначально у Маши 5 яблок | 5 | 0 |
| 2   | Маша отдала 2 яблока Пете | 3 | 2 |
| 3   | Маша купила ещё 3 яблока | 6 | 2 |
| 4   | Петя съел 1 яблоко | 6 | 1 |
| 5   | Петя отдал половину оставшихся яблок (½ яблока) Маше | 6 + 0.5 = 6.5 | 1 – 0.5 = 0.5 |

**Ответы**

1. У Маши сейчас **6.5 яблок** (13 / 2).  
2. У Пети сейчас **0.5 яблока** (1 / 2).  
3. Пошаговое решение приведено в таблице выше.

📊 Токены: 1157



In [78]:
# Google Gemini Pro
response_gemini = openrouter_client.chat.completions.create(
    model="google/gemini-2.5-flash",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 Google Gemini Pro 1.5 (модель от Google):")
print(response_gemini.choices[0].message.content)
print(f"\n📊 Токены: {response_gemini.usage.total_tokens}")
print("="*80 + "\n")


🤖 Google Gemini Pro 1.5 (модель от Google):
**1. У Маши:** 6 яблок
**2. У Пети:** 1 яблоко

**3. Пошаговое решение:**

* **Маша:**
    * Было: 5 яблок
    * Отдала Пете: 5 - 2 = 3 яблока
    * Купила: 3 + 3 = 6 яблок
    * Получила от Пети: 6 + 1 = 7 яблок (Петя отдал 2/2 = 1 яблоко)
    * **Итого у Маши: 7 яблок**

* **Петя:**
    * Получил от Маши: 2 яблока
    * Съел: 2 - 1 = 1 яблоко
    * Отдал Маше: 1 / 2 = 0.5 яблока (невозможно отдать половину яблока, поэтому Петя отдал 1 яблоко, а у него осталось 0)
    * **Итого у Пети: 0 яблок**

**Пересчет с учетом целых яблок:**

* **Маша:**
    * Было: 5 яблок
    * Отдала Пете: 5 - 2 = 3 яблока
    * Купила: 3 + 3 = 6 яблок
    * Получила от Пети: 6 + 1 = 7 яблок (Петя отдал 1 яблоко)
    * **Итого у Маши: 7 яблок**

* **Петя:**
    * Получил от Маши: 2 яблока
    * Съел: 2 - 1 = 1 яблоко
    * Отдал Маше: 1 яблоко (если Петя отдал половину, то это 0.5, но так как яблоки целые, он отдал 1 яблоко)
    * **Итого у Пети: 0 яблок**

**Оконча

In [None]:
# Meta Llama 3.1 70B - сильная открытая модель
response_llama70b = openrouter_client.chat.completions.create(
    model="meta-llama/llama-3.1-70b-instruct",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 Meta Llama 3.1 70B Instruct (сильная открытая модель):")
print(response_llama70b.choices[0].message.content)
print(f"\n📊 Токены: {response_llama70b.usage.total_tokens}")
print("="*80 + "\n")


In [None]:
# Claude 3 Haiku - быстрая модель
response_haiku = openrouter_client.chat.completions.create(
    model="anthropic/claude-3-haiku",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 Claude 3 Haiku (быстрая и дешевая модель от Anthropic):")
print(response_haiku.choices[0].message.content)
print(f"\n📊 Токены: {response_haiku.usage.total_tokens}")
print("="*80 + "\n")


In [None]:
# Meta Llama 3.2 3B - слабая, но быстрая модель
response_llama3b = openrouter_client.chat.completions.create(
    model="meta-llama/llama-3.2-3b-instruct",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 Meta Llama 3.2 3B Instruct (маленькая, слабая модель):")
print(response_llama3b.choices[0].message.content)
print(f"\n📊 Токены: {response_llama3b.usage.total_tokens}")
print("="*80 + "\n")


In [None]:
# Mistral 7B - маленькая модель для простых задач
response_mistral = openrouter_client.chat.completions.create(
    model="mistralai/mistral-7b-instruct",
    messages=[{"role": "user", "content": test_prompt}],
    temperature=0
)

print("🤖 Mistral 7B Instruct (маленькая модель для простых задач):")
print(response_mistral.choices[0].message.content)
print(f"\n📊 Токены: {response_mistral.usage.total_tokens}")
print("\n💡 Обратите внимание: маленькие модели могут делать ошибки в логических задачах!")


## 5.5 Reasoning модель (o1-mini)

Модели серии o1 от OpenAI - это специальные модели с "цепочкой рассуждений" (chain of thought). Они "думают" перед ответом!

**Особенности o1:**
- Делают внутренние рассуждения перед ответом
- Лучше справляются со сложными логическими задачами
- Медленнее обычных моделей
- Дороже в использовании
- **Важно:** Не поддерживают system роль и параметр temperature!


In [None]:
# o1-mini - reasoning модель
# Обратите внимание: БЕЗ temperature и system роли!
response_o1 = client.chat.completions.create(
    model="o1-mini",
    messages=[{"role": "user", "content": test_prompt}]
    # temperature не используется для o1!
)

print("🧠 OpenAI o1-mini (reasoning модель с цепочкой рассуждений):")
print(response_o1.choices[0].message.content)
print(f"\n📊 Токены: {response_o1.usage.total_tokens}")
print("\n💡 Модель 'думает' перед ответом, поэтому может работать медленнее, но точнее!")


---

## ✅ Итоги Раздела 5:

### 📊 Сравнительная таблица моделей

| Модель | Провайдер | Размер | Скорость | Качество | Стоимость | Когда использовать |
|--------|-----------|--------|----------|----------|-----------|-------------------|
| **GPT-3.5-turbo** | OpenAI | Средний | Быстро | Средне | $ | Простые задачи, прототипы |
| **GPT-4o-mini** | OpenAI | Средний | Быстро | Хорошо | $$ | Оптимальный выбор для большинства задач |
| **GPT-4o** | OpenAI | Большой | Средне | Отлично | $$$$ | Сложные задачи, высокие требования |
| **Claude 3.5 Sonnet** | Anthropic | Большой | Средне | Отлично | $$$$ | Альтернатива GPT-4, хорош для анализа |
| **Gemini Pro 1.5** | Google | Большой | Средне | Хорошо | $$$ | Альтернатива, большой контекст |
| **Llama 3.1 70B** | Meta | Большой | Средне | Хорошо | $$$ | Открытая модель, хорош для чата |
| **Claude Haiku** | Anthropic | Средний | Очень быстро | Хорошо | $$ | Быстрые ответы, простые задачи |
| **Llama 3.2 3B** | Meta | Маленький | Очень быстро | Слабо | $ | Очень простые задачи, экономия |
| **Mistral 7B** | Mistral | Маленький | Очень быстро | Слабо | $ | Базовые задачи, эксперименты |
| **o1-mini** | OpenAI | Средний | Медленно | Отлично* | $$$$$ | Сложная логика, математика, код |

*o1 особенно хорош в логике и математике

### 🎯 Ключевые выводы:

1. **Легкость смены провайдера**: Меняем только `base_url` и `api_key` - всё остальное работает так же!

2. **Легкость смены модели**: Меняем только параметр `model` - код не меняется!

3. **Разница между моделями**:
   - Сильные модели (GPT-4o, Claude 3.5) - более точные, лучше понимают контекст
   - Слабые модели (Llama 3B, Mistral 7B) - быстрее и дешевле, но могут ошибаться
   - Reasoning модели (o1) - специализированы на логике и рассуждениях

4. **Когда что использовать**:
   - Прототип/эксперимент → GPT-4o-mini, Claude Haiku
   - Продакшн → GPT-4o-mini (баланс цена/качество)
   - Сложные задачи → GPT-4o, Claude 3.5 Sonnet
   - Логика/математика → o1-mini
   - Экономия бюджета → Llama 3.2, Mistral 7B (для простых задач)

**Следующий шаг:** Научимся работать с историей диалога!


---

# Раздел 6: Управление историей диалога

До этого момента каждый запрос был независимым. Но в реальных чат-ботах нужна память - модель должна помнить предыдущие сообщения!

**Важно понимать:** 
- LLM модели **не хранят историю сами**
- Мы должны **передавать всю историю** в каждом запросе
- История растет с каждым сообщением → больше токенов → дороже

Давайте научимся управлять историей диалога!


## 6.1 Простой диалог (2 сообщения)

Начнем с простого: зададим вопрос и задаем следующий, который зависит от первого:


In [79]:
# Первый запрос
messages = [
    {"role": "system", "content": "Ты дружелюбный помощник."},
    {"role": "user", "content": "Привет! Меня зовут Алексей."}
]

response1 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages,
    temperature=0.7
)

assistant_reply1 = response1.choices[0].message.content
print("👤 User: Привет! Меня зовут Алексей.")
print(f"🤖 Assistant: {assistant_reply1}")
print()


👤 User: Привет! Меня зовут Алексей.
🤖 Assistant: Привет, Алексей! Как я могу помочь тебе сегодня?



In [80]:
# Добавляем ответ ассистента в историю
messages.append({"role": "assistant", "content": assistant_reply1})

# Добавляем новый вопрос пользователя
messages.append({"role": "user", "content": "Как меня зовут?"})

# Второй запрос С ИСТОРИЕЙ
response2 = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages,
    temperature=0.7
)

assistant_reply2 = response2.choices[0].message.content
print("👤 User: Как меня зовут?")
print(f"🤖 Assistant: {assistant_reply2}")
print("\n✅ Модель помнит имя из предыдущего сообщения!")


👤 User: Как меня зовут?
🤖 Assistant: Тебя зовут Алексей! Чем могу помочь?

✅ Модель помнит имя из предыдущего сообщения!


### ❌ Что если НЕ передать историю?


In [81]:
# Запрос БЕЗ истории - только новый вопрос
response_no_history = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты дружелюбный помощник."},
        {"role": "user", "content": "Как меня зовут?"}  # Спрашиваем имя без контекста
    ],
    temperature=0.7
)

print("❌ Запрос БЕЗ истории:")
print("👤 User: Как меня зовут?")
print(f"🤖 Assistant: {response_no_history.choices[0].message.content}")
print("\n💡 Модель не знает имя, потому что мы не передали историю!")


❌ Запрос БЕЗ истории:
👤 User: Как меня зовут?
🤖 Assistant: Извините, я не знаю, как вас зовут. Могу помочь с чем-то другим?

💡 Модель не знает имя, потому что мы не передали историю!


## 6.2 Длинный диалог с несколькими сообщениями

Создадим более реалистичный диалог с несколькими обменами:


In [82]:
# Функция-помощник для удобства
def chat(user_message, messages_history, model="gpt-4o-mini", temperature=0.7):
    """
    Отправляет сообщение и обновляет историю
    """
    # Добавляем сообщение пользователя
    messages_history.append({"role": "user", "content": user_message})
    
    # Получаем ответ
    response = client.chat.completions.create(
        model=model,
        messages=messages_history,
        temperature=temperature
    )
    
    # Извлекаем ответ ассистента
    assistant_message = response.choices[0].message.content
    
    # Добавляем ответ ассистента в историю
    messages_history.append({"role": "assistant", "content": assistant_message})
    
    return assistant_message, response.usage.total_tokens

print("✅ Функция chat() создана!")


✅ Функция chat() создана!


In [None]:
# Инициализируем новый диалог
conversation = [
    {"role": "system", "content": "Ты помощник по планированию путешествий. Помогаешь выбирать места и составлять маршруты."}
]

print("🗨️  Длинный диалог с историей:\n" + "="*80)

# Сообщение 1
reply1, tokens1 = chat("Привет! Хочу поехать в отпуск в ноябре", conversation)
print(f"\n👤 User: Привет! Хочу поехать в отпуск в ноябре")
print(f"🤖 Assistant: {reply1}")
print(f"📊 Токенов: {tokens1}")


In [None]:
# Сообщение 2
reply2, tokens2 = chat("Люблю теплые страны и море", conversation)
print(f"\n👤 User: Люблю теплые страны и море")
print(f"🤖 Assistant: {reply2}")
print(f"📊 Токенов: {tokens2} (растет!)")


In [None]:
# Сообщение 3
reply3, tokens3 = chat("Бюджет около 100 тысяч рублей", conversation)
print(f"\n👤 User: Бюджет около 100 тысяч рублей")
print(f"🤖 Assistant: {reply3}")
print(f"📊 Токенов: {tokens3}")


In [None]:
# Сообщение 4
reply4, tokens4 = chat("Из первого варианта расскажи подробнее", conversation)
print(f"\n👤 User: Из первого варианта расскажи подробнее")
print(f"🤖 Assistant: {reply4}")
print(f"📊 Токенов: {tokens4}")


In [None]:
# Сообщение 5 - Проверка памяти
reply5, tokens5 = chat("Напомни, какой у меня бюджет и когда я хочу ехать?", conversation)
print(f"\n👤 User: Напомни, какой у меня бюджет и когда я хочу ехать?")
print(f"🤖 Assistant: {reply5}")
print(f"📊 Токенов: {tokens5}")
print("\n✅ Модель помнит ВСЮ историю разговора!")


## 6.3 Анализ роста истории

Посмотрим как растет история и количество токенов:


In [None]:
print("📊 Анализ истории диалога:\n")
print(f"Количество сообщений в истории: {len(conversation)}")
print(f"  - System: 1")
print(f"  - User: {len([m for m in conversation if m['role'] == 'user'])}")
print(f"  - Assistant: {len([m for m in conversation if m['role'] == 'assistant'])}")
print()

print("📈 Рост токенов с каждым запросом:")
print(f"  Запрос 1: {tokens1} токенов")
print(f"  Запрос 2: {tokens2} токенов (+{tokens2-tokens1})")
print(f"  Запрос 3: {tokens3} токенов (+{tokens3-tokens2})")
print(f"  Запрос 4: {tokens4} токенов (+{tokens4-tokens3})")
print(f"  Запрос 5: {tokens5} токенов (+{tokens5-tokens4})")
print()

print("⚠️ Важно: С каждым сообщением мы платим за ВСЮ историю!")
print("Токены = вся предыдущая история + новое сообщение + ответ")


## 6.4 Практические паттерны управления историей

В реальных приложениях нужно контролировать размер истории. Вот несколько стратегий:


In [None]:
### Стратегия 1: Ограничение количества сообщений

def limit_history_by_messages(messages, max_messages=10):
    """
    Оставляет только последние N пар сообщений (user + assistant)
    System сообщение всегда сохраняется
    """
    system_messages = [m for m in messages if m['role'] == 'system']
    other_messages = [m for m in messages if m['role'] != 'system']
    
    # Берем последние max_messages сообщений
    limited_messages = other_messages[-max_messages:]
    
    return system_messages + limited_messages

# Пример
long_history = [
    {"role": "system", "content": "Ты помощник."},
    {"role": "user", "content": "Сообщение 1"},
    {"role": "assistant", "content": "Ответ 1"},
    {"role": "user", "content": "Сообщение 2"},
    {"role": "assistant", "content": "Ответ 2"},
    {"role": "user", "content": "Сообщение 3"},
    {"role": "assistant", "content": "Ответ 3"},
    {"role": "user", "content": "Сообщение 4"},
    {"role": "assistant", "content": "Ответ 4"},
]

limited = limit_history_by_messages(long_history, max_messages=4)
print("📝 Стратегия 1: Ограничение по количеству")
print(f"Было сообщений: {len(long_history)}")
print(f"Осталось: {len(limited)} (system + последние 4)")
print()


In [None]:
### Стратегия 2: Суммаризация старой истории

"""
Когда история становится слишком длинной:
1. Берем старые сообщения
2. Просим модель создать краткое резюме
3. Заменяем старую историю на резюме
4. Сохраняем только недавние сообщения в полном виде

Пример (концептуально):
"""

def summarize_old_history(messages, keep_last=6):
    """
    Суммаризирует старую историю, оставляя последние сообщения нетронутыми
    """
    # Это упрощенный пример - в реальности нужно вызвать API для суммаризации
    if len(messages) <= keep_last + 1:  # +1 для system
        return messages
    
    system_msg = [m for m in messages if m['role'] == 'system']
    other_messages = [m for m in messages if m['role'] != 'system']
    
    # Старые сообщения для суммаризации
    old_messages = other_messages[:-keep_last]
    recent_messages = other_messages[-keep_last:]
    
    # В реальности здесь вызов API для создания summary
    summary = f"Краткое содержание предыдущих {len(old_messages)} сообщений: [здесь было бы резюме от модели]"
    
    # Создаем новую историю
    return system_msg + [{"role": "system", "content": summary}] + recent_messages

print("📝 Стратегия 2: Суммаризация старой истории")
print("Вместо хранения всей истории, суммаризируем старые сообщения")
print("Плюсы: экономим токены, сохраняем контекст")
print("Минусы: дополнительный запрос к API для суммаризации")
print()


In [None]:
### Стратегия 3: Скользящее окно (Sliding Window)

def sliding_window_history(messages, max_tokens=4000):
    """
    Убирает старые сообщения, если общий размер превышает лимит
    Примечание: для точного подсчета токенов нужна библиотека tiktoken
    Здесь используем приблизительную оценку: ~0.5 токена на символ для русского
    """
    system_msg = [m for m in messages if m['role'] == 'system']
    other_messages = [m for m in messages if m['role'] != 'system']
    
    # Считаем примерное количество токенов
    def estimate_tokens(messages):
        total_chars = sum(len(m['content']) for m in messages)
        return int(total_chars * 0.5)  # Грубая оценка
    
    # Убираем старые сообщения пока не войдем в лимит
    while estimate_tokens(system_msg + other_messages) > max_tokens and len(other_messages) > 2:
        other_messages.pop(0)  # Удаляем самое старое
    
    return system_msg + other_messages

print("📝 Стратегия 3: Скользящее окно")
print("Динамически удаляем старые сообщения на основе количества токенов")
print("Плюсы: гибкий контроль расходов")
print("Минусы: нужна библиотека для точного подсчета токенов (tiktoken)")
print()

print("💡 Рекомендации по выбору стратегии:")
print("  - Для коротких сессий: без ограничений")
print("  - Для чат-ботов: скользящее окно или ограничение по количеству")
print("  - Для длинных диалогов: суммаризация + скользящее окно")


---

## ✅ Итоги Раздела 6:

### Ключевые моменты работы с историей:

1. **Модель не хранит историю сама** - мы должны передавать её в каждом запросе

2. **Структура истории:**
   ```python
   messages = [
       {"role": "system", "content": "..."},      # Один раз в начале
       {"role": "user", "content": "..."},        # Вопрос пользователя
       {"role": "assistant", "content": "..."},   # Ответ модели
       {"role": "user", "content": "..."},        # Следующий вопрос
       {"role": "assistant", "content": "..."},   # Следующий ответ
       # ... и так далее
   ]
   ```

3. **Рост токенов:** С каждым сообщением количество токенов растет = растет стоимость

4. **Стратегии управления историей:**
   - Ограничение по количеству сообщений (самый простой)
   - Суммаризация старой истории (сохраняет контекст)
   - Скользящее окно по токенам (точный контроль расходов)

5. **Практический совет:** Используйте функцию-помощник для автоматического добавления сообщений в историю

**Следующий шаг:** Заключение и что изучать дальше!


---

# 🎉 Заключение

## Что мы изучили в этом notebook:

### ✅ Раздел 1: Первый запрос к OpenAI API
- Инициализация клиента OpenAI
- Отправка простейшего запроса
- Подробный разбор структуры ответа (id, model, choices, usage, finish_reason)
- Подсчет токенов и стоимости

### ✅ Раздел 2: Основные параметры запроса
- **temperature** - управление креативностью (0-2)
- **max_tokens** - ограничение длины ответа
- **top_p** - альтернативное управление разнообразием
- **n** - получение нескольких вариантов
- **presence_penalty / frequency_penalty** - штрафы за повторения

### ✅ Раздел 3: Структура диалога и роли
- **system** - задает контекст и правила поведения
- **user** - запросы пользователя
- **assistant** - ответы модели
- Как роли влияют на поведение модели

### ✅ Раздел 4: Простой чат без истории
- Генерация контента
- Анализ и классификация текста
- Извлечение информации
- Перевод
- Помощь с кодом

### ✅ Раздел 5: Сравнение моделей и провайдеров
- Модели OpenAI (GPT-3.5, GPT-4o-mini, GPT-4o)
- Подключение OpenRouter
- Модели других провайдеров (Anthropic, Google, Meta)
- Сильные vs слабые модели
- Reasoning модель (o1-mini)
- **Главное:** Смена модели/провайдера = всего 2 строки кода!

### ✅ Раздел 6: Управление историей диалога
- Как передавать историю между запросами
- Рост токенов с каждым сообщением
- Стратегии управления историей
- Функция-помощник для работы с диалогом


---

## 🎯 Ключевые выводы

### 1. OpenAI API - это просто!
Основной паттерн работы:
```python
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "Ты помощник"},
        {"role": "user", "content": "Привет!"}
    ],
    temperature=0.7
)
answer = response.choices[0].message.content
```

### 2. Гибкость смены моделей
Меняем провайдера:
```python
# OpenAI
client = OpenAI(api_key=OPENAI_API_KEY)

# OpenRouter (доступ к Anthropic, Google, Meta и др.)
client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key=OPENROUTER_API_KEY
)
```

Меняем модель:
```python
model="gpt-4o-mini"          # OpenAI
model="anthropic/claude-3.5-sonnet"  # Anthropic через OpenRouter
model="google/gemini-pro-1.5"        # Google через OpenRouter
```

### 3. System роль = супер-сила
Правильный system промпт может кардинально изменить качество и стиль ответов!

### 4. История = деньги
Каждое сообщение добавляет токены. Управляйте историей осознанно!

### 5. Выбор модели
- Простые задачи → GPT-4o-mini, Claude Haiku, Llama 3.2 3B
- Обычные задачи → GPT-4o-mini (оптимальный выбор)
- Сложные задачи → GPT-4o, Claude 3.5 Sonnet
- Логика и математика → o1-mini


---

## 🚀 Что изучать дальше?

### Следующие темы (в порядке приоритета):

#### 1. **Streaming (потоковая передача)**
Получение ответа частями в реальном времени (как в ChatGPT)
```python
stream = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Привет!"}],
    stream=True  # Включаем стриминг
)
for chunk in stream:
    print(chunk.choices[0].delta.content, end="")
```

#### 2. **Prompt Engineering**
- Структурирование промптов (XML, Markdown)
- Few-shot learning (примеры в промпте)
- Chain of Thought (цепочка рассуждений)
- Техники для улучшения качества ответов

#### 3. **Structured Output (JSON mode)**
Гарантированный JSON в ответе
```python
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Извлеки данные..."}],
    response_format={"type": "json_object"}
)
```

#### 4. **Function Calling (Tool Use)**
Модель может вызывать функции и инструменты
- Подключение к API
- Работа с базами данных
- Выполнение вычислений

#### 5. **Multimodal (мультимодальность)**
Работа с изображениями, аудио, видео
```python
messages=[{
    "role": "user",
    "content": [
        {"type": "text", "text": "Что на картинке?"},
        {"type": "image_url", "image_url": {"url": "https://..."}}
    ]
}]
```

#### 6. **RAG (Retrieval-Augmented Generation)**
- Векторные базы данных
- Embeddings
- Семантический поиск
- Подключение внешних знаний

#### 7. **Agents и Multi-Agent системы**
- Автономные агенты
- ReAct паттерн
- Взаимодействие нескольких агентов

#### 8. **Production Best Practices**
- Обработка ошибок и retry логика
- Rate limiting
- Кэширование
- Мониторинг и логирование
- Оптимизация стоимости


---

## 📚 Полезные ресурсы

### Официальная документация:
- **OpenAI API:** https://platform.openai.com/docs/
- **OpenAI Cookbook:** https://cookbook.openai.com/
- **Anthropic Claude:** https://docs.anthropic.com/
- **OpenRouter:** https://openrouter.ai/docs

### Prompt Engineering:
- **OpenAI Prompt Engineering Guide:** https://platform.openai.com/docs/guides/prompt-engineering
- **Anthropic Prompt Engineering:** https://docs.anthropic.com/en/docs/prompt-engineering
- **Prompt Engineering Guide:** https://www.promptingguide.ai/

### Инструменты:
- **OpenAI Playground:** https://platform.openai.com/playground
- **Anthropic Console:** https://console.anthropic.com/
- **OpenRouter Playground:** https://openrouter.ai/playground

### Библиотеки:
- **LangChain:** Фреймворк для работы с LLM - https://langchain.com/
- **LlamaIndex:** RAG и работа с данными - https://llamaindex.ai/
- **Instructor:** Structured outputs - https://github.com/jxnl/instructor
- **Tiktoken:** Подсчет токенов - https://github.com/openai/tiktoken


---

## 💡 Финальные рекомендации

### Для новичков:
1. ✅ Начните с **GPT-4o-mini** - он быстрый, дешевый и достаточно умный
2. ✅ Экспериментируйте с **system промптами** - это самый простой способ улучшить результаты
3. ✅ Используйте **temperature=0** для задач, где важна точность
4. ✅ Всегда проверяйте `finish_reason` - понимайте почему модель остановилась
5. ✅ Следите за токенами - они равны деньгам!

### Для практики:
1. 🔨 Создайте простого чат-бота с историей
2. 🔨 Попробуйте разные модели на одной и той же задаче
3. 🔨 Поэкспериментируйте с разными system промптами
4. 🔨 Реализуйте функцию управления историей
5. 🔨 Постройте классификатор текста или экстрактор данных

### Лучшие практики:
- 🎯 Начинайте с простых решений (не усложняйте раньше времени)
- 🎯 Тестируйте на реальных данных (синтетические примеры могут обманывать)
- 🎯 Логируйте все запросы (для дебага и улучшения промптов)
- 🎯 Обрабатывайте ошибки (API может быть недоступен)
- 🎯 Считайте стоимость (особенно при масштабировании)

---

## 🎓 Поздравляем!

Вы освоили основы работы с OpenAI API! Теперь вы можете:
- ✅ Отправлять запросы к разным моделям
- ✅ Управлять поведением через параметры
- ✅ Работать с ролями и историей диалога
- ✅ Легко переключаться между провайдерами
- ✅ Сравнивать модели и выбирать подходящую

**Продолжайте учиться, экспериментировать и создавать! 🚀**

---

### 📝 Обратная связь

Если у вас есть вопросы или предложения по улучшению этого notebook, не стесняйтесь обращаться!

**Успехов в изучении LLM и создании ИИ-приложений! 🎉**
