# Добро пожаловать на вторую неделю!

## API Frontier Model

На первой неделе мы использовали несколько Frontier Lms через интерфейс чата и подключились к API Openais.

Сегодня мы подключимся к API для Anthropic и Google, а также к Open AIR.

<table style="margin: 0; text-align: left;">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../important.jpg" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#900;">Important Note - Please read me</h2>
            <span style="color:#900;">I'm continually improving these labs, adding more examples and exercises.
            At the start of each week, it's worth checking you have the latest code.<br/>
            First do a <a href="https://chatgpt.com/share/6734e705-3270-8012-a074-421661af6ba9">git pull and merge your changes as needed</a>. Any problems? Try asking ChatGPT to clarify how to merge - or contact me!<br/><br/>
            After you've pulled the code, from the llm_engineering directory, in an Anaconda prompt (PC) or Terminal (Mac), run:<br/>
            <code>conda env update --f environment.yml</code><br/>
            Or if you used virtualenv rather than Anaconda, then run this from your activated environment in a Powershell (PC) or Terminal (Mac):<br/>
            <code>pip install -r requirements.txt</code>
            <br/>Then restart the kernel (Kernel menu >> Restart Kernel and Clear Outputs Of All Cells) to pick up the changes.
            </span>
        </td>
    </tr>
</table>
<table style="margin: 0; text-align: left;">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../resources.jpg" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#f71;">Reminder about the resources page</h2>
            <span style="color:#f71;">Here's a link to resources for the course. This includes links to all the slides.<br/>
            <a href="https://edwarddonner.com/2024/11/13/llm-engineering-resources/">https://edwarddonner.com/2024/11/13/llm-engineering-resources/</a><br/>
            Please keep this bookmarked, and I'll continue to add more useful links there over time.
            </span>
        </td>
    </tr>
</table>

## Настройка ваших ключей

Если вы еще этого не сделали, теперь вы можете создать API-ключи для Anthopic и Google в дополнение к OpenAI.

**Пожалуйста, обратите внимание:** если вы предпочитаете избежать дополнительных затрат на API, можете не настраивать Anthopic и Google! Вы можете посмотреть, как я это делаю, и сосредоточиться на OpenAI во время прохождения курса. Вы также можете заменить Ollama на Anthropic и / или Google, выполнив упражнение, которое вы выполняли на первой неделе.

Для OpenAI перейдите по ссылке https://openai.com/api/  
Для Anthropic перейдите по ссылке https://console.anthropic.com/  
Для Google перейдите по ссылке https://ai.google.dev/gemini-api  

### Также - при желании добавьте DeepSeek

При желании, если вы хотите также использовать DeepSeek, создайте учетную запись [здесь](https://platform.deepseek.com/), создайте ключ [здесь](https://platform.deepseek.com/api_keys) и пополните счет на сумму не менее 2 долларов [здесь](https://platform.deepseek.com/top_up).

### Добавление ключей API в ваш env-файл

Когда вы получите ключи API, вам нужно будет установить их в качестве переменных среды, добавив в свой env-файл.

```
OPENAI_API_KEY=xxxx
АНТРОПНЫЙ_API_KEY=xxxx
GOOGLE_API_KEY=xxxx
DEEPSEEK_API_KEY=xxxx
```

После этого вам, возможно, потребуется перезапустить ядро Jupyter Lab (процесс Python, который находится за этим ноутбуком) через меню ядра, а затем повторно запустить ячейки сверху.

In [None]:
# imports

import os
from dotenv import load_dotenv
from openai import OpenAI
import anthropic
from IPython.display import Markdown, display, update_display

In [None]:
# импорт для Google
# в редких случаях это, по-видимому, приводит к ошибке в некоторых системах или даже к сбою ядра
# Если это произойдет с вами, просто игнорируйте эту ячейку - позже я расскажу об альтернативном подходе к использованию Gemini

import google.generativeai

In [None]:
# Загрузите переменные среды в файл с именем .env
# Выведите ключевые префиксы, которые помогут при любой отладке.

load_dotenv(override=True)
openai_api_key = os.getenv('OPENAI_API_KEY')
anthropic_api_key = os.getenv('ANTHROPIC_API_KEY')
google_api_key = os.getenv('GOOGLE_API_KEY')

if openai_api_key:
    print(f"OpenAI API Key exists and begins {openai_api_key[:8]}")
else:
    print("OpenAI API Key not set")
    
if anthropic_api_key:
    print(f"Anthropic API Key exists and begins {anthropic_api_key[:7]}")
else:
    print("Anthropic API Key not set")

if google_api_key:
    print(f"Google API Key exists and begins {google_api_key[:8]}")
else:
    print("Google API Key not set")

In [None]:
# Connect to OpenAI, Anthropic

openai = OpenAI()

claude = anthropic.Anthropic()

In [None]:
# Это код настройки для Gemini
# Возникли проблемы с настройкой Google Gemini? Тогда просто игнорируйте эту ячейку; когда мы будем использовать Gemini, я предложу вам альтернативу, которая полностью обходит эту библиотеку

google.generativeai.configure()

## Попросить юристов рассказать анекдот

Оказалось, что юристы не очень-то умеют рассказывать анекдоты! Давайте сравним несколько моделей.
Позже мы будем лучше использовать Lms!

### Какая информация включена в API

Обычно мы передаем ее в API:
- Название модели, которую следует использовать
- Системное сообщение, дающее общее представление о роли, которую играет LLM,
- Пользовательское сообщение, содержащее фактический запрос

Существуют и другие параметры, которые можно использовать, в том числе ** температура **, которая обычно находится в диапазоне от 0 до 1; выше для более случайного вывода; ниже для более целенаправленного и детерминированного.

In [None]:
system_message = "Вы - ассистент, который отлично умеет шутить"
user_prompt = "Расскажите веселую шутку для аудитории специалистов по обработке данных"

In [None]:
prompts = [
    {"role": "system", "content": system_message},
    {"role": "user", "content": user_prompt}
  ]

In [None]:
# GPT-4o-mini

completion = openai.chat.completions.create(model='gpt-4o-mini', messages=prompts)
print(completion.choices[0].message.content)

In [None]:
# GPT-4.1-mini
# Temperature setting controls creativity

completion = openai.chat.completions.create(
    model='gpt-4.1-mini',
    messages=prompts,
    temperature=0.7
)
print(completion.choices[0].message.content)

In [None]:
# GPT-4.1-nano - extremely fast and cheap

completion = openai.chat.completions.create(
    model='gpt-4.1-nano',
    messages=prompts
)
print(completion.choices[0].message.content)

In [None]:
# GPT-4.1

completion = openai.chat.completions.create(
    model='gpt-4.1',
    messages=prompts,
    temperature=0.4
)
print(completion.choices[0].message.content)

In [None]:
# Если у вас есть доступ к этому, вот модель аргументации o3-mini
# Она обучена продумывать свой ответ, прежде чем отвечать на него
# Поэтому это займет больше времени, но ответ должен быть более аргументированным - не то чтобы это помогло..

completion = openai.chat.completions.create(
    model='o3-mini',
    messages=prompts
)
print(completion.choices[0].message.content)

In [None]:
# Claude 3.7 Sonnet
# Для API требуется системное сообщение, предоставляемое отдельно от запроса пользователя
# Также добавляем max_tokens

message = claude.messages.create(
    model="claude-3-7-sonnet-latest",
    max_tokens=200,
    temperature=0.7,
    system=system_message,
    messages=[
        {"role": "user", "content": user_prompt},
    ],
)

print(message.content[0].text)

In [None]:
# Снова сонет Клода 3.7
# Теперь давайте добавим результаты обратной трансляции
# Если трансляция выглядит странно, то, пожалуйста, ознакомьтесь с примечанием под этой ячейкой!

result = claude.messages.stream(
    model="claude-3-7-sonnet-latest",
    max_tokens=200,
    temperature=0.7,
    system=system_message,
    messages=[
        {"role": "user", "content": user_prompt},
    ],
)

with result as stream:
    for text in stream.text_stream:
            print(text, end="", flush=True)

## Редкая проблема с потоковой передачей Claude в некоторых окнах Windows

2 студента заметили странную вещь, происходящую с потоковой передачей Claude в выходные данные Jupiter Lab - иногда кажется, что она поглощает часть ответа.

Чтобы исправить это, замените код:

`print(text, end="", flush=True)`

с помощью этого:

`clean_text = text.replace("\n", " ").replace("\r", " ")`  
`print(clean_text, end="", flush=True)`

И это должно сработать нормально!

In [None]:
# API для Gemini имеет несколько иную структуру.
# Я слышал, что на некоторых компьютерах этот код Gemini приводит к сбою ядра.
# Если это произойдет с вами, пожалуйста, пропустите эту ячейку и используйте вместо нее следующую - альтернативный подход.

gemini = google.generativeai.GenerativeModel(
    model_name='gemini-2.0-flash',
    system_instruction=system_message
)
response = gemini.generate_content(user_prompt)
print(response.text)

In [None]:
# В качестве альтернативного способа использования Gemini, который обходит библиотеку API python от Google,
# Google выпустила конечные точки, что означает, что вы можете использовать Gemini через клиентские библиотеки для OpenAI!
# Мы также пробуем новейшую модель рассуждений Gemini

gemini_via_openai_client = OpenAI(
    api_key=google_api_key, 
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = gemini_via_openai_client.chat.completions.create(
    model="gemini-2.5-flash-preview-04-17",
    messages=prompts
)
print(response.choices[0].message.content)

## (Необязательно) Опробуем модель Deepsee

### Давайте зададим DeepSeek действительно сложный вопрос - как о чате, так и о модели Reasoner

In [None]:
# Optionally if you wish to try DeekSeek, you can also use the OpenAI client library

deepseek_api_key = os.getenv('DEEPSEEK_API_KEY')

if deepseek_api_key:
    print(f"DeepSeek API Key exists and begins {deepseek_api_key[:3]}")
else:
    print("DeepSeek API Key not set - please skip to the next section if you don't wish to try the DeepSeek API")

In [None]:
# Using DeepSeek Chat

deepseek_via_openai_client = OpenAI(
    api_key=deepseek_api_key, 
    base_url="https://api.deepseek.com"
)

response = deepseek_via_openai_client.chat.completions.create(
    model="deepseek-chat",
    messages=prompts,
)

print(response.choices[0].message.content)

In [None]:
challenge = [{"role": "system", "content": "You are a helpful assistant"},
             {"role": "user", "content": "How many words are there in your answer to this prompt"}]

In [None]:
# Using DeepSeek Chat with a harder question! And streaming results

stream = deepseek_via_openai_client.chat.completions.create(
    model="deepseek-chat",
    messages=challenge,
    stream=True
)

reply = ""
display_handle = display(Markdown(""), display_id=True)
for chunk in stream:
    reply += chunk.choices[0].delta.content or ''
    reply = reply.replace("```","").replace("markdown","")
    update_display(Markdown(reply), display_id=display_handle.display_id)

print("Number of words:", len(reply.split(" ")))

In [None]:
# При использовании DeepSeek Reasoner может возникнуть ошибка, если DeepSeek занят
# На него слишком много подписчиков (по состоянию на 28 января 2025 года), но он должен скоро вернуться в сеть!
# Если это не сработает, вернитесь к этому через несколько дней..

response = deepseek_via_openai_client.chat.completions.create(
    model="deepseek-reasoner",
    messages=challenge
)

reasoning_content = response.choices[0].message.reasoning_content
content = response.choices[0].message.content

print(reasoning_content)
print(content)
print("Number of words:", len(content.split(" ")))

## Дополнительное упражнение, которое поможет вам освоиться с моделями

Это необязательно, но если у вас есть время, то будет здорово познакомиться с возможностями этих различных моделей из первых рук.

Вы можете вернуться и задать тот же вопрос через API, указанные выше, чтобы получить представление о плюсах и минусах моделей.

Позже в ходе курса мы рассмотрим тесты и сравним LLM по многим параметрам. Но ничто не сравнится с личным опытом!

Вот несколько вопросов, которые стоит попробовать.:
1. Вопрос выше: "Сколько слов содержится в вашем ответе на это приглашение?"
2. Творческий вопрос: "В трех предложениях опишите синий цвет тому, кто никогда не умел видеть".
3. Ученик (спасибо, Роман) прислал мне эту замечательную загадку, на которую, по-видимому, обычно могут ответить дети, но с которой взрослые сталкиваются с трудом: "На книжной полке рядом стоят два тома Пушкина: первый и второй. Толщина страниц каждого тома вместе взятых составляет 2 см, а толщина каждой обложки - 2 мм. Червь прогрыз (перпендикулярно страницам) пространство от первой страницы первого тома до последней страницы второго тома. Какое расстояние он прогрыз?".

Ответ может оказаться не таким, как вы ожидаете, и, хотя я неплохо разбираюсь в головоломках, мне стыдно признаться, что в этом случае я ошибся.

### На что обратить внимание при экспериментировании с моделями

1. Чем модели чата отличаются от моделей рассуждения (также известных как модели мышления)
2. Способность решать проблемы и проявлять творческий подход
3. Скорость генерации


## Возвращаемся к OpenAI с серьезным вопросом

In [None]:
# To be serious! GPT-4o-mini with the original question

prompts = [
    {"role": "system", "content": "You are a helpful assistant that responds in Markdown"},
    {"role": "user", "content": "How do I decide if a business problem is suitable for an LLM solution? Please respond in Markdown."}
  ]

In [None]:
# Have it stream back results in markdown

stream = openai.chat.completions.create(
    model='gpt-4o-mini',
    messages=prompts,
    temperature=0.7,
    stream=True
)

reply = ""
display_handle = display(Markdown(""), display_id=True)
for chunk in stream:
    reply += chunk.choices[0].delta.content or ''
    reply = reply.replace("```","").replace("markdown","")
    update_display(Markdown(reply), display_id=display_handle.display_id)

## And now for some fun - an adversarial conversation between Chatbots..

You're already familar with prompts being organized into lists like:

```
[
    {"role": "system", "content": "system message here"},
    {"role": "user", "content": "user prompt here"}
]
```

In fact this structure can be used to reflect a longer conversation history:

```
[
    {"role": "system", "content": "system message here"},
    {"role": "user", "content": "first user prompt here"},
    {"role": "assistant", "content": "the assistant's response"},
    {"role": "user", "content": "the new user prompt"},
]
```

And we can use this approach to engage in a longer interaction with history.

## А теперь немного веселья - состязательный диалог между чат-ботами..

Вы уже знакомы с тем, что приглашения сгруппированы в такие списки, как:

```
[
    {"роль": "система", "содержимое": "системное сообщение здесь"},
    {"роль": "пользователь", "содержимое": "приглашение пользователя здесь"}
]
```

На самом деле эта структура может быть использована для отражения более длительной истории разговоров:

```
[
    {"роль": "система", "содержимое": "системное сообщение здесь"},
    {"роль": "пользователь", "содержание": "первый запрос пользователя здесь"},
    {"роль": "ассистент", "содержание": "ответ ассистента"},
    {"роль": "пользователь", "содержимое": "приглашение нового пользователя"},
]
```

И мы можем использовать этот подход для более длительного взаимодействия с историей.

In [None]:
# Let's make a conversation between GPT-4o-mini and Claude-3-haiku
# We're using cheap versions of models so the costs will be minimal

gpt_model = "gpt-4o-mini"
claude_model = "claude-3-haiku-20240307"

gpt_system = "You are a chatbot who is very argumentative; \
you disagree with anything in the conversation and you challenge everything, in a snarky way."

claude_system = "You are a very polite, courteous chatbot. You try to agree with \
everything the other person says, or find common ground. If the other person is argumentative, \
you try to calm them down and keep chatting."

gpt_messages = ["Hi there"]
claude_messages = ["Hi"]

In [None]:
def call_gpt():
    messages = [{"role": "system", "content": gpt_system}]
    for gpt, claude in zip(gpt_messages, claude_messages):
        messages.append({"role": "assistant", "content": gpt})
        messages.append({"role": "user", "content": claude})
    completion = openai.chat.completions.create(
        model=gpt_model,
        messages=messages
    )
    return completion.choices[0].message.content

In [None]:
call_gpt()

In [None]:
def call_claude():
    messages = []
    for gpt, claude_message in zip(gpt_messages, claude_messages):
        messages.append({"role": "user", "content": gpt})
        messages.append({"role": "assistant", "content": claude_message})
    messages.append({"role": "user", "content": gpt_messages[-1]})
    message = claude.messages.create(
        model=claude_model,
        system=claude_system,
        messages=messages,
        max_tokens=500
    )
    return message.content[0].text

In [None]:
call_claude()

In [None]:
call_gpt()

In [None]:
gpt_messages = ["Hi there"]
claude_messages = ["Hi"]

print(f"GPT:\n{gpt_messages[0]}\n")
print(f"Claude:\n{claude_messages[0]}\n")

for i in range(5):
    gpt_next = call_gpt()
    print(f"GPT:\n{gpt_next}\n")
    gpt_messages.append(gpt_next)
    
    claude_next = call_claude()
    print(f"Claude:\n{claude_next}\n")
    claude_messages.append(claude_next)

<table style="margin: 0; text-align: left;">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../important.jpg" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#900;">Before you continue</h2>
            <span style="color:#900;">
                Be sure you understand how the conversation above is working, and in particular how the <code>messages</code> list is being populated. Add print statements as needed. Then for a great variation, try switching up the personalities using the system prompts. Perhaps one can be pessimistic, and one optimistic?<br/>
            </span>
        </td>
    </tr>
</table>

# More advanced exercises

Try creating a 3-way, perhaps bringing Gemini into the conversation! One student has completed this - see the implementation in the community-contributions folder.

Try doing this yourself before you look at the solutions. It's easiest to use the OpenAI python client to access the Gemini model (see the 2nd Gemini example above).

## Additional exercise

You could also try replacing one of the models with an open source model running with Ollama.

<table style="margin: 0; text-align: left;">
    <tr>
        <td style="width: 150px; height: 150px; vertical-align: middle;">
            <img src="../business.jpg" width="150" height="150" style="display: block;" />
        </td>
        <td>
            <h2 style="color:#181;">Business relevance</h2>
            <span style="color:#181;">This structure of a conversation, as a list of messages, is fundamental to the way we build conversational AI assistants and how they are able to keep the context during a conversation. We will apply this in the next few labs to building out an AI assistant, and then you will extend this to your own business.</span>
        </td>
    </tr>
</table>