# <center>⚡️🏁 Welcome! Как запустить эти ваши ноутбуки с курса? 🤔📔 </center>

<img src='https://github.com/a-milenkin/LLM_practical_course/blob/main/images/choice_api.jpeg?raw=1' align="right" width="400" height="400" >

## Оглавление ноутбука

 * [🚀 API от OpenAI.](#part1)
 * [🛠 API от OpenAI с __нашего сервера__.](#part2)
 * [🤐 Чат-модели и объект ChatOpenAI](#part3)
 * [🔧 Open Source LLM модели и API от HuggingFaceHub.](#part4)
 * [🔋 Локальный запуск LLM без интернета и API ключей.](#part5)
 * [🧸 Выводы и заключения.](#part6)

In [None]:
import os
import warnings
from getpass import getpass  # Для скрытого ввода API ключей

warnings.filterwarnings("ignore")

#### Для любого варианта использования сначала обязательно установить необходимые библиотеки!

In [None]:
# Установим нужные библиотеки
!pip install openai langchain huggingface_hub langchain-openai langchain-community transformers -q

# <center id="part1">  🤖 Как использовать API от `OpenAI` напрямую?!

<div class="alert alert-block alert-danger"> Если хотите использовать официальное <code>API</code> от <code>OpenAI</code> в РФ, то используйте <code>VPN</code> или запускайте код через <code>Google Colab</code>.

<div class="alert alert-info">
    
**🔑 Получение ключа для использования `OpenAI API`**

> При создании своего первого ключа, вы получите бесплатные 5$ для использования платформы.

0. Если вы из РФ, то используйте __VPN__ при заходе на сайт.
1. Если нет аккаунта от OpenAI, то для регистрации потребуется __зарубежная симкарта__ (можно приобрести в интернете, либо купить доступ к уже зарегистрированному аккаунту, ~100 руб.
2. Перейдите по [ссылке](https://platform.openai.com/account/api-keys) и авторизуйтесь на сайте `OpenAI`.
3. После успешной авторизации на сайте, нажмите на кнопку `+ Create new secret key` и введите любое название для ключа.
4. Скопируйте полученный ключ и поместите его в переменную среды `OPENAI_API_KEY`
5. Для оплаты новых нокенов из РФ, потребуется __иностранная карта__!

* ⚙️ Начнем с прямых вызовов к API от OpenAI.
* 🗂 [Документация](https://platform.openai.com/docs/api-reference/making-requests) по использованию API
* 👨‍🍳 Полезный [Cookbook](https://cookbook.openai.com/)

### Куда вводить ключи: <br>
**1 вариант** - В появившемся окне после выполнения ячейки с `getpass` - более безопасно, но придется вводить ключ при каждом перезапуске ноутбука.

<img src='https://github.com/a-milenkin/LLM_practical_course/blob/main/images/wind.png?raw=1' width="600" height="300" >

**2 вариант** - Если ноутбуком будете пользоваться только вы, и точно уверены, что ноутбук с ключом не будет доступен третьим лицам. Можно постоянно не вводить ключ.

<img src='https://github.com/a-milenkin/LLM_practical_course/blob/main/images/wind2.png?raw=1' width="600" height="300" >

In [None]:
# Ключ следует вводить в появившемся окне после запуска ячейки и нажать Enter
# Либо раскомментировать строку ниже и записать ключ в переменную (менее безопасно)

# openai_api_key = "Введите ваш OpenAI API-ключ"
openai_api_key = getpass(prompt="Введите ваш OpenAI API-ключ")
os.environ["OPENAI_API_KEY"] = openai_api_key

Введите ваш OpenAI API-ключ ········


Рассмотрим некоторые параметры функции `.chat.completions.create()`

О всех параметрах можно узнать на [странице](https://platform.openai.com/docs/api-reference/chat/create)

In [None]:
import openai
from openai import OpenAI

openai.api_key = openai_api_key

client = OpenAI(
    # defaults to os.environ.get("OPENAI_API_KEY")
    api_key=openai_api_key,
)

#print(client.models.list()) # Выведет все возможные модели от OpenAI, которые можно указать в параметре model

In [None]:
from openai import OpenAI

client = OpenAI(
    # defaults to os.environ.get("OPENAI_API_KEY")
    api_key=openai_api_key,
)
messages = [
    {
        "role": "user",  # Роль - ассистент или юзер
        "content": "1+1",  # Сам промпт для подачи в chatGPT
    }
]

chat_completion = client.chat.completions.create(
    max_tokens=100,
    model="gpt-3.5-turbo",  # модель для выбора
    messages=messages,  # сообщение
    temperature=0,  # степень креативности ответа
)

print(chat_completion.choices[0].message.content)

<div class="alert alert-info">

**😎 Два обязательных параметра**
    
- `messages` - список объектов сообщений, где каждый объект имеет два обязательных поля:
    - `content` - содержимое вашего сообщения
    - `role` - роль автора сообщений (`system`, `user` или `assistant`)
- `model` - модель, используемая для генерации сообщения (доступные модели на [странице](https://platform.openai.com/docs/models/model-endpoint-compatibility))

<div class="alert alert-info">

**🥸 Полезно использовать**
    
- `max_tokens` - максимальное количество токенов, генерируемых в сообщении
- `n` - сколько вариантов ответа должно быть сгенерировано для каждого входного сообщения (по умолчанию 1)
- `temperature` - влияет на степень случайности генерации (принимает значения от 0 до 2, по умолчанию 1). Высокое значение температуры делает вероятности всех слов в выводе более равномерными, что приводит к более случайному и разнообразному тексту. При низком значении температуры модель будет склонна генерировать более предсказуемый и детерминированный текст.
- `top_p` - тоже влияет на степень случайности генерации. Определяет, какой процент наиболее вероятных слов будет включен в генерацию. Например, если top-p равно 0.8, то модель будет использовать вероятности слов так, чтобы включить в генерацию слова, составляющие 80% верхней части распределения вероятностей.

> Рекомендуем изменять либо параметр `temperature`, либо `top_p`, но не оба одновременно

```python
{
  "id": "chatcmpl-8B6YmCk5OiK7Z6RkRrkx72mEQaPGF",
  "object": "chat.completion",
  "created": 1697657516,
  "model": "gpt-3.5-turbo-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "1+1 equals 2."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 10,
    "completion_tokens": 7,
    "total_tokens": 17
  }
}
```

<div class="alert alert-info">

**🧐 А что получается в выводе?**

- `id` - уникальный идентификатор запроса
- `object` - тип возвращаемого объекта
- `created` - время запроса в timestamp-формате
- `model` - полное название модели, которая использовалась для генерации ответа
- `choices` - список объектов ответа (только один, если не изменяли параметр `n`)
    - `index` - индекс ответа в списке вариантов
    - `message` - объект сообщения, сгенерированный моделью, содержит `role` и `content`
    - `finish_reason` - причина, по которой модель закончила генерировать ответ
        - `stop` - достигнута естественная точка остановки
        - `length` - достигнуто максимальное количество токенов, указанное в запросе
        - `content_filter` - сгенерированный текст содержит нежелательный материал, который нарушает правила
- `usage` - количество используемых токенов
    - `prompt_tokens` - для распознавания вопроса
    - `completition_tokens` - для генерации ответа
    - `total_tokens` - для всего запроса (вопрос + ответ)

<div class="alert alert-info">
    
✅ __Все!__ Этого уже достаточно, чтобы просто получать ответы от `ChatGPT` кодом. Если для ваших задач этого хватает, то можно использовать уже так. Для удобства, можно еще обернуть дополнительно в функцию.

# <center id="part2"> 🤖 `API` от `СhatGPT` с ключом курса (рекомендуется)

In [None]:
# Для работы в колабе и локально загрузите наш скрипт для использования ChatGPT с сервера курса!
!wget https://raw.githubusercontent.com/a-milenkin/LLM_practical_course/main/notebooks/utils.py

In [None]:
# Ключ следует вводить в появившемся окне после запуска ячейки
# Либо раскомментировать строку ниже и записать ключ в переменную (менее безопасно)

# course_api_key = 'Введите ваш API-ключ, который получили в боте'
course_api_key = getpass(prompt="Введите ваш API-ключ, который получили в боте")

Введите ваш API-ключ, который получили в боте ········


<div class="alert alert-info">

**🔑 Получение ключа для использования модели на нашем сервере через API**

1. Перейдите по [ссылке](https://t.me/llm_course_bot) в нашего телеграмм-бота.
2. Авторизуйтесь, указав в нем свой `Stepik id`, с которым занимаетесь на курсе.
3. Получите свой ключ и используйте наш API для прохождения курса.
4. Также в боте можно проверить действие вашего ключа, узнать сколько осталось доступных токенов и дату, когда ключ перестанет действовать.

> Если возникли трудности, ошибки, вопросы или бот не работает, то смело пишите в чат курса, мы вам поможем.

In [None]:
from utils import NDTOpenAI

client = NDTOpenAI(
    api_key=course_api_key,  # ключ для доступа к апи
)

In [None]:
prompt = "1+1"

messages = [
    {
        "role": "user",  # Роль - ассистент или юзер
        "content": prompt ,  # Сам промпт для подачи в ChatGPT
    }
]

response = client.chat.completions.create(
    model="gpt-3.5-turbo",  # модель для выбора
    messages=messages,  # сообщение
    temperature=0,  # степень креативности ответа
)

print(response.choices[0].message.content)

1+1 equals 2.


<div class="alert alert-info">

При выполнении функции при помощи `print(response)`, кроме сгенерированного ответа, на экран выводится дополнительная информация:
- `prompt_tokens` - сколько токенов ушло на распознование вашего `prompt`
- `completion_tokens` - сколько токенов ушло на генерацию ответа
- `available_tokens` - сколько у вас осталось доступных токенов (можно также проверить в боте)

# <center id="part3"> 🤐 Чат модели и объект `ChatOpenAI` от `LangChain`

<div class="alert alert-block alert-danger"> Если хотите использовать официальное <code>API</code> от <code>OpenAI</code> в РФ, то используйте <code>VPN</code> или запускайте код через <code>Google Colab</code>.

In [None]:
from langchain_openai import ChatOpenAI # <-- класс из LangChain
from langchain.prompts import PromptTemplate

template = """Вопрос: {question}
Ответ: Дай короткий ответ"""

prompt = PromptTemplate(template=template, input_variables=["question"])

openai_llm = ChatOpenAI(temperature=0.0, openai_api_key=openai_api_key)

llm_chain = prompt | openai_llm

question = "Когда человек первый раз полетел в космос?"

print(llm_chain.invoke(question).content)

Первый полет человека в космос состоялся 12 апреля 1961 года, когда советский космонавт Юрий Гагарин совершил однократный облет Земли на корабле "Восток-1".


# <center> 🤘 Чат модели и наша версия `ChatOpenAI` (рекомендуется)

In [None]:
from utils import ChatOpenAI  # <-- наш класс!
from langchain.prompts import PromptTemplate

template = """Вопрос: {question}
Ответ: Дай короткий ответ
"""

prompt = PromptTemplate(template=template, input_variables=["question"])

openai_llm = ChatOpenAI(temperature=0.0, course_api_key=course_api_key)

llm_chain = prompt | openai_llm

question = "Когда человек первый раз полетел в космос?"

print(llm_chain.invoke(question).content)

12 апреля 1961 года


# <center id="part4"> 🤗 Исследуем мир Open Source: `API` от `HuggingFaceHub`

<div class="alert alert-info">
    
**Получение ключа для использования `HuggingFaceHub` `API`**

1. Авторизуйтесь или зарегистрируйтесь на сайте [HuggingFace](https://huggingface.co/).
2. Перейдите по [ссылке](https://huggingface.co/settings/tokens) и нажмите на кнопку `New token`.
3. Введите любое название и нажмите на кнопку `Generate a token`.
4. Скопируйте полученный ключ и поместите его в переменную среды `HUGGINGFACEHUB_API_TOKEN`


In [None]:
# Ключ следует вводить в появившемся окне после запуска ячейки
# Либо раскомментировать строку ниже и записать ключ в переменную (менее безопасно)

# os.environ['HUGGINGFACEHUB_API_TOKEN'] = 'Введите ваш HuggingFaceHub API-ключ'
os.environ["HUGGINGFACEHUB_API_TOKEN"] = getpass(prompt="Введите ваш HuggingFaceHub API-ключ")

Введите ваш HuggingFaceHub API-ключ ········


In [None]:
from langchain_community.llms import HuggingFaceEndpoint
from langchain.prompts import PromptTemplate

# initialize HF LLM
hf_llm = HuggingFaceEndpoint(
    repo_id="microsoft/Phi-3-mini-4k-instruct", # вводим название модели с HuggingFace
)

# build prompt template for simple question-answering
template = """Question: {question}.

Answer:"""

prompt = PromptTemplate(template=template, input_variables=["question"])

llm_chain = prompt | hf_llm

question = "When did man first fly into space?"

print(llm_chain.invoke(question))

 The first manned space flight was on April 12, 1961. The


<div class="alert alert-info">
    
✅ __Все!__ теперь мы можете даже не спускать свои деньги не токены! Вот вам весь зоопарк моделей на [HuggingFace.com](https://huggingface.co/models?pipeline_tag=text-generation&sort=trending). Выбирайте любую хайповую модельку и кайфуйте! Нужен только токен.<br>
**!!!** В бесплатном HF API контекстное окно для запроса к модели ограничено 250 токенами.

# <center id="part5"> 💻 Ваш собственный ChatGPT: запуск LLM локально

> Для локального использования моделей `HuggingFace` (на вашем локальном компьютере или сервере), необходима библиотека `transformers`, а также должны быть скачаны веса модели (скачиваются при первом запуске, далее загружаются с локального хранилища).

In [None]:
from langchain.llms import HuggingFacePipeline
from langchain.prompts import PromptTemplate

bloom = HuggingFacePipeline.from_model_id(
    model_id="bigscience/bloom-1b7",  # Название и версия модели, позже покажем вам весь LLM-зоопарк
    task="text-generation",  # Вид задачи, в нашем случае - генерация текста
    model_kwargs={
        "temperature": 0,
        "max_length": 64,
    },  # все те же креативность и максимальная длина
    device=0,  # Номер GPU карточки, если есть!
)

tokenizer_config.json:   0%|          | 0.00/222 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/14.5M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/85.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/715 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/3.44G [00:00<?, ?B/s]

In [None]:
template = """Question: {question}.

Answer:"""

prompt = PromptTemplate(template=template, input_variables=["question"])

llm_chain = prompt | bloom

question = "When did man first fly into space?"

print(llm_chain.invoke(question))

Question: When did man first fly into space?.

Answer: The first man to fly into space was the American astronaut
John Glenn, who was born in New York City on January 1, 1903. He was
the son of a carpenter and a housewife. He was a very intelligent boy,
and


<div class="alert alert-info">

✅ __Все!__ Теперь вам даже интерент не нужен. Грузите себе локально и пользуйтесь! Однако, следите за качеством выбираемой модели. Как убедились выше, не у всех моделей качество генерации высокое - маленькая модель `bloom` на 1 миллиард параметров, не знает про Гагарина!

# <center id="part6"> 🧸 Выводы и заключения ✅
    
* ✅ Вы умеете предеавать запросы к LLM через API
* ✅ Вы знаете откуда стягивать модели
* 🔑 Даже если у вас нет VPN, иностранного номера и счета, то у вас есть ключ от команды курса!
* ✅ Под каждую задачу есть своя оптимальная модель подходящего качества и размера, не одним ChatGPT едины!