# Поглавље 7: Израда чет апликација
## Брзи почетак са Github Models API

Овај бележник је прилагођен из [Azure OpenAI репозиторијума са примерима](https://github.com/Azure/azure-openai-samples?WT.mc_id=academic-105485-koreyst) који садржи бележнике за приступ [Azure OpenAI](notebook-azure-openai.ipynb) сервисима.


# Преглед  
„Велики језички модели су функције које пресликавају текст у текст. Када добију улазни низ текста, велики језички модел покушава да предвиди који ће текст следећи доћи“(1). Овај „брзи водич“ ће корисницима представити основне концепте великих језичких модела, кључне захтеве пакета за почетак рада са AML-ом, лагани увод у дизајн упита, као и неколико кратких примера различитих начина употребе.


## Садржај  

[Преглед](../../../../07-building-chat-applications/python)  
[Како користити OpenAI сервис](../../../../07-building-chat-applications/python)  
[1. Креирање вашег OpenAI сервиса](../../../../07-building-chat-applications/python)  
[2. Инсталација](../../../../07-building-chat-applications/python)    
[3. Акредитиви](../../../../07-building-chat-applications/python)  

[Примери употребе](../../../../07-building-chat-applications/python)    
[1. Сажимање текста](../../../../07-building-chat-applications/python)  
[2. Класификација текста](../../../../07-building-chat-applications/python)  
[3. Генерисање нових имена производа](../../../../07-building-chat-applications/python)  
[4. Фино подешавање класификатора](../../../../07-building-chat-applications/python)  

[Референце](../../../../07-building-chat-applications/python)


### Направите свој први промпт  
Ова кратка вежба ће вам дати основни увод у слање промптова моделу у Github Models за једноставан задатак „сажимање“.


**Кораци**:  
1. Инсталирајте библиотеку `azure-ai-inference` у своје Python окружење, ако то већ нисте урадили.  
2. Учитајте стандардне помоћне библиотеке и подесите Github Models акредитиве.  
3. Одаберите модел за свој задатак  
4. Направите једноставан промпт за модел  
5. Пошаљите свој захтев ка модел API-ју!


### 1. Инсталирајте `azure-ai-inference`


In [None]:
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

### 3. Проналажење одговарајућег модела  
GPT-3.5-turbo или GPT-4 модели могу да разумеју и генеришу природни језик.


In [None]:
# Select the General Purpose curie model for text
model_name = "gpt-4o"

## 4. Дизајн промпта  

„Магија великих језичких модела је у томе што, тренирајући се да минимизују грешку у предвиђању на огромним количинама текста, модели на крају науче појмове који су корисни за ова предвиђања. На пример, они науче појмове као што су“(1):

* како се пише
* како функционише граматика
* како се парафразира
* како се одговара на питања
* како се води разговор
* како се пише на више језика
* како се програмира
* итд.

#### Како контролисати велики језички модел  
„Од свих улаза у велики језички модел, далеко највећи утицај има текстуални промпт(1).

Велики језички модели могу се подстаћи да генеришу излаз на неколико начина:

Инструкција: Реците моделу шта желите
Довршавање: Наведите модел да доврши почетак онога што желите
Демонстрација: Покажите моделу шта желите, било са:
Неколико примера у самом промпту
Много стотина или хиљада примера у датасету за фино подешавање“



#### Постоје три основна правила за креирање промптова:

**Покажите и реците.** Јасно ставите до знања шта желите, било инструкцијама, примерима или комбинацијом оба. Ако желите да модел поређа листу ставки по абецедном реду или да класификује пасус по сентименту, покажите му да је то оно што желите.

**Обезбедите квалитетне податке.** Ако покушавате да направите класификатор или да модел прати неки образац, уверите се да има довољно примера. Обавезно проверите своје примере — модел је обично довољно паметан да препозна основне правописне грешке и да вам ипак да одговор, али може и да претпостави да је то намерно и то може утицати на одговор.

**Проверите подешавања.** Подешавања temperature и top_p одређују колико ће модел бити детерминистички у генерисању одговора. Ако тражите одговор где постоји само један тачан одговор, онда би требало да их подесите ниже. Ако желите разноврсније одговоре, можда ћете желети да их подесите више. Најчешћа грешка коју људи праве са овим подешавањима је што мисле да су то контроле „паметности“ или „креативности“.


Извор: https://learn.microsoft.com/azure/ai-services/openai/overview


In [None]:
# Create your first prompt
text_prompt = "Should oxford commas always be used?"

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":text_prompt},])

response.choices[0].message.content

In [None]:

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":text_prompt},])

response.choices[0].message.content

## Сажми текст  
#### Изазов  
Сажми текст тако што ћеш додати 'tl;dr:' на крај пасуса. Обрати пажњу како модел разуме како да обави више задатака без додатних упутстава. Можеш да експериментишеш са описнијим упутствима од tl;dr да би променио понашање модела и прилагодио сажетак који добијаш(3).  

Недавна истраживања су показала значајан напредак у многим NLP задацима и бенчмарковима кроз претходно тренирање на великом корпусу текста, а затим фино подешавање за одређени задатак. Иако је овај приступ обично независан од конкретног задатка по архитектури, и даље захтева скупове података за фино подешавање са хиљадама или десетинама хиљада примера. Насупрот томе, људи углавном могу да обаве нови језички задатак са само неколико примера или једноставних упутстава – што је нешто са чим се савремени NLP системи и даље углавном муче. Овде показујемо да повећање обима језичких модела значајно побољшава перформансе у задацима са мало примера, често достижући ниво конкурентности са претходним најбољим приступима фино подешавања.  

Tl;dr


# Вежбе за различите случајеве употребе  
1. Сажми текст  
2. Класификуј текст  
3. Генериши нова имена производа


In [None]:
prompt = "Recent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fine-tuning datasets of thousands or tens of thousands of examples. By contrast, humans can generally perform a new language task from only a few examples or from simple instructions - something that current NLP systems still largely struggle to do. Here we show that scaling up language models greatly improves task-agnostic, few-shot performance, sometimes even reaching competitiveness with prior state-of-the-art fine-tuning approaches.\n\nTl;dr"


In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt},])

response.choices[0].message.content

## Класификуј текст  
#### Изазов  
Класификуј ставке у категорије које се задају у тренутку извршавања. У следећем примеру, у упиту дајемо и категорије и текст који треба класификовати (*playground_reference).

Кориснички упит: Здраво, један тастер на тастатури мог лаптопа се недавно поломио и треба ми замена:

Класификована категорија:


In [None]:
prompt = "Classify the following inquiry into one of the following: categories: [Pricing, Hardware Support, Software Support]\n\ninquiry: Hello, one of the keys on my laptop keyboard broke recently and I'll need a replacement:\n\nClassified category:"
print(prompt)

In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt},])

response.choices[0].message.content

## Генериши нова имена производа
#### Изазов
Смишљај имена производа на основу пример речи. Овде у упутству дајемо информације о производу за који треба да се генеришу имена. Такође дајемо сличан пример да покажемо какав шаблон желимо да добијемо. Поставили смо вредност temperature високо да бисмо добили више случајних и иновативних одговора.

Опис производа: Аппарат за прављење милкшејка код куће
Кључне речи: брзо, здраво, компактно.
Имена производа: HomeShaker, Fit Shaker, QuickShake, Shake Maker

Опис производа: Пар ципела које могу да се прилагоде свакој величини стопала.
Кључне речи: прилагодљиво, пристаје, omni-fit.


In [None]:
prompt = "Product description: A home milkshake maker\nSeed words: fast, healthy, compact.\nProduct names: HomeShaker, Fit Shaker, QuickShake, Shake Maker\n\nProduct description: A pair of shoes that can fit any foot size.\nSeed words: adaptable, fit, omni-fit."

print(prompt)

In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt}])

response.choices[0].message.content

# Референце  
- [Openai Cookbook](https://github.com/openai/openai-cookbook?WT.mc_id=academic-105485-koreyst)  
- [OpenAI Studio Примери](https://oai.azure.com/portal?WT.mc_id=academic-105485-koreyst)  
- [Најбоље праксе за фино подешавање GPT-3 за класификацију текста](https://docs.google.com/document/d/1rqj7dkuvl7Byd5KQPUJRxc19BJt8wo0yHNwK84KfU3Q/edit#?WT.mc_id=academic-105485-koreyst)


# За додатну помоћ  
[OpenAI Комерцијални тим](AzureOpenAITeam@microsoft.com)


# Сарадници
* [Chew-Yean Yam](https://www.linkedin.com/in/cyyam/)



---

**Одрицање од одговорности**:  
Овај документ је преведен коришћењем AI услуге за превођење [Co-op Translator](https://github.com/Azure/co-op-translator). Иако настојимо да обезбедимо тачност, имајте у виду да аутоматски преводи могу садржати грешке или нетачности. Оригинални документ на изворном језику треба сматрати меродавним извором. За критичне информације препоручује се професионални људски превод. Не сносимо одговорност за било каква неспоразума или погрешна тумачења настала коришћењем овог превода.
