# Bab 7: Membina Aplikasi Sembang
## Pengenalan Pantas API Model Github

Notebook ini diadaptasi daripada [Repositori Sampel Azure OpenAI](https://github.com/Azure/azure-openai-samples?WT.mc_id=academic-105485-koreyst) yang merangkumi notebook yang mengakses perkhidmatan [Azure OpenAI](notebook-azure-openai.ipynb).


# Pengenalan  
"Model bahasa besar ialah fungsi yang memetakan teks kepada teks. Diberikan satu rentetan teks sebagai input, model bahasa besar akan cuba meramalkan teks yang akan datang seterusnya"(1). Notebook "pantas mula" ini akan memperkenalkan pengguna kepada konsep LLM secara umum, keperluan utama pakej untuk bermula dengan AML, pengenalan ringkas kepada reka bentuk prompt, dan beberapa contoh ringkas untuk pelbagai kegunaan.


## Kandungan  

[Tinjauan](../../../../07-building-chat-applications/python)  
[Cara menggunakan Perkhidmatan OpenAI](../../../../07-building-chat-applications/python)  
[1. Membina Perkhidmatan OpenAI anda](../../../../07-building-chat-applications/python)  
[2. Pemasangan](../../../../07-building-chat-applications/python)    
[3. Kredential](../../../../07-building-chat-applications/python)  

[Kes Penggunaan](../../../../07-building-chat-applications/python)    
[1. Merumuskan Teks](../../../../07-building-chat-applications/python)  
[2. Mengklasifikasikan Teks](../../../../07-building-chat-applications/python)  
[3. Menjana Nama Produk Baru](../../../../07-building-chat-applications/python)  
[4. Melaraskan Pengklasifikasi](../../../../07-building-chat-applications/python)  

[Rujukan](../../../../07-building-chat-applications/python)


### Bina prompt pertama anda  
Latihan ringkas ini akan memberikan pengenalan asas untuk menghantar prompt kepada model dalam Github Models bagi tugasan mudah "penyusunan ringkas".


**Langkah-langkah**:  
1. Pasang pustaka `azure-ai-inference` dalam persekitaran python anda, jika belum dipasang.  
2. Muatkan pustaka pembantu standard dan sediakan kelayakan untuk Github Models.  
3. Pilih model untuk tugasan anda  
4. Cipta prompt ringkas untuk model  
5. Hantar permintaan anda kepada API model!


### 1. Pasang `azure-ai-inference`


In [None]:
%pip install azure-ai-inference

### 2. Import perpustakaan pembantu dan wujudkan kelayakan


In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

### 3. Mencari model yang sesuai  
Model GPT-3.5-turbo atau GPT-4 boleh memahami dan menghasilkan bahasa semula jadi.


In [None]:
# Select the General Purpose curie model for text
model_name = "gpt-4o"

## 4. Reka Bentuk Prompt  

"Keajaiban model bahasa besar ialah dengan dilatih untuk meminimumkan ralat ramalan ini ke atas sejumlah besar teks, model-model ini akhirnya mempelajari konsep-konsep yang berguna untuk ramalan tersebut. Sebagai contoh, mereka mempelajari konsep seperti"(1):

* cara mengeja
* cara tatabahasa berfungsi
* cara memparafrasa
* cara menjawab soalan
* cara berkomunikasi
* cara menulis dalam pelbagai bahasa
* cara menulis kod
* dan sebagainya.

#### Cara mengawal model bahasa besar  
"Daripada semua input kepada model bahasa besar, yang paling berpengaruh ialah prompt teks(1).

Model bahasa besar boleh dipandu untuk menghasilkan output dengan beberapa cara:

Arahan: Beritahu model apa yang anda mahu
Pelengkap: Galakkan model untuk melengkapkan permulaan apa yang anda mahu
Demonstrasi: Tunjukkan kepada model apa yang anda mahu, sama ada dengan:
Beberapa contoh dalam prompt
Ratusan atau ribuan contoh dalam set data latihan penalaan halus"



#### Terdapat tiga garis panduan asas untuk mencipta prompt:

**Tunjuk dan beritahu**. Jelaskan apa yang anda mahu sama ada melalui arahan, contoh, atau gabungan kedua-duanya. Jika anda mahu model menyusun senarai item mengikut abjad atau mengklasifikasikan perenggan mengikut sentimen, tunjukkan bahawa itulah yang anda mahu.

**Sediakan data berkualiti**. Jika anda cuba membina pengelas atau mahu model mengikut corak tertentu, pastikan terdapat cukup contoh. Pastikan anda menyemak contoh-contoh anda — model biasanya cukup bijak untuk mengesan kesalahan ejaan asas dan tetap memberi respons, tetapi ia juga mungkin menganggap kesilapan itu disengajakan dan ini boleh mempengaruhi respons.

**Semak tetapan anda.** Tetapan temperature dan top_p mengawal sejauh mana model itu deterministik dalam menghasilkan respons. Jika anda mahukan respons yang hanya ada satu jawapan betul, anda patut tetapkan nilai ini lebih rendah. Jika anda mahukan respons yang lebih pelbagai, anda boleh tetapkan lebih tinggi. Kesilapan utama yang sering dilakukan orang dengan tetapan ini ialah menganggap ia sebagai kawalan "kepintaran" atau "kreativiti" model.


Sumber: https://learn.microsoft.com/azure/ai-services/openai/overview


In [None]:
# Create your first prompt
text_prompt = "Should oxford commas always be used?"

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":text_prompt},])

response.choices[0].message.content

In [None]:

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":text_prompt},])

response.choices[0].message.content

## Ringkaskan Teks  
#### Cabaran  
Ringkaskan teks dengan menambah 'tl;dr:' di hujung petikan teks. Perhatikan bagaimana model memahami cara melakukan pelbagai tugasan tanpa arahan tambahan. Anda boleh bereksperimen dengan arahan yang lebih terperinci daripada tl;dr untuk mengubah tingkah laku model dan menyesuaikan ringkasan yang anda terima(3).  

Kajian terkini menunjukkan peningkatan ketara dalam banyak tugasan dan penanda aras NLP dengan pra-latihan pada korpus teks yang besar diikuti dengan penalaan khusus untuk tugasan tertentu. Walaupun biasanya seni bina ini tidak bergantung pada tugasan, kaedah ini masih memerlukan set data penalaan khusus tugasan yang terdiri daripada ribuan atau puluhan ribu contoh. Sebaliknya, manusia biasanya boleh melakukan tugasan bahasa baru hanya dengan beberapa contoh atau arahan ringkas - sesuatu yang sistem NLP semasa masih sukar untuk lakukan. Di sini kami menunjukkan bahawa meningkatkan skala model bahasa sangat memperbaiki prestasi beberapa contoh yang tidak bergantung pada tugasan, kadang-kadang malah mampu bersaing dengan pendekatan penalaan khusus yang terbaik sebelum ini. 



Tl;dr


# Latihan untuk beberapa kes penggunaan  
1. Rumuskan Teks  
2. Klasifikasikan Teks  
3. Jana Nama Produk Baru


In [None]:
prompt = "Recent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fine-tuning datasets of thousands or tens of thousands of examples. By contrast, humans can generally perform a new language task from only a few examples or from simple instructions - something that current NLP systems still largely struggle to do. Here we show that scaling up language models greatly improves task-agnostic, few-shot performance, sometimes even reaching competitiveness with prior state-of-the-art fine-tuning approaches.\n\nTl;dr"


In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt},])

response.choices[0].message.content

## Klasifikasikan Teks  
#### Cabaran  
Klasifikasikan item ke dalam kategori yang diberikan semasa inferens. Dalam contoh berikut, kita sediakan kedua-dua kategori dan teks untuk diklasifikasikan dalam prompt (*playground_reference).

Pertanyaan Pelanggan: Hai, salah satu kekunci pada papan kekunci komputer riba saya telah rosak baru-baru ini dan saya perlukan pengganti:

Kategori yang diklasifikasikan:


In [None]:
prompt = "Classify the following inquiry into one of the following: categories: [Pricing, Hardware Support, Software Support]\n\ninquiry: Hello, one of the keys on my laptop keyboard broke recently and I'll need a replacement:\n\nClassified category:"
print(prompt)

In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt},])

response.choices[0].message.content

## Jana Nama Produk Baru
#### Cabaran
Cipta nama produk daripada contoh perkataan. Di sini, kami sertakan maklumat tentang produk yang akan dijana namanya dalam prompt. Kami juga berikan contoh serupa untuk menunjukkan corak yang kami inginkan. Nilai suhu juga ditetapkan tinggi untuk meningkatkan kepelbagaian dan menghasilkan jawapan yang lebih kreatif.

Deskripsi produk: Mesin pembuat milkshake di rumah
Perkataan asas: pantas, sihat, padat.
Nama produk: HomeShaker, Fit Shaker, QuickShake, Shake Maker

Deskripsi produk: Sepasang kasut yang boleh muat untuk semua saiz kaki.
Perkataan asas: boleh ubah, muat, omni-fit.


In [None]:
prompt = "Product description: A home milkshake maker\nSeed words: fast, healthy, compact.\nProduct names: HomeShaker, Fit Shaker, QuickShake, Shake Maker\n\nProduct description: A pair of shoes that can fit any foot size.\nSeed words: adaptable, fit, omni-fit."

print(prompt)

In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt}])

response.choices[0].message.content

# Rujukan  
- [Openai Cookbook](https://github.com/openai/openai-cookbook?WT.mc_id=academic-105485-koreyst)  
- [Contoh OpenAI Studio](https://oai.azure.com/portal?WT.mc_id=academic-105485-koreyst)  
- [Amalan terbaik untuk penalaan GPT-3 bagi mengklasifikasikan teks](https://docs.google.com/document/d/1rqj7dkuvl7Byd5KQPUJRxc19BJt8wo0yHNwK84KfU3Q/edit#?WT.mc_id=academic-105485-koreyst)


# Untuk Bantuan Lanjut  
[OpenAI Commercialization Team](AzureOpenAITeam@microsoft.com)


# Penyumbang
* [Chew-Yean Yam](https://www.linkedin.com/in/cyyam/)



---

**Penafian**:  
Dokumen ini telah diterjemahkan menggunakan perkhidmatan terjemahan AI [Co-op Translator](https://github.com/Azure/co-op-translator). Walaupun kami berusaha untuk memastikan ketepatan, sila maklum bahawa terjemahan automatik mungkin mengandungi kesilapan atau ketidaktepatan. Dokumen asal dalam bahasa asalnya harus dianggap sebagai sumber yang sah. Untuk maklumat penting, terjemahan manusia profesional adalah disyorkan. Kami tidak bertanggungjawab atas sebarang salah faham atau salah tafsir yang timbul daripada penggunaan terjemahan ini.
