# บทที่ 7: การสร้างแอปพลิเคชันแชท
## เริ่มต้นใช้งาน Github Models API

สมุดบันทึกนี้ดัดแปลงมาจาก [Azure OpenAI Samples Repository](https://github.com/Azure/azure-openai-samples?WT.mc_id=academic-105485-koreyst) ซึ่งมีสมุดบันทึกที่เข้าถึงบริการ [Azure OpenAI](notebook-azure-openai.ipynb)


# ภาพรวม  
"โมเดลภาษาใหญ่คือฟังก์ชันที่แปลงข้อความหนึ่งไปเป็นข้อความอีกข้อความหนึ่ง เมื่อได้รับข้อความอินพุต โมเดลภาษาใหญ่จะพยายามทำนายข้อความถัดไปที่จะตามมา" (1) โน้ตบุ๊ก "เริ่มต้นอย่างรวดเร็ว" นี้จะพาผู้ใช้ไปรู้จักกับแนวคิดหลักของ LLM ข้อกำหนดแพ็กเกจหลักสำหรับการเริ่มต้นใช้งาน AML แนะนำเบื้องต้นเกี่ยวกับการออกแบบพรอมต์ และตัวอย่างสั้น ๆ ของการใช้งานในรูปแบบต่าง ๆ


## สารบัญ  

[ภาพรวม](../../../../07-building-chat-applications/python)  
[วิธีใช้ OpenAI Service](../../../../07-building-chat-applications/python)  
[1. การสร้าง OpenAI Service ของคุณ](../../../../07-building-chat-applications/python)  
[2. การติดตั้ง](../../../../07-building-chat-applications/python)    
[3. ข้อมูลรับรอง](../../../../07-building-chat-applications/python)  

[กรณีการใช้งาน](../../../../07-building-chat-applications/python)    
[1. สรุปข้อความ](../../../../07-building-chat-applications/python)  
[2. จัดประเภทข้อความ](../../../../07-building-chat-applications/python)  
[3. สร้างชื่อสินค้าขึ้นมาใหม่](../../../../07-building-chat-applications/python)  
[4. ปรับแต่งตัวจัดประเภท](../../../../07-building-chat-applications/python)  

[แหล่งอ้างอิง](../../../../07-building-chat-applications/python)


### สร้างพรอมต์แรกของคุณ  
แบบฝึกหัดสั้น ๆ นี้จะเป็นการแนะนำเบื้องต้นเกี่ยวกับการส่งพรอมต์ไปยังโมเดลใน Github Models สำหรับงานง่าย ๆ อย่าง "สรุปเนื้อหา"

**ขั้นตอน**:  
1. ติดตั้งไลบรารี `azure-ai-inference` ในสภาพแวดล้อม python ของคุณ หากยังไม่ได้ติดตั้ง  
2. โหลดไลบรารีช่วยเหลือมาตรฐานและตั้งค่าข้อมูลรับรองสำหรับ Github Models  
3. เลือกโมเดลที่เหมาะกับงานของคุณ  
4. สร้างพรอมต์ง่าย ๆ สำหรับโมเดล  
5. ส่งคำขอของคุณไปยัง API ของโมเดล!


### 1. ติดตั้ง `azure-ai-inference`


In [None]:
%pip install azure-ai-inference

In [None]:
import os
from azure.ai.inference import ChatCompletionsClient
from azure.ai.inference.models import SystemMessage, UserMessage
from azure.core.credentials import AzureKeyCredential

token = os.environ["GITHUB_TOKEN"]
endpoint = "https://models.inference.ai.azure.com"

client = ChatCompletionsClient(
    endpoint=endpoint,
    credential=AzureKeyCredential(token),
)

### 3. การเลือกโมเดลที่เหมาะสม  
โมเดล GPT-3.5-turbo หรือ GPT-4 สามารถเข้าใจและสร้างข้อความภาษาธรรมชาติได้


In [None]:
# Select the General Purpose curie model for text
model_name = "gpt-4o"

## 4. การออกแบบพรอมต์  

"ความมหัศจรรย์ของโมเดลภาษาขนาดใหญ่คือ เมื่อถูกฝึกให้ลดข้อผิดพลาดในการทำนายจากข้อความจำนวนมหาศาล โมเดลจะได้เรียนรู้แนวคิดที่เป็นประโยชน์ต่อการทำนายเหล่านี้ ตัวอย่างเช่น โมเดลจะได้เรียนรู้แนวคิดอย่างเช่น"(1):

* การสะกดคำ
* หลักไวยากรณ์
* การเขียนใหม่ให้ความหมายเดิม (paraphrase)
* การตอบคำถาม
* การสนทนา
* การเขียนได้หลายภาษา
* การเขียนโค้ด
* ฯลฯ

#### วิธีควบคุมโมเดลภาษาขนาดใหญ่  
"ในบรรดาข้อมูลนำเข้าทั้งหมดของโมเดลภาษาขนาดใหญ่ ข้อความพรอมต์มีอิทธิพลมากที่สุด"(1)

โมเดลภาษาขนาดใหญ่สามารถถูกกระตุ้นให้สร้างผลลัพธ์ได้หลายวิธี เช่น:

Instruction: บอกโมเดลว่าคุณต้องการอะไร
Completion: กระตุ้นให้โมเดลเติมเต็มสิ่งที่คุณต้องการจากจุดเริ่มต้น
Demonstration: แสดงให้โมเดลเห็นว่าคุณต้องการอะไร โดยใช้:
ตัวอย่างไม่กี่ตัวในพรอมต์
ตัวอย่างจำนวนมากในชุดข้อมูลฝึกแบบ fine-tuning



#### มีกฎพื้นฐาน 3 ข้อในการสร้างพรอมต์:

**แสดงและบอก**. ทำให้ชัดเจนว่าคุณต้องการอะไร ไม่ว่าจะผ่านคำสั่ง ตัวอย่าง หรือทั้งสองอย่างผสมกัน ถ้าคุณต้องการให้โมเดลจัดอันดับรายการตามลำดับตัวอักษร หรือจัดหมวดหมู่ย่อหน้าตามอารมณ์ ให้แสดงให้เห็นว่านี่คือสิ่งที่คุณต้องการ

**ให้ข้อมูลที่มีคุณภาพ**. ถ้าคุณพยายามสร้างตัวจำแนกประเภท หรืออยากให้โมเดลทำตามรูปแบบที่ต้องการ ต้องแน่ใจว่ามีตัวอย่างเพียงพอ อย่าลืมตรวจทานตัวอย่างของคุณด้วย — โมเดลมักจะฉลาดพอที่จะมองข้ามข้อผิดพลาดการสะกดคำพื้นฐานและตอบกลับได้ แต่บางครั้งอาจคิดว่านั่นเป็นความตั้งใจ และอาจส่งผลต่อคำตอบได้

**ตรวจสอบการตั้งค่า**. การตั้งค่า temperature และ top_p จะควบคุมว่าโมเดลจะตอบแบบแน่นอนแค่ไหน ถ้าคุณต้องการคำตอบที่มีเพียงคำตอบเดียวที่ถูกต้อง ควรตั้งค่าสองค่านี้ให้ต่ำ แต่ถ้าคุณต้องการคำตอบที่หลากหลายมากขึ้น อาจตั้งค่าสูงขึ้น ข้อผิดพลาดที่พบบ่อยที่สุดคือเข้าใจผิดว่าการตั้งค่านี้เป็นตัวควบคุม "ความฉลาด" หรือ "ความคิดสร้างสรรค์"


ที่มา: https://learn.microsoft.com/azure/ai-services/openai/overview


In [None]:
# Create your first prompt
text_prompt = "Should oxford commas always be used?"

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":text_prompt},])

response.choices[0].message.content

In [None]:

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":text_prompt},])

response.choices[0].message.content

## สรุปข้อความ  
#### ความท้าทาย  
สรุปข้อความโดยการเพิ่ม 'tl;dr:' ต่อท้ายข้อความ ลองสังเกตว่าระบบสามารถทำงานได้หลากหลายโดยไม่ต้องมีคำสั่งเพิ่มเติม คุณสามารถทดลองใช้ prompt ที่อธิบายละเอียดกว่าคำว่า tl;dr เพื่อปรับเปลี่ยนพฤติกรรมของโมเดลและปรับแต่งการสรุปที่คุณต้องการได้(3)  

งานวิจัยล่าสุดแสดงให้เห็นว่าการฝึกโมเดลด้วยข้อความจำนวนมากก่อน แล้วจึงปรับแต่งกับงานเฉพาะ ช่วยให้ได้ผลลัพธ์ที่ดีขึ้นในหลายงานและเกณฑ์วัดของ NLP แม้สถาปัตยกรรมจะไม่ได้ผูกกับงานใดงานหนึ่ง แต่ก็ยังต้องใช้ชุดข้อมูลสำหรับปรับแต่งที่มีตัวอย่างนับพันหรือนับหมื่น ในทางตรงข้าม มนุษย์มักจะทำงานด้านภาษาใหม่ ๆ ได้จากตัวอย่างเพียงไม่กี่ตัวอย่างหรือแค่คำอธิบายง่าย ๆ ซึ่งระบบ NLP ปัจจุบันยังทำได้ไม่ดีนัก ที่นี่เราจะแสดงให้เห็นว่าการขยายขนาดโมเดลภาษา ช่วยเพิ่มประสิทธิภาพแบบไม่ผูกกับงานและแบบ few-shot ได้อย่างมาก บางครั้งก็สามารถแข่งขันกับวิธีการปรับแต่งที่ดีที่สุดในอดีตได้เลย



Tl;dr


# แบบฝึกหัดสำหรับหลายกรณีการใช้งาน  
1. สรุปข้อความ  
2. จัดประเภทข้อความ  
3. สร้างชื่อสินค้ารูปแบบใหม่


In [None]:
prompt = "Recent work has demonstrated substantial gains on many NLP tasks and benchmarks by pre-training on a large corpus of text followed by fine-tuning on a specific task. While typically task-agnostic in architecture, this method still requires task-specific fine-tuning datasets of thousands or tens of thousands of examples. By contrast, humans can generally perform a new language task from only a few examples or from simple instructions - something that current NLP systems still largely struggle to do. Here we show that scaling up language models greatly improves task-agnostic, few-shot performance, sometimes even reaching competitiveness with prior state-of-the-art fine-tuning approaches.\n\nTl;dr"


In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt},])

response.choices[0].message.content

## จัดหมวดหมู่ข้อความ  
#### ความท้าทาย  
จัดหมวดหมู่รายการตามหมวดหมู่ที่กำหนดไว้ในขณะที่ทำการทำนาย ในตัวอย่างต่อไปนี้ เราจะให้ทั้งหมวดหมู่และข้อความที่ต้องการจัดหมวดหมู่ในพรอมต์ (*playground_reference)

คำถามจากลูกค้า: สวัสดีค่ะ ปุ่มบนคีย์บอร์ดแล็ปท็อปของฉันหักไปหนึ่งปุ่มเมื่อไม่นานมานี้ และฉันต้องการอะไหล่เปลี่ยน:

หมวดหมู่ที่จัดไว้:


In [None]:
prompt = "Classify the following inquiry into one of the following: categories: [Pricing, Hardware Support, Software Support]\n\ninquiry: Hello, one of the keys on my laptop keyboard broke recently and I'll need a replacement:\n\nClassified category:"
print(prompt)

In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt},])

response.choices[0].message.content

## สร้างชื่อสินค้ารูปแบบใหม่
#### โจทย์
สร้างชื่อสินค้าจากคำตัวอย่างที่ให้มา ในคำสั่งนี้จะมีข้อมูลเกี่ยวกับสินค้าที่เราต้องการตั้งชื่อให้ พร้อมตัวอย่างที่คล้ายกันเพื่อแสดงรูปแบบที่ต้องการ นอกจากนี้ยังตั้งค่า temperature สูงเพื่อให้ได้คำตอบที่หลากหลายและสร้างสรรค์มากขึ้น

คำอธิบายสินค้า: เครื่องทำมิลค์เชคสำหรับใช้ในบ้าน
คำที่ใช้เป็นต้นแบบ: รวดเร็ว, สุขภาพดี, กะทัดรัด
ชื่อสินค้า: HomeShaker, Fit Shaker, QuickShake, Shake Maker

คำอธิบายสินค้า: รองเท้าที่สามารถปรับขนาดให้พอดีกับเท้าได้ทุกขนาด
คำที่ใช้เป็นต้นแบบ: ปรับเปลี่ยนได้, พอดี, omni-fit


In [None]:
prompt = "Product description: A home milkshake maker\nSeed words: fast, healthy, compact.\nProduct names: HomeShaker, Fit Shaker, QuickShake, Shake Maker\n\nProduct description: A pair of shoes that can fit any foot size.\nSeed words: adaptable, fit, omni-fit."

print(prompt)

In [None]:
#Setting a few additional, typical parameters during API Call

response = client.complete(
  model=model_name,
  messages = [{"role":"system", "content":"You are a helpful assistant."},
               {"role":"user","content":prompt}])

response.choices[0].message.content

# แหล่งข้อมูลอ้างอิง  
- [Openai Cookbook](https://github.com/openai/openai-cookbook?WT.mc_id=academic-105485-koreyst)  
- [ตัวอย่างจาก OpenAI Studio](https://oai.azure.com/portal?WT.mc_id=academic-105485-koreyst)  
- [แนวทางปฏิบัติที่ดีที่สุดสำหรับการปรับแต่ง GPT-3 เพื่อจัดประเภทข้อความ](https://docs.google.com/document/d/1rqj7dkuvl7Byd5KQPUJRxc19BJt8wo0yHNwK84KfU3Q/edit#?WT.mc_id=academic-105485-koreyst)


# สำหรับความช่วยเหลือเพิ่มเติม  
[OpenAI Commercialization Team](AzureOpenAITeam@microsoft.com)


# ผู้มีส่วนร่วม
* [Chew-Yean Yam](https://www.linkedin.com/in/cyyam/)



---

**ข้อจำกัดความรับผิดชอบ**:  
เอกสารฉบับนี้ได้รับการแปลโดยใช้บริการแปลภาษา AI [Co-op Translator](https://github.com/Azure/co-op-translator) แม้ว่าเราจะพยายามอย่างเต็มที่เพื่อความถูกต้อง แต่โปรดทราบว่าการแปลโดยระบบอัตโนมัติอาจมีข้อผิดพลาดหรือความไม่ถูกต้อง เอกสารต้นฉบับในภาษาต้นทางควรถือเป็นแหล่งข้อมูลที่เชื่อถือได้ สำหรับข้อมูลที่มีความสำคัญ แนะนำให้ใช้บริการแปลโดยนักแปลมืออาชีพ ทางเราจะไม่รับผิดชอบต่อความเข้าใจผิดหรือการตีความที่คลาดเคลื่อนซึ่งเกิดจากการใช้การแปลนี้
