# 1. Tổng quan

```Zero-shot prompting``` là một kỹ thuật trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) sử dụng các mô hình ngôn ngữ lớn (LLMs) để thực hiện một tác vụ mà không cần cung cấp bất kỳ ví dụ minh họa nào về cách thực hiện tác vụ đó trong prompt. Thay vào đó, người dùng chỉ cần mô tả rõ ràng nhiệm vụ hoặc yêu cầu, và mô hình sẽ dựa vào kiến thức đã học từ quá trình huấn luyện quy mô lớn để suy luận và tạo ra phản hồi phù hợp. 

# 2. Đặc điểm
1. Không cần ví dụ minh họa: Prompt không chứa ví dụ về đầu vào–đầu ra cho tác vụ, chỉ có mô tả nhiệm vụ.
2. Tận dụng kiến thức tổng quát: Mô hình dựa vào kiến thức nền tảng được học trong quá trình huấn luyện trên tập dữ liệu lớn để giải quyết tác vụ mới, kể cả khi chưa từng được huấn luyện trực tiếp cho tác vụ đó.
3. Linh hoạt và mở rộng: Cho phép mô hình thực hiện nhiều tác vụ khác nhau mà không cần huấn luyện lại hay thu thập dữ liệu gán nhãn mới, phù hợp với các trường hợp thiếu dữ liệu hoặc cần mở rộng nhanh chóng.
4. Hiệu quả phụ thuộc vào chất lượng prompt: Thành công của zero-shot prompting phụ thuộc vào việc mô tả nhiệm vụ rõ ràng, tránh mơ hồ, và cung cấp đủ ngữ cảnh cần thiết.
5. Khả năng tổng quát hóa: Mô hình có thể áp dụng kiến thức cho các tác vụ hoặc miền chưa từng gặp, thể hiện năng lực tổng quát hóa cao của LLMs

# 3. Best practice
Để đạt hiệu quả tối ưu với zero-shot prompting, các chuyên gia khuyến nghị:
* Cung cấp hướng dẫn rõ ràng: Đảm bảo prompt mô tả nhiệm vụ một cách cụ thể, không mơ hồ.
* Định dạng đầu ra: Xác định rõ định dạng mong muốn cho câu trả lời (ví dụ: “Trả lời bằng một từ”, “Liệt kê dưới dạng bullet points”).
* Cung cấp ngữ cảnh cần thiết: Nếu có thể gây nhầm lẫn (ví dụ: từ đa nghĩa), hãy bổ sung ngữ cảnh để mô hình hiểu đúng.
* Tránh quá phức tạp: Zero-shot phù hợp nhất với các tác vụ đơn giản hoặc phổ quát (phân loại cảm xúc, dịch thuật, tóm tắt), các tác vụ chuyên sâu hoặc đặc thù có thể cần few-shot hoặc fine-tuning.
* Kiểm tra và tinh chỉnh: Thử nghiệm với nhiều cách diễn đạt khác nhau để chọn prompt hiệu quả nhất, có thể sử dụng phương pháp iterative refinement.

# 4. Ví dụ

In [1]:
from langchain_core.messages import HumanMessage, SystemMessage
from langchain.chat_models import init_chat_model
from dotenv import load_dotenv

load_dotenv()

True

## 4.1. Bài toán 1 - Phân tích cảm xúc (Sentiment Analysis)

In [2]:
model = init_chat_model(
    model='gpt-4o-mini', 
    model_provider='openai',
    temperature=0.1
)

examples = [
    'Khách sạn đẹp tuyệt, nhân viên thì nhiệt tình',
    'Đồ ăn ở đây siêu mặn',
    'Nhận phòng vào thứ 3'
]

for example in examples:
    messages = [
        SystemMessage('Trong vai trò chuyên gia tư phân tích cảm xúc, hãy phân loại câu nói của người dùng vào 1 trong 3 loại nhãn sau: tích cực, tiêu cực, trung tính. Chỉ cần phản hồi ngắn gọn nhãn, khg cần giải thích gì thêm.'),
        HumanMessage(example),
    ]
    
    response = model.invoke(messages)
    print(response.content)
    

Tích cực
Tiêu cực
Trung tính


## 4.2 Bài toán 2 - Hệ hỏi đáp

In [3]:
model = init_chat_model(
    model='gpt-4o-mini', 
    model_provider='openai',
    temperature=0.8
)


messages = [
    SystemMessage('Trong vai trò chuyên gia, hãy trả lời người dùng một số câu hỏi.'),
    HumanMessage('Thủ đô nước CHXHCN Việt Nam là thành phố nào?'),
]

response = model.invoke(messages)
print(response.content)

Thủ đô của nước Cộng hòa Xã hội Chủ nghĩa Việt Nam là Hà Nội.
