# 1. Tổng quan

```Few-shot prompting``` là một kỹ thuật trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) sử dụng các mô hình ngôn ngữ lớn (LLMs), trong đó người dùng cung cấp một số ví dụ minh họa (thường từ 2 đến 5) về nhiệm vụ cần thực hiện trực tiếp trong prompt. Các ví dụ này đóng vai trò hướng dẫn mô hình nhận diện mẫu (pattern) và áp dụng quy tắc đó cho dữ liệu mới, mà không cần huấn luyện lại mô hình hay cập nhật tham số nội bộ. Few-shot prompting nằm giữa zero-shot (không có ví dụ) và fine-tuning (huấn luyện lại với tập dữ liệu lớn), tận dụng khả năng học trong ngữ cảnh (in-context learning) của LLMs để thích ứng nhanh với các tác vụ mới

# 2. Đặc điểm
* Cung cấp ví dụ minh họa: Prompt chứa một số cặp input–output tiêu biểu, giúp mô hình hiểu rõ yêu cầu và định dạng mong muốn.
* Học trong ngữ cảnh (in-context learning): Mô hình không thay đổi tham số, mà dựa vào các ví dụ để nhận diện mẫu và tổng quát hóa cho trường hợp mới.
* Tăng độ chính xác: So với zero-shot, few-shot giúp mô hình thực hiện tốt hơn các tác vụ phức tạp hoặc có cấu trúc đầu ra đặc thù.
* Linh hoạt và tiết kiệm chi phí: Không cần tập dữ liệu lớn hay huấn luyện lại, dễ dàng điều chỉnh cho nhiều tác vụ khác nhau chỉ bằng cách thay đổi ví dụ trong prompt.
* Hiệu quả phụ thuộc vào chất lượng ví dụ: Kết quả đầu ra chịu ảnh hưởng mạnh bởi tính đa dạng, rõ ràng và liên quan của các ví dụ được chọn.
* Giới hạn số lượng ví dụ: Thường chỉ cần 2–5 ví dụ; quá nhiều có thể gây quá khớp (overfitting) hoặc làm prompt quá dài, ảnh hưởng hiệu suất

# 3. Best Practices
Để tối ưu hiệu quả few-shot prompting, các nguyên tắc thực hành tốt bao gồm:
* Chọn ví dụ đa dạng và đại diện: Đảm bảo các ví dụ bao quát nhiều trường hợp và khía cạnh khác nhau của tác vụ, giúp mô hình tổng quát hóa tốt hơn.
* Giữ định dạng nhất quán: Các ví dụ nên có cấu trúc giống nhau về cách trình bày input và output, giúp mô hình dễ nhận diện mẫu.
* Sử dụng cả ví dụ tích cực và tiêu cực: Nếu phù hợp, cung cấp cả ví dụ đúng và sai để mô hình hiểu rõ phạm vi đầu ra mong muốn.
* Sắp xếp ví dụ ngẫu nhiên: Tránh để mô hình học máy móc theo thứ tự, tăng khả năng tổng quát hóa.
* Không dùng quá nhiều ví dụ: Thường chỉ cần 2–5 ví dụ; quá nhiều có thể gây nhiễu hoặc vượt quá giới hạn token của mô hình.
* Kiểm tra và tinh chỉnh: Thử nghiệm nhiều tổ hợp ví dụ và cấu trúc prompt để tìm ra thiết lập hiệu quả nhất cho từng tác vụ cụ thể.

# 4.Ví dụ

In [1]:
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage
from langchain.chat_models import init_chat_model
from dotenv import load_dotenv

load_dotenv()

True

In [2]:
model = init_chat_model(
    model='gpt-4o-mini', 
    model_provider='openai',
    temperature=0
)


messages = [
    # Instruction
    SystemMessage('Trong vai trò chuyên gia vật lý, hãy giúp tôi đổi độ C ra độ F, cho kết quả mà không cần giải thích quá nhiều'),
    
    # Examples
    HumanMessage('Đổi 0 độ C ra độ F'),
    AIMessage('32 Fahrenheit'),
    HumanMessage('Đổi 100 độ C ra độ F'),
    AIMessage('212 Fahrenheit'),
    
    # User query
    HumanMessage('Đổi 37 độ C ra độ F'),
]

response = model.invoke(messages)
print(response.content)  # Kết quả đúng: 98.6 Fahrenheit

98.6 Fahrenheit
