# Fine-Tuning OpenAI's GPT-4 model: Step-by-step
## Content
1. What is Fine-Tuning
2. When to use Fine-Tuning
3. Common use-cases for fine-tuning
4. Fine-tuning GPT 4 model
    4.1. Prepare data
    4.2. Setup API key and libraries
    4.3. Upload the training file
    4.4. Create a fine-tuned model
    4.5. Analyze the fine-tuned model
    4.6. Using the fine-tuned model
5. Conclusion

# 1. What is fine-tuning?

- là quá trình tinh chỉnh mô hình đã được huấn luyện trước
- nó giúp tối ưu hóa một nhiệm vụ hoặc lĩnh vực cụ thể

Các phương pháp fine-tuning:
- Parameter-Efficient Fine-Tuning: câp nhật một phần tham số nhằm tiết kiệm tài nguyên và tránh mất đi kiến thức trước đó
- Instruction fine-tuning: huấn luyện mô hình với những mẫu cụ thể để điều chỉnh từng nhiệm vụ thích hợp

So sánh với Retrieval Augmented Generation (RAG):
- Fine-tuning: Tối ưu hóa mô hình sẵn có để thực hiện tốt một nhiệm vụ cụ thể.
- RAG: Kết hợp truy xuất thông tin từ nguồn bên ngoài trong quá trình tạo nội dung, giúp đảm bảo tính cập nhật và chính xác của thông tin.

Việc chọn fine-tuning hay RAG phụ thuộc vào yêu cầu cụ thể của ứng dụng, như mức độ chuyên môn hóa, tài nguyên tính toán, và nhu cầu cập nhật thông tin.

# 2. When to use Fine-Tuning

Fine-tuning giúp tùy chỉnh mô hình của OpenAI nhưng tốn nhiều thời gian và tài nguyên. Trước khi fine-tuning, nên tối ưu hóa bằng prompt engineering, prompt chaining, và function calling vì:

- Điều chỉnh prompt đúng cách có thể cải thiện kết quả mà không cần fine-tuning.
- Các phương pháp này cho phản hồi nhanh, trong khi fine-tuning cần dữ liệu và thời gian huấn luyện.
- Nếu vẫn cần fine-tuning, các kỹ thuật trên vẫn hữu ích và có thể kết hợp để đạt hiệu quả tốt nhất.

# 3. Common use-cases for fine-tuning

Fine-tuning hữu ích trong các trường hợp:
- Tùy chỉnh phong cách, giọng điệu, định dạng đầu ra (Tùy chỉnh các đặc điểm đầu ra).
- Tăng độ tin cậy và nhất quán của mô hình  .
- Xử lý các lệnh phức tạp hiệu quả hơn.
- Quản lý các trường hợp đặc biệt theo cách xác định trước.
- Dạy mô hình kỹ năng hoặc nhiệm vụ mới khó diễn đạt qua lệnh.

# 4. Fine-tuning GPT 4 model

## 4.1. Prepare data

Để đảm bảo chất lượng mô hình sau khi fine-tune, dữ liệu huấn luyện cần được chuẩn bị kỹ lưỡng. Với API của OpenAI, dữ liệu phải được lưu ở định dạng JSONL.

    {"prompt": "<văn bản lệnh>", "completion": "<văn bản đầu ra lý tưởng>"}
    {"prompt": "<văn bản lệnh>", "completion": "<văn bản đầu ra lý tưởng>"}
    {"prompt": "<văn bản lệnh>", "completion": "<văn bản đầu ra lý tưởng>"}

Ví dụ:

    {"messages": [{"role": "system", "content": "You are teaching assistant for Machine Learning. You should help to user to answer on his question."}, {"role": "user", "content": "What is machine learning?"}, {"role": "assistant", "content": "'Tis but the art of teaching machines to think, to learn from data most fine, and decisions to link."}]}

    {"messages": [{"role": "system", "content": "You are teaching assistant for Machine Learning. You should help to user to answer on his question."}, {"role": "user", "content": "How doth neural networks work?"}, {"role": "assistant", "content": "They're like the brains of yon digital beast, with layers many, and nodes that cease."}]}

## 4.2. Setup API key and libraries

In [None]:
!pip install openai

In [2]:
import os
from openai import OpenAI

In [None]:
OPENAI_API_KEY="INSERT_YOUR_OPENAI_API_KEY"
os.environ['OPENAI_API_KEY'] = OPENAI_API_KEY

## 4.3. Upload the training file

In [None]:
client = OpenAI()
client.files.create(
    file=open('train.json', 'rb'),
    purpose='fine-tune'
)

## 4.4. Create a fine-tuned model

In [None]:
client.fine_tuning.jobs.create(
    training_file='id_file_that_return_by_openai_after_upload_the_training_file',
    model='gpt-3.5-turbo', # Replace any model name if you have access
)
# Để xem các hướng dẫn tinh chỉnh thông số, validation...
# https://platform.openai.com/docs/api-reference/fine-tuning/create
# Once the job finishes, an email confirmation will also be sent.

Bên cạnh việc thiết lập công việc tinh chỉnh, bạn có thể xem danh sách các công việc hiện tại, kiểm tra trạng thái của một công việc cụ thể hoặc hủy một công việc.

In [None]:
# List 10 fine-tuning jopbs
client.fine_tuning.jobs.list(limit=10)

# Retrieve the state of a fine-tune
client.fine_tuning.jobs.retrieve('...')

# Cancel a job
client.fine_tuning.jobs.cancel("...")

# List up to 10 events from a fine-tuning job
client.fine_tuning.jobs.list_events(fine_tuning_job_id='...', limit=10)

# Delete a fine-tuned model (must be an owner of the org the model created in)
client.models.delete('df:gpt-3.5-turbor:xxx:xxx')

## 4.5. Analyze the fine-tuned model

OpenAI cung cấp các số liệu đào tạo chính như mất mát đào tạo, độ chính xác của mã thông báo để đào tạo, mất mát thử nghiệm và độ chính xác của mã thông báo thử nghiệm.

In [None]:
{
    "object": "fine_tuning.job.event",
    "id": "ftjob-Na7BnF5y91wwGJ4EgxtzVyDD",
    "created_at": 1693582679,
    "level": "info",
    "message": "Step 100/100: training loss=0.00",
    "data": {
        "step": 100,
        "train_loss": 1.805623287509661e-5,
        "train_mean_token_accuracy": 1.0
    },
    "type": "metrics"
}


## 4.6. Using the fine-tuned model

Sau khi hoàn thành training, chúng ta có thể thực hiện gọi API đến mô hình này và nhận phản hồi từ mô hình mà chúng ta vừa điều chỉnh.

In [None]:
completion = client.chat.completions.create(
    model='df:gpt-3.5-turbo-0613:personal::8k01tfYd',
    messages=[
        {"role": "system", "content": "You are a teaching assistant for Machine Learning. You should help to user to answer on his question."},
        {"role": "user", "content": "What is a loss function?"}
    ]
)
print(completion.choices[0].message)

# 5. Conclusion