In [1]:
# pip install -q --upgrade transformers accelerate bitsandbytes peft trl sentencepiece datasets scikit-learn unsloth tensorboardX

In [1]:
# Standard imports
import unsloth
from unsloth import FastLanguageModel
import pandas as pd
import torch
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    BitsAndBytesConfig,
    TrainingArguments,
    EarlyStoppingCallback,
    logging as hf_logging,
)
from datasets import Dataset, load_dataset
from peft import LoraConfig, PeftModel, get_peft_model, prepare_model_for_kbit_training
from trl import SFTTrainer
from sklearn.metrics import classification_report, accuracy_score
from sklearn.model_selection import train_test_split
import numpy as np
import random
import re
import os
import json # For saving/loading datasets
import textwrap
from huggingface_hub import login

# Set verbosity for Hugging Face libraries
hf_logging.set_verbosity_error() # Only show errors


🦥 Unsloth: Will patch your computer to enable 2x faster free finetuning.
🦥 Unsloth Zoo will now patch everything to make training faster!


In [2]:
login(token='YOUR_HF_TOKEN_HERE')


BASE_DRIVE_PATH = "/home/user/" # ADJUST YOUR GDRIVE PATH HERE

DATA_FILE_PATH = os.path.join(BASE_DRIVE_PATH, "Dataset_ChongPha.csv") # YOUR CSV FILENAME
SUMMARY_COLUMN = 'summary'
COMMENT_COLUMN = 'comment_clean'
LABEL_COLUMN = 'label'
POSSIBLE_LABELS = ["PHAN_DONG", "KHONG_PHAN_DONG", "KHONG_LIEN_QUAN"]
# For robust matching of LLM outputs
POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING = sorted([label.replace("_", "") for label in POSSIBLE_LABELS], key=len, reverse=True)
POSSIBLE_LABELS_VARIANTS_FOR_MATCHING = []
for p_label in POSSIBLE_LABELS:
    POSSIBLE_LABELS_VARIANTS_FOR_MATCHING.append(p_label.upper())
    POSSIBLE_LABELS_VARIANTS_FOR_MATCHING.append(p_label.upper().replace("_", ""))
POSSIBLE_LABELS_VARIANTS_FOR_MATCHING = sorted(list(set(POSSIBLE_LABELS_VARIANTS_FOR_MATCHING)), key=len, reverse=True)


In [3]:
# 1.3. Model Configuration
MODEL_ID = "Qwen/Qwen3-32B"
TOKENIZER_ID = "Qwen/Qwen3-32B"
# 1.4. Zero-Shot Testing Configuration
NUM_SAMPLES_TO_TEST_ZERO_SHOT = 9999 # Reduce for quicker initial testing, increase for more thorough
MAX_INPUT_LENGTH_ZERO_SHOT = 400  # Max length of the prompt fed to the model for zero-shot
                                  # Adjust based on analysis of your formatted prompts later
MAX_NEW_TOKENS_ZERO_SHOT = 20     # Max tokens for the model to generate (should be enough for the label)

# 1.5. Fine-tuning Configuration (QLoRA)
OUTPUT_DIR = os.path.join(BASE_DRIVE_PATH, "vistral7b") # Where to save fine-tuned model
MAX_SEQ_LENGTH_SFT = 650          # Max sequence length for SFTTrainer (prompt + completion)
                                  # This will be refined after analyzing token lengths of formatted data.
                                  # Start with a conservative value.

print("Configurations set.")

Configurations set.


In [4]:
# SYSTEM_PROMPT_CONTENT = """Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Nhiệm vụ chính là xác định chính xác bình luận có tính chất phản động đối với nhà nước Việt Nam.

# TIÊU CHÍ PHÂN LOẠI:

# PHAN_DONG:
# • Công kích, xuyên tạc, chống đối Đảng, Nhà nước, chính quyền Việt Nam
# • Phủ nhận, bóp méo sự kiện lịch sử của Việt Nam (Cách mạng, 30/4, Điện Biên Phủ...)
# • Xúc phạm lãnh đạo, biểu tượng quốc gia Việt Nam (Bác Hồ, quốc kỳ, quốc ca...)
# • Lan truyền thông tin sai lệch nhằm chống phá chế độ xã hội chủ nghĩa
# • Đồng tình với quan điểm phản động, chống phá Việt Nam trong bài đăng gốc

# KHONG_PHAN_DONG:
# • Phản biện chính sách cụ thể nhưng không phủ nhận chế độ
# • Góp ý xây dựng về đường lối, chính sách của Đảng, Nhà nước
# • Ủng hộ, bảo vệ chính quyền Việt Nam
# • Phê phán rõ ràng các quan điểm phản động
# • Bày tỏ tinh thần yêu nước, đoàn kết dân tộc Việt Nam

# KHONG_LIEN_QUAN:
# • Không đề cập đến chính trị, chính sách Việt Nam
# • Spam, quảng cáo, emoji đơn thuần
# • Nội dung đời sống, cá nhân
# • Không liên quan đến chủ đề chính trị trong bài đăng

# LƯU Ý:
# • Đồng tình với bài đăng phản động/tin giả về Việt Nam → PHAN_DONG
# • Phản bác bài đăng phản động → KHONG_PHAN_DONG
# • Bình luận mỉa mai: đánh giá ý đồ thực sự đối với nhà nước Việt Nam

# ĐỊNH DẠNG ĐẦU RA:
# Chỉ trả lời một nhãn: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN"""

# SYSTEM_PROMPT_CONTENT= """Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không.
# # ĐỊNH DẠNG ĐẦU RA:
# # Chỉ trả lời một nhãn: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN"""

SYSTEM_PROMPT_CONTENT= """Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không."""
def create_user_content(summary_text: str, comment_text: str) -> str:
    return f"""TÓM TẮT BÀI ĐĂNG:
"{summary_text}"

BÌNH LUẬN CẦN PHÂN LOẠI:
"{comment_text}"
"""

In [5]:
# 2.2. Load Raw Data
try:
    df_full = pd.read_csv(DATA_FILE_PATH)
    print(f"Successfully loaded data from {DATA_FILE_PATH}. Shape: {df_full.shape}")
    if not all(col in df_full.columns for col in [SUMMARY_COLUMN, COMMENT_COLUMN, LABEL_COLUMN]):
        raise ValueError(f"Missing one or more required columns: {SUMMARY_COLUMN}, {COMMENT_COLUMN}, {LABEL_COLUMN}")

    df_full[SUMMARY_COLUMN] = df_full[SUMMARY_COLUMN].fillna('').astype(str)
    df_full[COMMENT_COLUMN] = df_full[COMMENT_COLUMN].fillna('').astype(str)
    df_full[LABEL_COLUMN] = df_full[LABEL_COLUMN].astype(str).str.strip().str.upper() # Normalize labels

    # Validate labels
    invalid_labels = df_full[~df_full[LABEL_COLUMN].isin(POSSIBLE_LABELS)]
    if not invalid_labels.empty:
        print(f"Warning: Found {len(invalid_labels)} rows with invalid labels. Examples: {invalid_labels[LABEL_COLUMN].unique()[:5]}")
        print("These rows will be filtered out.")
        df_full = df_full[df_full[LABEL_COLUMN].isin(POSSIBLE_LABELS)]
        print(f"Shape after filtering invalid labels: {df_full.shape}")

    if df_full.empty:
        raise ValueError("Dataset is empty after loading or filtering. Please check your data.")

except FileNotFoundError:
    print(f"ERROR: Data file not found at {DATA_FILE_PATH}.")
    df_full = pd.DataFrame() # Avoid further errors
except ValueError as ve:
    print(f"ERROR during data loading: {ve}")
    df_full = pd.DataFrame()
except Exception as e:
    print(f"An unexpected error occurred during data loading: {e}")
    df_full = pd.DataFrame()


Successfully loaded data from /home/user/Dataset_ChongPha.csv. Shape: (18912, 4)


In [6]:
#Split Data into Train, Validation, and Test sets (80%, 10%, 10%)
if not df_full.empty:
    print("\nSplitting data into Train (70%), Validation (10%), Test (10%)...")
    # Bước 1: Tách 70% training ra, 30% còn lại cho temp (validation + test)
    df_train, df_temp = train_test_split(
        df_full,
        test_size=0.2,  # 30% cho tập tạm thời
        random_state=42,
        stratify=df_full[LABEL_COLUMN]
    )

    # Bước 2: Chia tập tạm thời (30%) thành validation (15% gốc) và test (15% gốc)
    # Điều này có nghĩa là chia tập tạm thời theo tỷ lệ 50/50
    df_val, df_test = train_test_split(
        df_temp,
        test_size=0.50,
        random_state=42,
        stratify=df_temp[LABEL_COLUMN]
    )

    print(f"Data split complete:")
    print(f"  Training set:   {len(df_train)} samples ({len(df_train)/len(df_full)*100:.1f}%)")
    print(f"  Validation set: {len(df_val)} samples ({len(df_val)/len(df_full)*100:.1f}%)")
    print(f"  Test set:       {len(df_test)} samples ({len(df_test)/len(df_full)*100:.1f}%)")

    print("\nLabel distribution in Training set:")
    print(df_train[LABEL_COLUMN].value_counts(normalize=True).sort_index())
    print("\nLabel distribution in Validation set:")
    print(df_val[LABEL_COLUMN].value_counts(normalize=True).sort_index())
    print("\nLabel distribution in Test set:")
    print(df_test[LABEL_COLUMN].value_counts(normalize=True).sort_index())

# <<< NEW: Oversample the minority class ('PHAN_DONG') in the training set (df_train) >>>
if not df_train.empty:
    print(f"\nOriginal df_train label distribution:")
    print(df_train[LABEL_COLUMN].value_counts(normalize=True).sort_index())

    # Identify minority and majority classes
    label_counts = df_train[LABEL_COLUMN].value_counts()
    majority_class_count = label_counts.max()
    minority_class = "PHAN_DONG" # Your specific minority class
    minority_class_count = label_counts.get(minority_class, 0)

    if minority_class_count > 0 and minority_class_count < majority_class_count:
        print(f"Oversampling minority class '{minority_class}' from {minority_class_count} to match majority (or a higher target)...")
        # Simple oversampling: duplicate minority samples
        # You can choose a target count, e.g., match the majority, or a fraction of it.
        # Let's aim to bring it closer to the next class or a significant portion of majority.
        # For simplicity, let's try to increase its count, e.g., to be similar to KHONG_PHAN_DONG
        target_count_for_minority = label_counts.get("KHONG_PHAN_DONG", majority_class_count) # Or a fixed number

        df_minority = df_train[df_train[LABEL_COLUMN] == minority_class]

        # Calculate how many times to replicate
        if minority_class_count > 0: # Avoid division by zero
            num_replications = (target_count_for_minority // minority_class_count) -1
            if num_replications < 0: num_replications = 0 # Should not happen if target > current

            df_oversampled_minority = pd.concat([df_minority] * num_replications, ignore_index=True)

            # Add remaining samples to get closer to target_count
            remaining_samples_needed = target_count_for_minority % minority_class_count
            if remaining_samples_needed > 0 and not df_minority.empty:
                df_oversampled_minority = pd.concat([df_oversampled_minority, df_minority.sample(n=remaining_samples_needed, replace=True, random_state=42)], ignore_index=True)

            df_train_oversampled = pd.concat([df_train, df_oversampled_minority], ignore_index=True)

            # Shuffle the oversampled training data
            df_train = df_train_oversampled.sample(frac=1, random_state=42).reset_index(drop=True)
            print(f"\nOversampled df_train label distribution:")
            print(df_train[LABEL_COLUMN].value_counts().sort_index())
    else:
        print(f"Minority class '{minority_class}' not found or no oversampling needed/possible.")
# <<< END OF OVERSAMPLING SECTION >>>



Splitting data into Train (70%), Validation (10%), Test (10%)...
Data split complete:
  Training set:   15129 samples (80.0%)
  Validation set: 1891 samples (10.0%)
  Test set:       1892 samples (10.0%)

Label distribution in Training set:
label
KHONG_LIEN_QUAN    0.528984
KHONG_PHAN_DONG    0.356600
PHAN_DONG          0.114416
Name: proportion, dtype: float64

Label distribution in Validation set:
label
KHONG_LIEN_QUAN    0.528821
KHONG_PHAN_DONG    0.356425
PHAN_DONG          0.114754
Name: proportion, dtype: float64

Label distribution in Test set:
label
KHONG_LIEN_QUAN    0.529070
KHONG_PHAN_DONG    0.356765
PHAN_DONG          0.114165
Name: proportion, dtype: float64

Original df_train label distribution:
label
KHONG_LIEN_QUAN    0.528984
KHONG_PHAN_DONG    0.356600
PHAN_DONG          0.114416
Name: proportion, dtype: float64
Oversampling minority class 'PHAN_DONG' from 1731 to match majority (or a higher target)...

Oversampled df_train label distribution:
label
KHONG_LIEN_QUAN

In [7]:
num_samples_for_zs = min(NUM_SAMPLES_TO_TEST_ZERO_SHOT, len(df_test))
if num_samples_for_zs > 0 :
    df_zero_shot_evaluation_set = df_test.sample(n=num_samples_for_zs, random_state=42)
    print(f"\nUsing {len(df_zero_shot_evaluation_set)} samples from the new Test set for zero-shot baseline evaluation.")
    if not df_zero_shot_evaluation_set.empty:
        print("Label distribution in zero-shot evaluation sample:")
        print(df_zero_shot_evaluation_set[LABEL_COLUMN].value_counts(normalize=True).sort_index())
else:
    print("Test set is too small or NUM_SAMPLES_TO_TEST_ZERO_SHOT is 0, skipping zero-shot sample creation.")
    df_zero_shot_evaluation_set = pd.DataFrame() # Đảm bảo là DataFrame rỗng


Using 1892 samples from the new Test set for zero-shot baseline evaluation.
Label distribution in zero-shot evaluation sample:
label
KHONG_LIEN_QUAN    0.529070
KHONG_PHAN_DONG    0.356765
PHAN_DONG          0.114165
Name: proportion, dtype: float64


In [9]:
model_for_zs, tokenizer_for_zs = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Qwen3-32B-unsloth-bnb-4bit",
    max_seq_length = MAX_SEQ_LENGTH_SFT,
    load_in_4bit = True,
    # token = "hf_...", # use one if using gated models like meta-llama/Llama-2-7b-hf
)
FastLanguageModel.for_inference(model_for_zs)
print("Model and Tokenizer for Zero-Shot loaded.")

==((====))==  Unsloth 2025.7.11: Fast Qwen3 patching. Transformers: 4.54.1.
   \\   /|    NVIDIA L40S. Num GPUs = 1. Max memory: 44.403 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.7.1+cu128. CUDA: 8.9. CUDA Toolkit: 12.8. Triton: 3.3.1
\        /    Bfloat16 = TRUE. FA [Xformers = 0.0.31.post1. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


Loading checkpoint shards:   0%|          | 0/9 [00:00<?, ?it/s]

Model and Tokenizer for Zero-Shot loaded.


In [14]:
# Interactive Testing on Full Test Dataset
print("\n--- Interactive Testing on Full Test Dataset ---")

print(f"Running interactive testing on {len(df_test)} test samples...")

correct_predictions = 0
total_predictions = 0
all_actual_labels = []
all_predicted_labels = []

for idx, row in df_test.iterrows():
    # Reset conversation for each test sample
    conversation = [{"role": "system", "content": SYSTEM_PROMPT_CONTENT}]

    # Get the test data
    post = row[SUMMARY_COLUMN]
    comment = row[COMMENT_COLUMN]
    actual_label = row[LABEL_COLUMN]

    # Create user content and add to conversation
    user_content = create_user_content(post, comment)
    conversation.append({"role": "user", "content": user_content})

    # Tokenize and generate response
    input_ids = tokenizer_for_zs.apply_chat_template(
        conversation,
        return_tensors="pt",
        enable_thinking=False,
        add_generation_prompt=True
    ).to(model_for_zs.device)

    out_ids = model_for_zs.generate(
        input_ids=input_ids,
        max_new_tokens=100,
        do_sample=True,
        top_p=0.95,
        top_k=40,
        temperature=0.1,
        repetition_penalty=1.05,
        pad_token_id=tokenizer_for_zs.eos_token_id,
        eos_token_id=tokenizer_for_zs.eos_token_id
    )

    # Decode the assistant response
    assistant_response = tokenizer_for_zs.batch_decode(
        out_ids[:, input_ids.size(1):],
        skip_special_tokens=True
    )[0].strip()

    # Extract predicted label using your existing logic
    extracted_label = "NULL"
    normalized_response = re.sub(r'[^\w_]', '', assistant_response.upper().replace(" ", "_"))
    normalized_response = re.sub(r'_+', '_', normalized_response)

    for variant in POSSIBLE_LABELS_VARIANTS_FOR_MATCHING:
        if variant in normalized_response:
            if variant in POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING:
                original_label_index = POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING.index(variant)
                extracted_label = POSSIBLE_LABELS[original_label_index]
            else:
                for pl_original in POSSIBLE_LABELS:
                    if pl_original.upper() == variant:
                        extracted_label = pl_original
                        break
            break

    # Track results
    all_actual_labels.append(actual_label)
    all_predicted_labels.append(extracted_label)
    total_predictions += 1

    if extracted_label == actual_label:
        correct_predictions += 1

    # Print detailed results for ALL samples (removed the <= 10 condition)
    print(f"\nSample {total_predictions}:")
    print(f"  Assistant Response: {assistant_response}")
    print(f"  Predicted: {extracted_label} | Actual: {actual_label} | {'✓' if extracted_label == actual_label else '✗'}")

    # Print progress every 50 samples
    if total_predictions % 50 == 0:
        current_accuracy = correct_predictions / total_predictions
        print(f"\n=== Progress Update ===")
        print(f"Processed {total_predictions} samples. Current accuracy: {current_accuracy:.4f}")
        print("=" * 40)

# Final results
final_accuracy = correct_predictions / total_predictions if total_predictions > 0 else 0
print(f"\n=== Final Test Results ===")
print(f"Total samples processed: {total_predictions}")
print(f"Correct predictions: {correct_predictions}")
print(f"Test Accuracy: {final_accuracy:.4f}")

# Classification report
if all_actual_labels and all_predicted_labels:
    print("\nTest Classification Report:")
    print(classification_report(
        all_actual_labels,
        all_predicted_labels,
        labels=POSSIBLE_LABELS,
        target_names=POSSIBLE_LABELS,
        zero_division=0
    ))



--- Interactive Testing on Full Test Dataset ---
Running interactive testing on 1892 test samples...

Sample 1:
  Assistant Response: PHAN_DONG
  Predicted: PHAN_DONG | Actual: KHONG_LIEN_QUAN | ✗

Sample 2:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 3:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 4:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 5:
  Assistant Response: PHAN_DONG
  Predicted: PHAN_DONG | Actual: PHAN_DONG | ✓

Sample 6:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 7:
  Assistant Response: PHAN_DONG
  Predicted: PHAN_DONG | Actual: PHAN_DONG | ✓

Sample 8:
  Assistant Response: KHONG_PHAN_DONG
  Predicted: KHONG_PHAN_DONG | Actual: KHONG_PHAN_DONG | ✓

Sample 9:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Ac

In [8]:
model_sft, tokenizer_sft = FastLanguageModel.from_pretrained(
    model_name = "unsloth/Qwen3-32B-unsloth-bnb-4bit",
    max_seq_length = MAX_SEQ_LENGTH_SFT,
    load_in_4bit = True,
    # token = "hf_...", # use one if using gated models like meta-llama/Llama-2-7b-hf
)
print("Model prepared for k-bit training.")
model_sft = FastLanguageModel.get_peft_model(
    model_sft,
    r=32,
    lora_alpha=64,
    target_modules=[
          "q_proj",
          "k_proj",
          "v_proj",
          "o_proj",
          "up_proj",
          "down_proj",
          "gate_proj"
      ],
    bias="none",
)
print("LoRA config defined.")

==((====))==  Unsloth 2025.7.11: Fast Qwen3 patching. Transformers: 4.54.1.
   \\   /|    NVIDIA L40S. Num GPUs = 1. Max memory: 44.403 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.7.1+cu128. CUDA: 8.9. CUDA Toolkit: 12.8. Triton: 3.3.1
\        /    Bfloat16 = TRUE. FA [Xformers = 0.0.31.post1. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


Loading checkpoint shards:   0%|          | 0/9 [00:00<?, ?it/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

added_tokens.json:   0%|          | 0.00/707 [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/614 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/11.4M [00:00<?, ?B/s]

chat_template.jinja: 0.00B [00:00, ?B/s]

Model prepared for k-bit training.
LoRA config defined.


In [None]:
# 2.4. Prepare Dataset for Fine-tuning (Conversational Format)
alpaca_prompt = """Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.

### Instruction:
Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không.
ĐỊNH DẠNG ĐẦU RA:
Chỉ trả lời một nhãn: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN

### Input:
{}

### Response:
{}"""

EOS_TOKEN = tokenizer_sft.eos_token # Must add EOS_TOKEN

def create_user_content(summary_text, comment_text):
    return f"""TÓM TẮT BÀI ĐĂNG:
"{summary_text}"

BÌNH LUẬN CẦN PHÂN LOẠI:
"{comment_text}" """

def formatting_prompts_func(sample):
    instruction = """Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không."""
    
    user_content = create_user_content(sample[SUMMARY_COLUMN], sample[COMMENT_COLUMN])
    output = sample[LABEL_COLUMN]
    
    # Important: Format the text exactly as expected by the model
    formatted_text = f"### Instruction: {instruction}\n\n### Input: {user_content}\n\n### Response: {output}{tokenizer_sft.eos_token}"
    return {"text": formatted_text}


# # Sử dụng hàm định dạng với dataset của bạn
# dataset = dataset.map(formatting_prompts_func, batched=True)

In [None]:
train_hf_dataset = Dataset.from_pandas(df_train)
val_hf_dataset = Dataset.from_pandas(df_val)
# df_test cũng sẽ được dùng để tạo test_hf_dataset cho đánh giá cuối cùng của model đã fine-tune
train_sft_formatted = train_hf_dataset.map(
    formatting_prompts_func,
    batched=False,
    remove_columns=train_hf_dataset.column_names  # Remove original columns
)

val_sft_formatted = val_hf_dataset.map(
    formatting_prompts_func,
    batched=False,
    remove_columns=val_hf_dataset.column_names  # Remove original columns
)
# from datasets import DatasetDict
# raw_datasets_sft = DatasetDict({
#     'train': train_sft_formatted,
#     'validation': val_sft_formatted # Đổi tên key cho tập validation
# })
print(f"\nDataset for SFT prepared:")
print(f"SFT Training set size:   {len(train_sft_formatted)}")
print(f"SFT Validation set size: {len(val_sft_formatted)}")
# ... (phần in ví dụ dữ liệu SFT giữ nguyên) ...

In [12]:
val_sft_formatted['text'][0]

'### Instruction: Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không.\n\n### Input: TÓM TẮT BÀI ĐĂNG:\n"1. Nội dung sơ lược: Một người đang tuyên truyền ở Cali thì bị cảnh sát bắt.\n\n2. Vấn đề: Hoạt động tuyên truyền bất hợp pháp ở Cali dẫn đến việc bị cảnh sát can thiệp.\n\n3. Phản động/tin giả: Không rõ ràng. Cần biết nội dung tuyên truyền là gì để xác định. Nếu nội dung chống phá nhà nước Việt Nam thì có thể coi là phản động."\n\nBÌNH LUẬN CẦN PHÂN LOẠI:\n"bạn nuôi con chó đến khi nó bắt đầu phá phách và cắn giày của bạn thì bạn phải phạt nó chứ" \n\n### Response: KHONG_LIEN_QUAN<|im_end|>'

In [13]:
 # --- Phase 4: Fine-tune LLM using SFTTrainer ---
early_stopping_callback = EarlyStoppingCallback(
    early_stopping_patience=2,
    early_stopping_threshold=0.001
)
training_args_sft = TrainingArguments(
    output_dir=OUTPUT_DIR,
    per_device_train_batch_size=16,
    per_device_eval_batch_size=32,
    gradient_accumulation_steps=2,
    optim="paged_adamw_8bit",
    learning_rate=6e-5,
    num_train_epochs=2,
    warmup_ratio=0.15,
    weight_decay=0.02,
    bf16=True, # Default to FP16, BF16 handled below if supported
    logging_steps=50,
    eval_strategy="steps",
    eval_steps=100,
    save_steps=300,
    save_total_limit=2,
    load_best_model_at_end=True,
    metric_for_best_model="eval_loss",
    greater_is_better=True,
    report_to="tensorboard",
    push_to_hub=False,
    gradient_checkpointing=True,
    gradient_checkpointing_kwargs={'use_reentrant':False}
)

print("TrainingArguments defined.")

trainer_sft = SFTTrainer(
    model=model_sft,
    args=training_args_sft,
    train_dataset=train_sft_formatted,
    eval_dataset=val_sft_formatted,
    dataset_text_field="text",
    max_seq_length = MAX_SEQ_LENGTH_SFT,
    tokenizer=tokenizer_sft,
    # formatting_func=formatting_prompts_func,
    callbacks=[early_stopping_callback]
)
print("SFTTrainer initialized.")
print("\nStarting SFT fine-tuning...")
trainer_sft.train()
print("SFT Fine-tuning finished.")
print(f"Saving LoRA adapter to {OUTPUT_DIR}...")
trainer_sft.save_model(OUTPUT_DIR)
tokenizer_sft.save_pretrained(OUTPUT_DIR)
print("LoRA adapter and tokenizer saved.")


TrainingArguments defined.


Unsloth: Tokenizing ["text"]:   0%|          | 0/18793 [00:00<?, ? examples/s]

Unsloth: Tokenizing ["text"]:   0%|          | 0/1891 [00:00<?, ? examples/s]

SFTTrainer initialized.

Starting SFT fine-tuning...
{'loss': 2.0091, 'grad_norm': 0.5195155739784241, 'learning_rate': 1.6610169491525424e-05, 'epoch': 0.0851063829787234}
{'loss': 0.9874, 'grad_norm': 0.32032981514930725, 'learning_rate': 3.35593220338983e-05, 'epoch': 0.1702127659574468}
{'eval_loss': 0.7535689473152161, 'eval_runtime': 104.9298, 'eval_samples_per_second': 18.022, 'eval_steps_per_second': 0.572, 'epoch': 0.1702127659574468}
{'loss': 0.5811, 'grad_norm': 0.3375454545021057, 'learning_rate': 5.050847457627119e-05, 'epoch': 0.2553191489361702}
{'loss': 0.4506, 'grad_norm': 0.23045852780342102, 'learning_rate': 5.867867867867868e-05, 'epoch': 0.3404255319148936}
{'eval_loss': 0.4344872236251831, 'eval_runtime': 103.745, 'eval_samples_per_second': 18.227, 'eval_steps_per_second': 0.578, 'epoch': 0.3404255319148936}
{'loss': 0.4457, 'grad_norm': 0.19075872004032135, 'learning_rate': 5.567567567567567e-05, 'epoch': 0.425531914893617}
{'loss': 0.4257, 'grad_norm': 0.5533307

In [17]:
# Interactive Testing on Full Test Dataset with Unsloth
print("\n--- Interactive Testing on Full Test Dataset (Unsloth) ---")
# model_sft, tokenizer_sft = FastLanguageModel.from_pretrained(
#     model_name = "qwen32b", # YOUR MODEL YOU USED FOR TRAINING
#     load_in_4bit = True,
# )
# # Enable faster inference with Unsloth
# FastLanguageModel.for_inference(model_sft)

if 'model_sft' in locals() and 'tokenizer_sft' in locals() and not df_test.empty:
    print(f"Running interactive testing on {len(df_test)} test samples...")

    correct_predictions = 0
    total_predictions = 0
    all_actual_labels = []
    all_predicted_labels = []

    for idx, row in df_test.iterrows():
        # Get the test data
        post = row[SUMMARY_COLUMN]
        comment = row[COMMENT_COLUMN]
        actual_label = row[LABEL_COLUMN]
        
        # Create user content
        user_content = create_user_content(post, comment)
        
        # Use the same format as in training, but without the response
        instruction = """Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không."""
        
        # Format prompt for inference - notice we stop at "### Response:" and let the model continue
        formatted_input = f"### Instruction: {instruction}\n\n### Input: {user_content}\n\n### Response:"
        
        # Tokenize input
        inputs = tokenizer_sft([formatted_input], return_tensors="pt").to(model_sft.device)
        
        # Generate response
        output_ids = model_sft.generate(
            **inputs,
            max_new_tokens=20,
            do_sample=True,
            top_p=0,
            top_k=1,
            temperature=0.1,
            repetition_penalty=1.05,
            pad_token_id=tokenizer_sft.eos_token_id,
            eos_token_id=tokenizer_sft.eos_token_id
        )
        
        # Decode the response
        assistant_response = tokenizer_sft.decode(
            output_ids[0, inputs.input_ids.shape[1]:],
            skip_special_tokens=True
        ).strip()
        
        # Extract predicted label using existing logic
        extracted_label = "NULL"
        normalized_response = re.sub(r'[^\w_]', '', assistant_response.upper().replace(" ", "_"))
        normalized_response = re.sub(r'_+', '_', normalized_response)

        for variant in POSSIBLE_LABELS_VARIANTS_FOR_MATCHING:
            if variant in normalized_response:
                if variant in POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING:
                    original_label_index = POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING.index(variant)
                    extracted_label = POSSIBLE_LABELS[original_label_index]
                else:
                    for pl_original in POSSIBLE_LABELS:
                        if pl_original.upper() == variant:
                            extracted_label = pl_original
                            break
                break

        # Track results
        all_actual_labels.append(actual_label)
        all_predicted_labels.append(extracted_label)
        total_predictions += 1

        if extracted_label == actual_label:
            correct_predictions += 1

        # Print detailed results for all samples
        print(f"\nSample {total_predictions}:")
        print(f"  Assistant Response: {assistant_response}")
        print(f"  Predicted: {extracted_label} | Actual: {actual_label} | {'✓' if extracted_label == actual_label else '✗'}")

        # Print progress every 50 samples
        if total_predictions % 50 == 0:
            current_accuracy = correct_predictions / total_predictions
            print(f"\n=== Progress Update ===")
            print(f"Processed {total_predictions} samples. Current accuracy: {current_accuracy:.4f}")
            print("=" * 40)

    # Final results
    final_accuracy = correct_predictions / total_predictions if total_predictions > 0 else 0
    print(f"\n=== Final Test Results ===")
    print(f"Total samples processed: {total_predictions}")
    print(f"Correct predictions: {correct_predictions}")
    print(f"Test Accuracy: {final_accuracy:.4f}")

    # Classification report
    if all_actual_labels and all_predicted_labels:
        print("\nTest Classification Report:")
        print(classification_report(
            all_actual_labels,
            all_predicted_labels,
            labels=POSSIBLE_LABELS,
            target_names=POSSIBLE_LABELS,
            zero_division=0
        ))

else:
    if 'model_sft' not in locals() or 'tokenizer_sft' not in locals():
        print("Fine-tuned model or tokenizer not available. Please run the fine-tuning section first.")
    if df_test.empty:
        print("Test dataset is empty.")


--- Interactive Testing on Full Test Dataset (Unsloth) ---
Running interactive testing on 1892 test samples...

Sample 1:
  Assistant Response: KHONG_PHAN_DONG
  Predicted: KHONG_PHAN_DONG | Actual: KHONG_LIEN_QUAN | ✗

Sample 2:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 3:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 4:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 5:
  Assistant Response: PHAN_DONG
  Predicted: PHAN_DONG | Actual: PHAN_DONG | ✓

Sample 6:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_LIEN_QUAN | ✓

Sample 7:
  Assistant Response: PHAN_DONG
  Predicted: PHAN_DONG | Actual: PHAN_DONG | ✓

Sample 8:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted: KHONG_LIEN_QUAN | Actual: KHONG_PHAN_DONG | ✗

Sample 9:
  Assistant Response: KHONG_LIEN_QUAN
  Predicted

In [22]:
# Interactive Testing on Full Test Dataset with Unsloth
print("\n--- Interactive Testing on Full Test Dataset (Unsloth) ---")
# model_sft, tokenizer_sft = FastLanguageModel.from_pretrained(
#     model_name = "qwen32b", # YOUR MODEL YOU USED FOR TRAINING
#     load_in_4bit = True,
# )
# # Enable faster inference with Unsloth
# FastLanguageModel.for_inference(model_sft)

if 'model_sft' in locals() and 'tokenizer_sft' in locals() and not df_test.empty:
    print(f"Running interactive testing on {len(df_test)} test samples...")

    correct_predictions = 0
    total_predictions = 0
    all_actual_labels = []
    all_predicted_labels = []

    for idx, row in df_test.iterrows():
        # Get the test data
        post = row[SUMMARY_COLUMN]
        comment = row[COMMENT_COLUMN]
        actual_label = row[LABEL_COLUMN]
        
        # Create user content
        user_content = create_user_content(post, comment)
        
        # Use the same format as in training, but without the response
        instruction = """Phân loại bình luận mạng xã hội vào một trong ba nhóm: PHAN_DONG, KHONG_PHAN_DONG, hoặc KHONG_LIEN_QUAN. Phân tích cả bình luận và ngữ cảnh bài đăng để xác định bình luận có tính chất phản động đối với nhà nước Việt Nam hay không.
        #Trả lời bằng nhãn phân loại sau đó đưa ra giải thích e.g. Response: PHAN_DONG \n Giải thích: *giải thích* """
        
        # Format prompt for inference - notice we stop at "### Response:" and let the model continue
        formatted_input = f"### Instruction: {instruction}\n\n### Input: {user_content}\n\n### Response:"
        
        # Tokenize input
        inputs = tokenizer_sft([formatted_input], return_tensors="pt").to(model_sft.device)
        
        # Generate response
        output_ids = model_sft.generate(
            **inputs,
            max_new_tokens=256,
            do_sample=True,
            top_p=0.8,
            top_k=20,
            temperature=0.4,
            repetition_penalty=1.05,
            pad_token_id=tokenizer_sft.eos_token_id,
            eos_token_id=tokenizer_sft.eos_token_id
        )
        
        # Decode the response
        assistant_response = tokenizer_sft.decode(
            output_ids[0, inputs.input_ids.shape[1]:],
            skip_special_tokens=True
        ).strip()
        
        # Extract predicted label using existing logic
        extracted_label = "NULL"
        normalized_response = re.sub(r'[^\w_]', '', assistant_response.upper().replace(" ", "_"))
        normalized_response = re.sub(r'_+', '_', normalized_response)

        for variant in POSSIBLE_LABELS_VARIANTS_FOR_MATCHING:
            if variant in normalized_response:
                if variant in POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING:
                    original_label_index = POSSIBLE_LABELS_NORMALIZED_FOR_MATCHING.index(variant)
                    extracted_label = POSSIBLE_LABELS[original_label_index]
                else:
                    for pl_original in POSSIBLE_LABELS:
                        if pl_original.upper() == variant:
                            extracted_label = pl_original
                            break
                break

        # Track results
        all_actual_labels.append(actual_label)
        all_predicted_labels.append(extracted_label)
        total_predictions += 1

        if extracted_label == actual_label:
            correct_predictions += 1

        # Print detailed results for all samples
        print(f"\n-----------------------------------------Sample {total_predictions}:-----------------------------------------")
        print(f"Post: \n{post}")
        print(f"Comment: {comment}")
        print(f"\nAssistant Response: {assistant_response}")
        print(f"\nPredicted: {extracted_label} | Actual: {actual_label} | {'✓' if extracted_label == actual_label else '✗'}")
        # Print progress every 50 samples
        if total_predictions % 50 == 0:
            current_accuracy = correct_predictions / total_predictions
            print(f"\n=== Progress Update ===")
            print(f"Processed {total_predictions} samples. Current accuracy: {current_accuracy:.4f}")
            print("=" * 40)

    # Final results
    final_accuracy = correct_predictions / total_predictions if total_predictions > 0 else 0
    print(f"\n=== Final Test Results ===")
    print(f"Total samples processed: {total_predictions}")
    print(f"Correct predictions: {correct_predictions}")
    print(f"Test Accuracy: {final_accuracy:.4f}")

    # Classification report
    if all_actual_labels and all_predicted_labels:
        print("\nTest Classification Report:")
        print(classification_report(
            all_actual_labels,
            all_predicted_labels,
            labels=POSSIBLE_LABELS,
            target_names=POSSIBLE_LABELS,
            zero_division=0
        ))

else:
    if 'model_sft' not in locals() or 'tokenizer_sft' not in locals():
        print("Fine-tuned model or tokenizer not available. Please run the fine-tuning section first.")
    if df_test.empty:
        print("Test dataset is empty.")


--- Interactive Testing on Full Test Dataset (Unsloth) ---
Running interactive testing on 1892 test samples...

-----------------------------------------Sample 1:-----------------------------------------
Post: 
1. Nội dung sơ lược: Bài viết kể về cuộc sống sung túc của một gia đình ở miền Nam trước năm 1975, sau đó bị đảo lộn do 'giải phóng'. Tác giả bày tỏ sự tiếc nuối và đau khổ về những mất mát mà gia đình và đồng bào phải chịu đựng.

2. Vấn đề: Tính chủ quan trong việc đánh giá về giai đoạn lịch sử. Mặc dù thể hiện nỗi đau cá nhân, nhưng có thể bị lợi dụng để xuyên tạc lịch sử.

3. Phản động/tin giả: Có thể. Mặc dù bài viết chủ yếu thể hiện nỗi đau cá nhân, nhưng việc tập trung vào những mất mát và sử dụng ngôn ngữ gợi nhớ về một 'hòn ngọc viễn đông' có thể bị lợi dụng để xuyên tạc lịch sử và kích động tâm lý chống đối.
Comment: bám đít mỹ có miến ăn hả

Assistant Response: KHONG_PHAN_DONG 
Giải thích: Bình luận ngắn gọn "bám đít mỹ có miến ăn hả" mang tính chất châm biếm, chỉ trí

KeyboardInterrupt: 

# Live predicting

In [None]:
conversation = [{"role": "system", "content": SYSTEM_PROMPT_CONTENT }]
while True:
    post = input("Nội dung bài viết: ")
    comment = input("Bình luận cần đánh giá: ")
    if post.lower() == "reset":
        conversation = [{"role": "system", "content": SYSTEM_PROMPT_CONTENT }]
        print("The chat history has been cleared!")
        continue

    conversation.append({"role": "user", "content": create_user_content(post,comment) })
    input_ids = ft_tokenizer.apply_chat_template(conversation, return_tensors="pt").to(ft_model.device)

    out_ids = ft_model.generate(
        input_ids=input_ids,
        max_new_tokens=768,
        do_sample=True,
        top_p=0.95,
        top_k=40,
        temperature=0.1,
        repetition_penalty=1.05,
    )
    assistant = ft_tokenizer.batch_decode(out_ids[:, input_ids.size(1): ], skip_special_tokens=True)[0].strip()
    print("Assistant: ", assistant)
    conversation.append({"role": "assistant", "content": assistant })