In [None]:
# This Python 3 environment comes with many helpful analytics libraries installed
# It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python
# For example, here's several helpful packages to load

import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# Input data files are available in the read-only "../input/" directory
# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directory

import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))

# You can write up to 20GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All" 
# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session

In [None]:
pip install transformers peft accelerate bitsandbytes torch datasets

In [None]:
import json
from datasets import Dataset

def format_data(example):

    template = "<s>[INST] {prompt} [/INST] {label} </s>"
    
    # Loại bỏ các ký tự \n không cần thiết trong prompt nếu có để tránh lỗi format
    prompt_cleaned = example['prompt'].replace('\n', ' ') 
    return {"text": template.format(prompt=prompt_cleaned, label=example['label'])}

# Load dữ liệu gốc
with open('/kaggle/input/cmcccc/CMC_dataset_list.json', 'r', encoding='utf-8') as f:
    data = json.load(f)

# Chuyển đổi định dạng
formatted_data = [format_data(item) for item in data]

# Tạo Hugging Face Dataset
dataset = Dataset.from_list(formatted_data)

# (Optional) Chia train/validation set
dataset = dataset.train_test_split(test_size=0.2)



In [None]:
pip install trl

In [None]:
from huggingface_hub import login

# --- Bước 0: Đăng nhập vào Hugging Face ---
# Thay "YOUR_HF_TOKEN" bằng API token của bạn từ https://huggingface.co/settings/tokens
login("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") 

In [None]:
from transformers import AutoTokenizer

model_name = "meta-llama/Meta-Llama-Guard-2-8B"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

# Set the pad_token
tokenizer.pad_token = tokenizer.eos_token

def preprocess(example):
    return tokenizer(
        example['text'],
        truncation=True,
        max_length=512,
        padding='max_length'
    )

# Assuming you have a dataset loaded as 'dataset'
dataset = dataset.map(preprocess)

In [None]:
pip install git+https://github.com/huggingface/trl

In [None]:
pip install -U bitsandbytes`

In [None]:
pip install bitsandbytes accelerate


In [None]:
pip install transformers peft accelerate bitsandbytes torch datasets

In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, TrainingArguments
from peft import LoraConfig, PeftModel, get_peft_model, prepare_model_for_kbit_training
from trl import SFTTrainer
from huggingface_hub import login

# --- Bước 0: Đăng nhập vào Hugging Face ---
# Thay "YOUR_HF_TOKEN" bằng API token của bạn từ https://huggingface.co/settings/tokens
login("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") 

# --- 1. Cấu hình Quantization (giảm bộ nhớ) ---
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,                     # Load model ở dạng 4-bit
    bnb_4bit_quant_type="nf4",             # Kiểu quantization (nf4 thường hiệu quả)
    bnb_4bit_compute_dtype=torch.bfloat16, # Kiểu dữ liệu tính toán
    bnb_4bit_use_double_quant=True,        # Dùng double quantization
)

# --- 2. Load Model và Tokenizer ---
# Sử dụng LLaMA Guard model mà bạn đã có quyền truy cập
model_name = "meta-llama/Meta-Llama-3-8B-Instruct"  

# Token cache trong transformers sẽ tự động sử dụng token đã đăng nhập
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    quantization_config=bnb_config,
    device_map="auto",                # Tự động phân bổ model lên các GPU có sẵn
    trust_remote_code=True            # Cần thiết cho một số model
)

model.config.use_cache = False        # Tắt cache để tương thích với gradient checkpointing
model.config.pretraining_tp = 1       # Cần thiết khi dùng TRL với model LLaMA

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

# Kiểm tra và thiết lập pad_token nếu cần
if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token 
tokenizer.padding_side = "right"      # Để tránh vấn đề với padding bên trái khi tạo attention mask

# --- 3. Cấu hình LoRA ---
# Điều chỉnh target_modules cho phù hợp với kiến trúc LLaMA Guard
peft_config = LoraConfig(
    r=16,                # Rank của ma trận LoRA
    lora_alpha=32,       # Alpha scaling (thường gấp đôi r)
    target_modules=[     # Tên layers cho LLaMA
        "q_proj",
        "k_proj",
        "v_proj",
        "o_proj",
        "gate_proj", 
        "up_proj", 
        "down_proj"
    ],
    lora_dropout=0.05,   # Dropout cho LoRA layers
    bias="none",
    task_type="CAUSAL_LM", # Loại tác vụ
)

# Chuẩn bị model cho K-bit training và thêm adapter LoRA
model = prepare_model_for_kbit_training(model)
model = get_peft_model(model, peft_config)
model.print_trainable_parameters()    # In ra số lượng tham số cần train (rất nhỏ so với tổng)

# --- 4. Cấu hình Training Arguments ---
training_args = TrainingArguments(
    output_dir="./llama_guard_finetuned",   # Thư mục lưu kết quả 
    per_device_train_batch_size=2,          # Batch size nhỏ do giới hạn VRAM
    gradient_accumulation_steps=4,          # Tích lũy gradient để mô phỏng batch size lớn hơn (2*4=8)
    learning_rate=2e-4,                     # Learning rate thường cao hơn một chút cho LoRA
    num_train_epochs=1,                     # Số epochs
    logging_steps=10,                       # Log thông tin training sau mỗi 10 steps
    save_steps=50,                          # Lưu checkpoint sau mỗi 50 steps
    fp16=False,                             # Sử dụng mixed precision
    bf16=True,                              # Sử dụng bfloat16
    max_grad_norm=0.3,                      # Gradient clipping
    warmup_ratio=0.03,                      # Tỉ lệ warmup steps
    lr_scheduler_type="constant",           # Hoặc "cosine"
    report_to="tensorboard",                # Hoặc "wandb" nếu dùng
)

# --- 5. Khởi tạo Trainer ---
# Xóa tham số tokenizer khỏi SFTTrainer
trainer = SFTTrainer(
    model=model,
    train_dataset=dataset["train"],          # Dataset đã format ở bước trước
    eval_dataset=dataset["test"],            # Nếu có validation set
    peft_config=peft_config,
    args=training_args,
    # tokenizer đã bị xóa khỏi đây
)

# --- 6. Bắt đầu Training ---
print("Starting training...")
trainer.train()

# --- 7. Lưu Adapter LoRA ---
print("Saving LoRA adapter...")
trainer.save_model("./llama_guard_finetuned/final_adapter")  # Lưu adapter LoRA
tokenizer.save_pretrained("./llama_guard_finetuned/final_adapter")
print("Training finished!")

In [None]:
import shutil

# Đường dẫn thư mục adapter đã lưu
folder_path = "./llama_guard_finetuned/final_adapter"

# Nén thành file ZIP
shutil.make_archive(folder_path, 'zip', folder_path)

print("Zipped successfully! You can now download 'final_adapter.zip'.")


In [None]:
import time

while True:
    print('Awake')
    time.sleep(10 * 60)

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import torch

# Load tokenizer and model
model_id = "microsoft/phi-3-mini-4k-instruct"

tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.float16,
    device_map="auto"  # Dùng GPU nếu có
)

# Tạo prompt theo kiểu chat
def create_prompt(user_input):
    return f"<|user|>\n{user_input}\n<|assistant|>"

# Dùng pipeline để sinh văn bản, KHÔNG set max_new_tokens ở đây
generator = pipeline(
    task="text-generation",
    model=model,
    tokenizer=tokenizer,
    device_map="auto",
    pad_token_id=tokenizer.eos_token_id  # tránh lỗi thiếu pad token
)

# Ví dụ: Tạo prompt từ input người dùng
user_input = "Viết một đoạn văn ngắn giới thiệu về Trái Đất"
formatted_prompt = create_prompt(user_input)

# Sinh văn bản, chỉ định max_new_tokens ở đây
result = generator(formatted_prompt, max_new_tokens=200)

# In kết quả
print(result[0]["generated_text"])


In [None]:
!pip install peft --upgrade
!pip install transformers --upgrade

In [None]:
import pandas as pd
import numpy as np
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from transformers import AutoModelForCausalLM, AutoTokenizer
# Import PeftModel from peft instead of transformers
from peft import PeftModel
from torch.utils.data import DataLoader
import torch
from datasets import Dataset

# --- 1. Chuẩn bị dữ liệu đánh giá từ Dataset đã tiền xử lý ---
# Giả sử bạn đã có dataset['test'] sau khi chia train/test
eval_dataset = dataset['test']

# Hàm để trích xuất predictions từ logits
def extract_predictions(logits):
    # Điều chỉnh hàm này dựa trên cách mô hình của bạn dự đoán giá trị
    # Ví dụ, nếu logits trực tiếp là giá trị dự đoán:
    return logits.squeeze(dim=-1).cpu().numpy()
    # Hoặc nếu bạn cần lấy token cuối cùng và coi nó là giá trị:
    # return logits[:, -1, :].argmax(dim=-1).cpu().numpy() # Nếu là phân loại token
    # Hoặc một phương pháp khác tùy thuộc vào mô hình của bạn

# Hàm để trích xuất ground truth từ labels
def extract_ground_truth(labels):
    # Giả định labels là tensor chứa giá trị số
    return labels.squeeze(dim=-1).cpu().numpy()

# --- 2. Tải mô hình và tokenizer đã tinh chỉnh ---
adapter_path = "./cmc_llama_finetuned/final_adapter"
model_name = "microsoft/Phi-3-mini-4k-instruct" # Đảm bảo đây là tên chính xác

tokenizer = AutoTokenizer.from_pretrained(adapter_path, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True)
model = PeftModel.from_pretrained(model, adapter_path)
model.eval().to("cuda" if torch.cuda.is_available() else "cpu")

# --- 3. Cấu hình DataLoader cho dữ liệu đánh giá ---
eval_dataloader = DataLoader(eval_dataset, batch_size=8) # Điều chỉnh batch size nếu cần

# --- 4. Thực hiện đánh giá ---
predictions = []
ground_truth = []

with torch.no_grad():
    for batch in eval_dataloader:
        input_ids = batch['input_ids'].to("cuda" if torch.cuda.is_available() else "cpu")
        attention_mask = batch['attention_mask'].to("cuda" if torch.cuda.is_available() else "cpu")
        labels = batch['labels'].to("cuda" if torch.cuda.is_available() else "cpu")

        outputs = model(input_ids=input_ids, attention_mask=attention_mask)

        # Lấy logits từ output
        logits = outputs.logits

        # Trích xuất giá trị dự đoán và ground truth
        batch_predictions = extract_predictions(logits)
        batch_ground_truth = extract_ground_truth(labels)

        predictions.extend(batch_predictions)
        ground_truth.extend(batch_ground_truth)

# Chuyển về numpy arrays để tính toán metrics
predictions = np.array(predictions)
ground_truth = np.array(ground_truth)

# --- 5. Tính toán và in ra các metrics đánh giá ---
mse = mean_squared_error(ground_truth, predictions)
rmse = np.sqrt(mse)
mae = mean_absolute_error(ground_truth, predictions)
r_squared = r2_score(ground_truth, predictions)

print(f"Mean Squared Error (MSE): {mse:.4f}")
print(f"Root Mean Squared Error (RMSE): {rmse:.4f}")
print(f"Mean Absolute Error (MAE): {mae:.4f}")
print(f"R-squared: {r_squared:.4f}")

In [None]:

!pip install peft
!pip install transformers