# 1. Tải thư viện

In [2]:
import os
os.chdir("./llama-recipes")


In [None]:
!pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121
!pip install -U pip setuptools
!pip install --extra-index-url https://download.pytorch.org/whl/test/cu118 -e .
!pip install -r ./requirements.txt

# 2. Tiền xử lý dữ liệu

## 2.1 Xử lý dữ liệu theo format

In [None]:
!python ../preprocessDataset.py

## 2.2 Dịch tập ngữ liệu sang tiếng việt

In [None]:
!python ../translateDataset.py --batch_size 8 --file_path_input ./data/train_valid.json  --file_path_output ./llama-recipes/src/llama_recipes/datasets/statista_data.json
!python ../translateDataset.py --batch_size 8 --file_path_input ./data/test.json  --file_path_output ./data/test_vn.json

# 3. Huấn luyện mô hình

In [None]:
!python -c "from huggingface_hub.hf_api import HfFolder; HfFolder.save_token('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')"

***
```php
Lựa chọn 1 trong 2 mô hình để chạy
```

Mô hình LLaMA2

In [None]:
Base_model = "meta-llama/Meta-Llama-2-7B"
Improved_model = "XMin08/Model_Llama2_new_v1"

Mô hình LLaMA3

In [None]:
Base_model = "meta-llama/Meta-Llama-3-8B"
Improved_model = "XMin08/Model_Llama3_new_v1"

***
## 3.1 Huấn luyện mô hình

In [None]:
!python -m llama_recipes.finetuning --context_length 1 --model_name Base_model --use_peft --peft_method lora --quantization --batch_size_training 1 --num_epochs 3 --use_fp16 --save_metrics --output_dir "../model_adapter/"

## 3.2 Kết hợp mô hình gốc và đưa lên huggingface

In [None]:
import torch
from peft import PeftModel
from transformers import LlamaForCausalLM, LlamaTokenizer

lora_weights = "../model_adapter/"

model = LlamaForCausalLM.from_pretrained(
        Base_model,
        load_in_8bit=False,
        torch_dtype=torch.float16,
        device_map="auto",
        offload_folder="tmp")

tokenizer = LlamaTokenizer.from_pretrained(
    Base_model
)

model = PeftModel.from_pretrained(
    model,
    lora_weights,
    torch_dtype=torch.float16,
    device_map="auto",
    offload_folder="tmp",
)

model = model.merge_and_unload()

model.push_to_hub(Improved_model)
tokenizer.push_to_hub(Improved_model)

# 4. Đánh giá văn bản

## 4.1 Tải mô hình

In [None]:
import torch
from peft import PeftModel
from transformers import LlamaForCausalLM, LlamaTokenizer

lora_weights = "../model_adapter/"

tokenizer = LlamaTokenizer.from_pretrained(Base_model)
model = LlamaForCausalLM.from_pretrained(
    Base_model,
    load_in_8bit=False,
    torch_dtype=torch.float16,
    device_map="auto",
)
model = PeftModel.from_pretrained(
    model,
    lora_weights,
    torch_dtype=torch.float16,
)

model.config.pad_token_id = tokenizer.pad_token_id = 0  # unk
model.config.bos_token_id = 1
model.config.eos_token_id = 2

## 4.2 Quá trình sinh câu dự đoán cho việc tóm tắt văn bản

In [None]:
from datasets import load_dataset
import json
from random import randint
from transformers import GenerationConfig


with open("../data/test_vn.json", "r", encoding="utf-8") as file:
    dataset = json.load(file)

prompt = """
              Below is an instruction that describes a task, paired with an input that provides further context.
              Write a response that appropriately completes the request.

### Instruction:\n{}\n\n### Input:\n{}\n\n### Response:
"""
Predicts = []
References = []

generation_config = GenerationConfig(
    temperature=0.1,
    top_p=0.75,
    top_k=40,
    num_beams=4,
    do_sample = True
)

for index, item in enumerate(dataset):
    print(f"Processing item index: {index}")
    prompt_sentence = prompt.format(item['instruction'], item['input'])
    inputs = tokenizer(prompt_sentence, return_tensors="pt")
    input_ids = inputs["input_ids"].to("cuda")
    generation_output = model.generate(
            input_ids=input_ids,
            generation_config=generation_config,
            return_dict_in_generate=True,
            output_scores=True,
            max_new_tokens=512,
        )
    s = generation_output.sequences[0]
    output = tokenizer.decode(s)
    predict = output.split("### Response:")[1].strip().replace("</s>", "")
    Predicts.append(predict)
    References.append(item['output'])

with open("../result/Predictions.json", "w", encoding="utf-8") as file:
    json.dump(Predicts, file, ensure_ascii=False, indent=2)
with open("../result/References.json", "w", encoding="utf-8") as file:
    json.dump(References, file, ensure_ascii=False, indent=2)

## 4.3 Điểm Bleu và Rouge của kết quả dự đoán của mô hình

In [None]:
import evaluate

bleu = evaluate.load("bleu")
rouge = evaluate.load('rouge')
results_bleu = bleu.compute(predictions = Predicts, references = References)
results_rouge = rouge.compute(predictions = Predicts, references = References)
print("Bleu score : ", results_bleu)
print("Rouge score: ", results_rouge)