In [1]:
import warnings
import gc
warnings.filterwarnings('ignore')

In [2]:
import torch
import evaluate
import pandas as pd
from tqdm import tqdm
from peft import PeftModel, PeftConfig
from transformers import BitsAndBytesConfig, AutoTokenizer, AutoModelForCausalLM, DataCollatorForLanguageModeling
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tqdm.pandas()
gc.collect()
torch.manual_seed(42)

bin d:\PythonVenv\lib\site-packages\bitsandbytes\libbitsandbytes_cuda118.dll


<torch._C.Generator at 0x29fd3cd6af0>

In [None]:
full_data_test = pd.read_csv('../dataset/full_test_data_summarization.csv')

In [3]:
checkpoint = './model_checkpoint/new-checkpoint/'

In [None]:
config = PeftConfig.from_pretrained(checkpoint)
base_model = AutoModelForCausalLM.from_pretrained(
    config.base_model_name_or_path,
    device_map={"":0},
    torch_dtype=torch.bfloat16,
    attn_implementation="flash_attention_2",
    quantization_config=BitsAndBytesConfig(    
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type='nf4',
        bnb_4bit_compute_dtype=torch.bfloat16
    ),
    token="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"
)
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
tokenizer.padding_side = "left"

In [None]:
model = PeftModel.from_pretrained(base_model, checkpoint, device_map={"":0})
model.eval()

In [None]:
qdora_merged = ""
model = AutoModelForCausalLM.from_pretrained(
    qdora_merged,
    device_map={"":0},
    torch_dtype=torch.bfloat16,
    attn_implementation="flash_attention_2",
)
tokenizer = AutoTokenizer.from_pretrained(qdora_merged)
tokenizer.padding_side = "left"
model.eval()

In [None]:
def create_prompt(sample):
    template = """<s>[INST] Bạn là một trợ lí AI tiếng Việt hữu ích. Bạn hãy tóm lược ngắn gọn nội dung chính của văn bản sau:
{} [/INST] """
    prompt = template.format(sample)
    return prompt

In [None]:
text = """Ngô Phương Lan được biết đến nhiều hơn khi đăng quang Hoa hậu Thế giới Người Việt năm 2007. Cô là người đẹp xuất thân trong gia đình có truyền thống về ngoại giao. Chính vì vậy, từ khi còn rất nhỏ, Ngô Phương Lan đã mong ước trở thành một nhà ngoại giao tài ba. Được biết, Ngô Phương Lan từng theo cha mẹ sang Mỹ sinh sống và được tổng thống Mỹ Bill Clinton trao tặng bằng khen vì thành tích học tập cao ở trường Tiểu học New York. Trong loạt ảnh thời thơ ấu của Hoa hậu có thể thấy, Ngô Phương Lan sở hữu ngoại hình đáng yêu, nụ cười sáng. Ngô Phương Lan đã tốt nghiệp ngành Quan hệ quốc tế tại đại học Genève (Thuỵ Sĩ) với bản luận văn xuất sắc và được đánh giá rất cao về đề tài văn hoá - lịch sử. Chia sẻ về bức ảnh lúc nhỏ, Hoa hậu Ngô Phương Lan vui vẻ cho biết: "Chưa đầy 4 tuổi đã đội vương miện và có riêng một đội bodyguards.. mình phục mình quá". Hình ảnh của Hoa hậu Ngô Phương Lan bên bố mẹ và chị gái cách đây 26 năm. Thời điểm đó, cô đang háo hức cùng gia đình chuẩn bị cho mùa Giáng sinh đầu tiên trên đất Mỹ. Từ nhỏ, Hoa hậu Ngô Phương Lan đã có cuộc sống sung sướng bên bố mẹ. Cô được học hành trong điều kiện tốt. Hoa hậu Ngô Phương Lan bên chồng Tây, chị gái và bố mẹ. Nhan sắc xinh đẹp mặn mà của Hoa hậu Ngô Phương Lan."""
abstract = """Không chỉ sở hữu vẻ xinh xắn, đáng yêu từ nhỏ, Hoa hậu Ngô Phương Lan còn từng được tổng thống Mỹ Bill Clinton trao tặng bằng khen vì thành tích học tập cao ở trường Tiểu học New York."""
inputs = tokenizer(create_prompt(text), add_special_tokens=True, padding=True, return_tensors="pt").to(device)
outputs = model.generate(
  **inputs,
  early_stopping=False,
  max_new_tokens=768,
  temperature=0.1,
  top_p=0.95,
  top_k=40,
  repetition_penalty=1.05,
  pad_token_id=tokenizer.unk_token_id
)
tokenizer.decode(outputs[0], skip_special_tokens=True, clean_up_tokenization_spaces=False).split('[/INST]')[1].strip()

In [8]:
references = []
predictions = []
def generate_text():
  for batch_1, batch_2 in tqdm(zip(torch.utils.data.DataLoader(full_data_test['context'], batch_size=32, shuffle=False), torch.utils.data.DataLoader(full_data_test['summarization'], batch_size=32, shuffle=False), strict=True), total=int(round(len(full_data_test)/32, 0))):
    prompts = [create_prompt(context) for context in batch_1]
    inputs = tokenizer(prompts, add_special_tokens=True, padding=True, return_tensors="pt").to(device)
    outputs = model.generate(
      **inputs,
      early_stopping=False,
      max_new_tokens=1024,
      temperature=0.7,
      top_p=0.8,
      top_k=50,
      repetition_penalty=1.2,
      pad_token_id=tokenizer.unk_token_id
    )
    references.extend(batch_2)
    predictions.extend([tokenizer.decode(output, skip_special_tokens=True, clean_up_tokenization_spaces=False).split('[/INST]')[1].strip() for output in outputs])
    torch.cuda.empty_cache()

In [None]:
references = []
predictions = []
def generate_text():
  for batch_1, batch_2 in tqdm(zip(torch.utils.data.DataLoader(full_data_test['context'], batch_size=32, shuffle=False), torch.utils.data.DataLoader(full_data_test['summarization'], batch_size=32, shuffle=False), strict=True), total=int(round(len(full_data_test)/32, 0))):
    prompts = [create_prompt(context) for context in batch_1]
    inputs = tokenizer(prompts, add_special_tokens=True, padding=True, return_tensors="pt").to(device)
    outputs = model.generate(
      **inputs,
      early_stopping=False,
      max_new_tokens=1024,
      temperature=0.7,
      top_k=10,
      penalty_alpha=0.8,
      repetition_penalty=1.2,
      pad_token_id=tokenizer.eos_token_id
    )
    references.extend(batch_2)
    predictions.extend([tokenizer.decode(output, skip_special_tokens=True, clean_up_tokenization_spaces=False).split('[/INST]')[1].strip() for output in outputs])
    torch.cuda.empty_cache()

In [None]:
generate_text()

In [None]:
full_data_test['summarization_predictions'] = predictions

In [None]:
rouge_metric = evaluate.load("rouge")
rouge_scores = rouge_metric.compute(references=references, predictions=predictions, use_stemmer=True, rouge_types=['rouge1', 'rouge2', 'rougeL'])

In [11]:
rouge_scores

{'rouge1': 0.6073709993163005,
 'rouge2': 0.3535813077835422,
 'rougeL': 0.4224855441941776}

In [12]:
full_data_test.to_csv('test_mistral_lora_v2.csv', index=False)