In [1]:
import warnings
import gc
warnings.filterwarnings('ignore')

In [2]:
import torch
import evaluate
import pandas as pd
from tqdm import tqdm
from peft import PeftModel, PeftConfig
from transformers import BitsAndBytesConfig, AutoTokenizer, AutoModelForCausalLM, DataCollatorForLanguageModeling
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
tqdm.pandas()
gc.collect()
torch.manual_seed(42)

bin d:\PythonVenv\lib\site-packages\bitsandbytes\libbitsandbytes_cuda118.dll


<torch._C.Generator at 0x29fd3cd6af0>

In [None]:
full_data_test = pd.read_csv('../dataset/full_test_data_summarization.csv')

In [3]:
checkpoint = './model_checkpoint/new-checkpoint/'

In [None]:
config = PeftConfig.from_pretrained(checkpoint)
base_model = AutoModelForCausalLM.from_pretrained(
    config.base_model_name_or_path,
    device_map={"":0},
    torch_dtype=torch.bfloat16,
    attn_implementation="flash_attention_2",
    quantization_config=BitsAndBytesConfig(    
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type='nf4',
        bnb_4bit_compute_dtype=torch.bfloat16
    ),
    token="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"
)
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
tokenizer.padding_side = "left"

In [None]:
model = PeftModel.from_pretrained(base_model, checkpoint, device_map={"":0})
model.eval()

In [None]:
def create_prompt(sample):
    template = """<s>[INST] Bạn là một trợ lý AI. Bạn sẽ được giao một nhiệm vụ. Hãy tóm lược ngắn gọn nội dung sau bằng tiếng Việt:
{} [/INST]"""
    prompt = template.format(sample)
    return prompt

In [None]:
text = """HoREA cho rằng TP.HCM là nơi có khối lượng công việc hành chính, dịch vụ công, trong đó có công tác cấp giấy chứng nhận quyền sử dụng đất (sổ đỏ) rất lớn, gấp nhiều lần khối lượng ở các tỉnh.Lâu nay, khối lượng công việc cấp sổ đỏ dồn về Sở Tài nguyên - Môi trường, dẫn đến quá tải.Gần đây, khi Nghị định 01/2017/NĐ-CP có hiệu lực ngày 3.3.2017, trong đó có quy định UBND cấp tỉnh căn cứ điều kiện cụ thể tại địa phương để quy định việc cho phép Sở Tài nguyên - Môi trường được ủy quyền cho Văn phòng đăng ký đất đai cấp giấy chứng nhận quyền sử dụng đất.Tuy nhiên, HoREA nói rằng quy định này trên thực tế sẽ chỉ chuyển điểm ùn ứ hồ sơ từ Sở Tài nguyên-Môi trường sang Văn phòng đăng ký đất đai thành phố, chưa đẩy nhanh tiến độ cho người dân. Ngoài ra, theo Nghị định 01/2017/NĐ-CP, Sở Tài nguyên-Môi trường không được phép ủy quyền cấp sổ đỏ cho chi nhánh Văn phòng đăng ký đất đai tại các quận huyện. Do đó, HoREA kiến nghị Chính phủ xem xét sửa đổi, bổ sung Nghị định 01, hoặc cho thí điểm thực hiện việc giao quyền cho chi nhánh Văn phòng đăng ký đất đai tại các quận huyện của TP.HCM, TP.Hà Nội được phép cấp sổ đỏ.Hiệp hội nhận thấy một chiếc áo hành chính không thể mặc vừa cho tất cả 63 tỉnh, thành phố trực thuộc Trung ương. TP.HCM, Hà Nội cần có cơ chế đặc thù riêng để giải quyết các thủ tục hành chính phù hợp với điều kiện của chính quyền đô thị. Do vậy, việc giao quyền cho chi nhánh Văn phòng đăng ký đất đai tại các quận, huyện tại TP.HCM, Hà Nội được cấp giấy chứng nhận quyền sử dụng đất là hết sức cần thiết và cấp bách, giải quyết nhanh và kịp thời nhu cầu của người dân, ông Lê Hoàng Châu Chủ tịch HoREA nhận định.Đáng chú ý,trong khi chờ đợi sửa đổi, Hiệp hội đề xuất UBND TP.HCM ban hành sớm quy chế phối hợp giải quyết thủ tục đất theo Nghị định 01, cho phép Sở Tài nguyên - Môi trường được ủy quyền cho Văn phòng đăng ký đất đai cấp sổ đỏ, đồng thời công bố bộ thủ tục hành chính về đất đai để áp dụng thống nhất trên địa bàn thành phố. Phan Diệu."""
inputs = tokenizer(create_prompt(text), add_special_tokens=True, padding=True, return_tensors="pt").to(device)
outputs = model.generate(
  **inputs,
  early_stopping=False,
  max_new_tokens=1024,
  temperature=0.7,
  top_p=0.8,
  top_k=50,
  repetition_penalty=1.2,
  pad_token_id=tokenizer.unk_token_id
)
tokenizer.decode(outputs[0], skip_special_tokens=True, clean_up_tokenization_spaces=False).split('[/INST]')[1].strip()

In [8]:
references = []
predictions = []
def generate_text():
  for batch_1, batch_2 in tqdm(zip(torch.utils.data.DataLoader(full_data_test['context'], batch_size=32, shuffle=False), torch.utils.data.DataLoader(full_data_test['summarization'], batch_size=32, shuffle=False), strict=True), total=int(round(len(full_data_test)/32, 0))):
    prompts = [create_prompt(context) for context in batch_1]
    inputs = tokenizer(prompts, add_special_tokens=True, padding=True, return_tensors="pt").to(device)
    outputs = model.generate(
      **inputs,
      early_stopping=False,
      max_new_tokens=1024,
      temperature=0.7,
      top_p=0.8,
      top_k=50,
      repetition_penalty=1.2,
      pad_token_id=tokenizer.unk_token_id
    )
    references.extend(batch_2)
    predictions.extend([tokenizer.decode(output, skip_special_tokens=True, clean_up_tokenization_spaces=False).split('[/INST]')[1].strip() for output in outputs])
    torch.cuda.empty_cache()

In [None]:
references = []
predictions = []
def generate_text():
  for batch_1, batch_2 in tqdm(zip(torch.utils.data.DataLoader(full_data_test['context'], batch_size=32, shuffle=False), torch.utils.data.DataLoader(full_data_test['summarization'], batch_size=32, shuffle=False), strict=True), total=int(round(len(full_data_test)/32, 0))):
    prompts = [create_prompt(context) for context in batch_1]
    inputs = tokenizer(prompts, add_special_tokens=True, padding=True, return_tensors="pt").to(device)
    outputs = model.generate(
      **inputs,
      early_stopping=False,
      max_new_tokens=1024,
      temperature=0.7,
      top_k=10,
      penalty_alpha=0.8,
      repetition_penalty=1.2,
      pad_token_id=tokenizer.eos_token_id
    )
    references.extend(batch_2)
    predictions.extend([tokenizer.decode(output, skip_special_tokens=True, clean_up_tokenization_spaces=False).split('[/INST]')[1].strip() for output in outputs])
    torch.cuda.empty_cache()

In [None]:
generate_text()

In [None]:
full_data_test['summarization_predictions'] = predictions

In [None]:
rouge_metric = evaluate.load("rouge")
rouge_scores = rouge_metric.compute(references=references, predictions=predictions, use_stemmer=True, rouge_types=['rouge1', 'rouge2', 'rougeL'])

In [11]:
rouge_scores

{'rouge1': 0.6073709993163005,
 'rouge2': 0.3535813077835422,
 'rougeL': 0.4224855441941776}

In [12]:
full_data_test.to_csv('test_mistral_lora_v2.csv', index=False)