# CIDAR/Alpagasus LORA Models Notebook
This notebook demonstrates how to use the `LORA` models finetunes on `CIDAR` and `alpagasus_cleaned_ar` datasets

In [27]:
#!pip install peft

In [1]:
from peft import PeftModel, PeftConfig
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

`alpagasus_cleaned_ar` fine-tuned model

In [20]:
peft_model_id = "Deema/lora-alpaca_alpagasus_ar"

config = PeftConfig.from_pretrained(peft_model_id)
tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, device_map="auto")
model = PeftModel.from_pretrained(model, peft_model_id, device_map="auto")



test on an example from the training dataset: https://huggingface.co/datasets/arbml/alpagasus_cleaned_ar

In [30]:
# instruction = "ابحث عن عاصمة كندا. أخرج اسم المدينة."
instruction = "أعطني قائمة بنصائح فعالة لتحسين التواصل."
input_text = (f"أجب باللغة العربية ### Instruction:\n{instruction}\n### Response:\n")
input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to(model.device)
output_ids = model.generate(input_ids=input_ids, do_sample=True, max_length=126, num_beams=5, num_return_sequences=5)

for output_id in output_ids:
    print(tokenizer.decode(output_id, skip_special_tokens=True))

أجب باللغة العربية ### Instruction:
أعطني قائمة بنصائح فعالة لتحسين التواصل.
### Response:


أجب باللغة العربية ### Instruction:
أعطني قائمة بنصائح فعالة لتحسين التواصل.
### Response:

1. استخدام اللغة العربية الفصحى .
2. تجنب استخدام الألفاظ العامية .
3. ا
أجب باللغة العربية ### Instruction:
أعطني قائمة بنصائح فعالة لتحسين التواصل.
### Response:

1. استخدام كلمات بسيطة ومفهومة .
2. استخدام لغة الجسد .
3. استخد
أجب باللغة العربية ### Instruction:
أعطني قائمة بنصائح فعالة لتحسين التواصل.
### Response:

1. استخدام اللغة العربية الفصحى .
2. تجنب استخدام الألفاظ العامية .
3. ت
أجب باللغة العربية ### Instruction:
أعطني قائمة بنصائح فعالة لتحسين التواصل.
### Response:

1. استخدام اللغة العربية الفصحى .
2. تجنب استخدام الألفاظ العامية .
3. الت


`CIDAR` fine-tuned model

In [34]:
peft_model_id = "khalidalt/Acegpt-7b-chat-lora"

config = PeftConfig.from_pretrained(peft_model_id)
tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, device_map="auto")
model = PeftModel.from_pretrained(model, peft_model_id, device_map="auto")

HFValidationError: Repo id must be in the form 'repo_name' or 'namespace/repo_name': '/media/khalid/HDD2/Huggingface_models/aceGPT-7B'. Use `repo_type` argument if needed.

test on an example from the training dataset: https://huggingface.co/datasets/khalidalt/CIDAR

In [None]:
# instruction = "ابحث عن عاصمة كندا. أخرج اسم المدينة."
instruction = ".أنشئ جملة تضم الكلمة التالية: يضيء"
input_text = (f"أجب باللغة العربية ### Instruction:\n{instruction}\n### Response:\n")
input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to(model.device)
output_ids = model.generate(input_ids=input_ids, do_sample=True, max_length=126, num_beams=5, num_return_sequences=5)

for output_id in output_ids:
    print(tokenizer.decode(output_id, skip_special_tokens=True))