# Install Required Libraries

In [None]:
!pip install transformers torch accelerate
!pip install -U bitsandbytes
!pip install -U accelerate
!pip install -U transformers

Collecting bitsandbytes
  Downloading bitsandbytes-0.44.1-py3-none-manylinux_2_24_x86_64.whl.metadata (3.5 kB)
Downloading bitsandbytes-0.44.1-py3-none-manylinux_2_24_x86_64.whl (122.4 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m122.4/122.4 MB[0m [31m15.8 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: bitsandbytes
Successfully installed bitsandbytes-0.44.1
Collecting transformers
  Downloading transformers-4.46.3-py3-none-any.whl.metadata (44 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.1/44.1 kB[0m [31m2.1 MB/s[0m eta [36m0:00:00[0m
Downloading transformers-4.46.3-py3-none-any.whl (10.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m10.0/10.0 MB[0m [31m74.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: transformers
  Attempting uninstall: transformers
    Found existing installation: transformers 4.46.2
    Uninstalling transformers-4.46.2:
      Successfully uninstalle

# Hugging Face Access Token

In [None]:
from google.colab import drive
from huggingface_hub import login

# Authenticate using your token
login(token="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")


# Load and Initialize SILMA-9B-Instruct-v1.0

## 8-bit

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

# Define the quantization configuration for 8-bit
quantization_config = BitsAndBytesConfig(
    load_in_8bit=True,  # Enable 8-bit quantization
    llm_int8_enable_fp32_cpu_offload=True  # Offload to CPU if GPU memory is insufficient
)

# Load the tokenizer
tokenizer = AutoTokenizer.from_pretrained("silma-ai/SILMA-9B-Instruct-v1.0")

# Load the model with 8-bit quantization
model = AutoModelForCausalLM.from_pretrained(
    "silma-ai/SILMA-9B-Instruct-v1.0",
    quantization_config=quantization_config,  # Apply 8-bit quantization
    device_map="auto"  # Automatically map model to available devices
)

print("Model loaded in 8-bit mode for prompt engineering.")


Loading checkpoint shards:   0%|          | 0/5 [00:00<?, ?it/s]

8-bit model loaded with CPU offloading.


# Define the Chat Function

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
import torch

# Function to interact with the model
def chat_with_silma(messages):
    # Prepare inputs for the model
    input_ids = tokenizer.apply_chat_template(messages, return_tensors="pt", return_dict=True).to("cuda" if torch.cuda.is_available() else "cpu")

    # Generate response
    outputs = model.generate(**input_ids, max_new_tokens=256)

    # Decode the response and return it
    return tokenizer.decode(outputs[0]).split("<start_of_turn>model")[-1].replace("<eos>", "").strip()


# Test Chatting with the Model

In [None]:
# Example conversation
messages = [
    {"role": "system", "content": "أنت مساعد ذكي وجاهز للمساعدة."},
    {"role": "user", "content": "ما اسمك وما غايتك؟"}
]

# Get the model's response
response = chat_with_silma(messages)
print("المساعد:", response)


المساعد: أنا مساعد ذكي من تطوير فريق سيلما. غايتي هي مساعدتك في إنجاز المهام اليومية، وتوفير معلومات مفيدة، وتقديم تجربة إبداعية.


# Interactive Chat Loop

In [None]:
# Function for continuous chatting in Arabic
def interactive_chat():
    messages = [{"role": "system", "content": "أنت مساعد ذكي وجاهز للمساعدة."}]

    while True:
        # Get user input in Arabic
        user_input = input("المستخدم: ")

        # Exit condition
        if user_input.lower() in ["خروج", "إنهاء", "quit", "exit"]:
            print("إنهاء المحادثة...")
            break

        # Append user's message to the conversation
        messages.append({"role": "user", "content": user_input})

        # Get the assistant's response
        response = chat_with_silma(messages)
        print(f"المساعد: {response}\n")

        # Append the assistant's response
        messages.append({"role": "assistant", "content": response})

# Start the chat loop in Arabic
interactive_chat()


المستخدم: السلام عليكم
المساعد: وعليكم السلام ورحمة الله وبركاته

المستخدم: من انت؟
المساعد: أنا مساعد ذكي طوره فريق سيلما.

المستخدم: في مذا تستطيع مساعدتي؟
المساعد: يمكنني مساعدتك في العديد من الأمور، مثل إيجاد معلومات، حل المشكلات، وتقديم النصائح.

المستخدم: هل يمكنك كتابة الشعر؟
المساعد: نعم، يمكنني كتابة الشعر. هل لديك أي موضوع أو فكرة معينة؟

المستخدم: اكتب شعرا عن الجمال
المساعد: الجمال من الداخل والخارج،
يملأ القلب بالبهجة والسرور،
يضيء الحياة ويجعلها أكثر حيوية،
يمنحنا الأمل ويجعلها أكثر إيجابية.

المستخدم: هل يمكنك كتابة القصيدة نفسها بتشكيل الحروف؟
المساعد: نعم، يمكنني كتابة القصيدة بتشكيل الحروف. هل تريد أن أستخدم حروفًا معينة أو شكلًا معينًا؟

المستخدم: اقصد الحركات مثل الفتحة والضمة وغيرها من الحركات
المساعد: نعم، يمكنني كتابة القصيدة بتشكيل الحروف باستخدام الحركات.

المستخدم: اذن اكتبها
المساعد: الجمال من الداخل والخارج،
يملأ القلب بالبهجة والسرور،
يضيء الحياة ويجعلها أكثر حيوية،
يمنحنا الأمل ويجعلها أكثر إيجابية.

المستخدم: ليست مشكلة
المساعد: أنا هنا لمساعدتك في أي وقت

# Few-Shot Prompting for Diacritization

In [None]:
def diacritize_text(sentence):
    prompt = f"""
    أضف التشكيل إلى النص التالي بالكامل. تأكد من إضافة التشكيل لكل كلمة في النص، ولا تترك أي كلمة دون تشكيل.
    إذا كانت الكلمة تحتوي على تشكيل مسبق، فلا تقم بتغييره:

    1. السماء جميلة
    → السَّمَاءُ جَمِيلَةٌ

    2. الكتاب مفيد
    → الكِتَابُ مُفِيدٌ

    3. الطائر يغرد
    → الطَّائِرُ يُغَرِّدُ

    4. بسم الله الرحمن الرحيم
    → بِسْمِ اللَّهِ الرَّحْمَنِ الرَّحِيمِ

    5. يضيء الحياة ويجعلها أكثر حيوية
    → يُضِيءُ الحَيَاةَ وَيَجْعَلُهَا أَكْثَرَ حَيَوِيَّةً

    النص التالي:
    {sentence}
    →
    """

    input_ids = tokenizer(prompt, return_tensors="pt").input_ids.to("cuda" if torch.cuda.is_available() else "cpu")
    outputs = model.generate(input_ids, max_new_tokens=256)
    response = tokenizer.decode(outputs[0], skip_special_tokens=True).replace(prompt, "").strip()

    return response


#  Diacritization Use

In [None]:
# Example usage
sentence = """
الجمال من الداخل والخارج

"""
diacritized_sentence = diacritize_text(sentence)
print("Diacritized Sentence:\n", diacritized_sentence)


Diacritized Sentence:
 الجَمَالُ مِنَ الداخلِ والخارجِ
