# Set Up

In [None]:
!pip install -qU transformers==4.48.3 datasets==2.18.0 optimum==1.24.0
!pip install -qU json-repair==0.29.1

# Libraries Import

In [3]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [4]:
import json
import os
from os.path import join
import random

In [5]:
from tqdm.auto import tqdm
import json_repair
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
import torch

In [None]:
from data_model import getDetailExtractionMessage, getTranslationMessage
from functions import parse_json

# Constants

In [7]:
BASE_MODEL_ID = "Qwen/Qwen2.5-1.5B-Instruct"
TORCH_TYPE = None

# Model (Base Model)

In [8]:
base_model = AutoModelForCausalLM.from_pretrained(
    BASE_MODEL_ID,
    device_map="auto",
    torch_dtype = TORCH_TYPE
)

tokenizer_temp = AutoTokenizer.from_pretrained(BASE_MODEL_ID)

In [9]:
base_model

Qwen2ForCausalLM(
  (model): Qwen2Model(
    (embed_tokens): Embedding(151936, 1536)
    (layers): ModuleList(
      (0-27): 28 x Qwen2DecoderLayer(
        (self_attn): Qwen2Attention(
          (q_proj): Linear(in_features=1536, out_features=1536, bias=True)
          (k_proj): Linear(in_features=1536, out_features=256, bias=True)
          (v_proj): Linear(in_features=1536, out_features=256, bias=True)
          (o_proj): Linear(in_features=1536, out_features=1536, bias=False)
        )
        (mlp): Qwen2MLP(
          (gate_proj): Linear(in_features=1536, out_features=8960, bias=False)
          (up_proj): Linear(in_features=1536, out_features=8960, bias=False)
          (down_proj): Linear(in_features=8960, out_features=1536, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): Qwen2RMSNorm((1536,), eps=1e-06)
        (post_attention_layernorm): Qwen2RMSNorm((1536,), eps=1e-06)
      )
    )
    (norm): Qwen2RMSNorm((1536,), eps=1e-06)
    (rotary_emb): Qw

# Model Prediction

In [10]:
def predict(message: str):
    text = tokenizer_temp.apply_chat_template(
        message,
        tokenize=False,
        add_generation_prompt=True
    )

    model_inputs = tokenizer_temp([text], return_tensors="pt").to(base_model.device)

    generated_ids = base_model.generate(
        model_inputs.input_ids,
        max_new_tokens=1024,
        do_sample=False, top_k=None, temperature=None, top_p=None,
    )

    generated_ids = [
        output_ids[len(input_ids):]
        for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
    ]

    response = tokenizer_temp.batch_decode(generated_ids, skip_special_tokens=True)[0]

    return response

In [13]:
story = """
أنهى مسئولو النادى الأهلى كل تفاصيل عقد أحمد مصطفى زيزو، جناح الزمالك، بحيث ينضم اللاعب لمدة 4 سنوات قادمة بدءا من الموسم الجديد، فى صفقة انتقال حر بعد نهاية عقده مع الزمالك عقب نهاية الموسم الحالى.

ووضع الأهلى زيزو فى الفئة الأولى بحيث يحصل على 25 مليون جنيه سنويا بالإضافة إلى عقد إعلانى مقابل 60 مليون جنيه، بخلاف 80 مليون جنيه أخرى سيحصل عليها دفعة واحدة من خارج النادى عند الإعلان الرسمى عن الصفقة.

وينتهى عقد أحمد سيد زيزو مع الزمالك بنهاية الموسم الجارى، مما يجعل له الحق فى التفاوض مع أى نادٍ وإتمام الاتفاق معه والانضمام له عقب نهاية عقده الحالي خلال يونيو المقبل.

وحصل زيزو على تأشيرة السفر لأمريكا بالفعل للمشاركة مع الأهلى في مونديال الأندية الصيف المقبل.

ويستعد الأهلى للمشاركة فى بطولة كأس العالم للأندية بشكلها الجديد فى الولايات المتحدة الأمريكية، والمقامة بمشاركة 32 ناديًا من أكبر فرق العالم
"""

In [16]:
getDetailExtractionMessage(story)

[{'role': 'system',
  'content': 'You are an NLP data paraser.\nYou will be provided by an Arabic text associated with a Pydantic scheme.\nGenerate the ouptut in the same story language.\nYou have to extract JSON details from text according the Pydantic details.\nExtract details as mentioned in text.\nDo not generate any introduction or conclusion.'},
 {'role': 'user',
  'content': '## Story:\nأنهى مسئولو النادى الأهلى كل تفاصيل عقد أحمد مصطفى زيزو، جناح الزمالك، بحيث ينضم اللاعب لمدة 4 سنوات قادمة بدءا من الموسم الجديد، فى صفقة انتقال حر بعد نهاية عقده مع الزمالك عقب نهاية الموسم الحالى.\n\nووضع الأهلى زيزو فى الفئة الأولى بحيث يحصل على 25 مليون جنيه سنويا بالإضافة إلى عقد إعلانى مقابل 60 مليون جنيه، بخلاف 80 مليون جنيه أخرى سيحصل عليها دفعة واحدة من خارج النادى عند الإعلان الرسمى عن الصفقة.\n\nوينتهى عقد أحمد سيد زيزو مع الزمالك بنهاية الموسم الجارى، مما يجعل له الحق فى التفاوض مع أى نادٍ وإتمام الاتفاق معه والانضمام له عقب نهاية عقده الحالي خلال يونيو المقبل.\n\nوحصل زيزو على تأشيرة

In [15]:
predict(getDetailExtractionMessage(story))

'{\n    "story_title": "Ahmed Moustafa Zizou\'s Contract Ends",\n    "story_keywords": [\n        "Ahmed Moustafa Zizou",\n        "contract ends",\n        "Ahmed Sadek Zizou",\n        "transfer fee",\n        "Cup World Cup"\n    ],\n    "story_summary": [\n        "Ahmed Moustafa Zizou, a player for Al Ahli, has completed all details related to his contract.",\n        "Zizou is set to join Al Ahli for four years starting from the new season, after ending his contract with Al Ahli at the end of this season."\n    ],\n    "story_category": "sports",\n    "story_entities": [\n        {\n            "entity_value": "Ahmed Moustafa Zizou",\n            "entity_type": "person-male"\n        },\n        {\n            "entity_value": "Al Ahli",\n            "entity_type": "organization"\n        }\n    ]\n}'

In [17]:
getTranslationMessage(story)

[{'role': 'system',
  'content': 'You are a professional translator.\nYou will be provided by an Arabic text.\nYou have to translate the text into the `Targeted Language`.\nFollow the provided Scheme to generate a JSON\nDo not generate any introduction or conclusion.'},
 {'role': 'user',
  'content': '## Story:\nأنهى مسئولو النادى الأهلى كل تفاصيل عقد أحمد مصطفى زيزو، جناح الزمالك، بحيث ينضم اللاعب لمدة 4 سنوات قادمة بدءا من الموسم الجديد، فى صفقة انتقال حر بعد نهاية عقده مع الزمالك عقب نهاية الموسم الحالى.\n\nووضع الأهلى زيزو فى الفئة الأولى بحيث يحصل على 25 مليون جنيه سنويا بالإضافة إلى عقد إعلانى مقابل 60 مليون جنيه، بخلاف 80 مليون جنيه أخرى سيحصل عليها دفعة واحدة من خارج النادى عند الإعلان الرسمى عن الصفقة.\n\nوينتهى عقد أحمد سيد زيزو مع الزمالك بنهاية الموسم الجارى، مما يجعل له الحق فى التفاوض مع أى نادٍ وإتمام الاتفاق معه والانضمام له عقب نهاية عقده الحالي خلال يونيو المقبل.\n\nوحصل زيزو على تأشيرة السفر لأمريكا بالفعل للمشاركة مع الأهلى في مونديال الأندية الصيف المقبل.\n\nويستعد

In [18]:
predict(getTranslationMessage(story))

'{\n  "translated_title": "Ahmed Moustafa Zizou\'s Contract Ends with Cairo Eagles",\n  "translated_content": "The management of Al Ahli has finalized all details regarding Ahmed Moustafa Zizou\'s contract, which he will join for four years starting from next season. The deal is free transfer after his contract expires with Al Ahli at the end of this season."\n}'