<a href="https://colab.research.google.com/github/HassanAlhajAli/Temporal_Spatial_Relationships_Extractor/blob/main/arabic_biographies_temporal_spatial_relationships_extractor.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Create Initial Templates:**



* #### تمَّ تصميم مجموعة من القوالب التي يمكن استخدامها لتمثيل العلاقات الزمنية والمكانية بين المفاهيم في مجال الأحداث الشخصية
* #### تم تحديد مجموعة من القوالب الأساسية التي يستخدمها المتحدثون لغويًا في تمثيل العلاقات الزمنية والمكانية المحددة، وهي القوالب التي تخص العلاقات الأربعة
التي سيتم استخراجها وهي مكان الولادة ومكان الوفاة وتاريخ الولادة وتاريخ الوفاة
--------------------------------------------------------------------------------
* #### A set of templates were designed that can be used to represent temporal and spatial relationships between concepts in the field of personal events.
* #### A set of basic templates that speakers use linguistically to represent specific temporal and spatial relationships have been identified. These templates concern the four relationships to be extracted: place of birth, place of death, date of birth, and date of death.



In [None]:
# Define different templates for each type of relationship to be extracted
templates = {

    # birthplace relationship templates
    'birthplace': [
        'ينحدر {0} من مدينة {1}',
        '{0} من مواليد مدينة {1}',
        '{1} هي المدينة التي وُلد فيها {0}',
        'رأى {0} النور في مدينة {1}',
        'أتى {0} إلى الحياة في مدينة {1}',
        'يعود مولد {0} إلى مدينة {1}',
        'ولد {0} في مدينة {1}'
    ],

    # deathplace relationship templates
    'deathplace': [
        'توفي {0} في مدينة {1}',
        '{1} هي مكان وفاة {0}',
        'رحل {0} إلى رحمة الله في مدينة {1}',
        '{1} هي المدينة التي توفي فيها {0}',
        'رحل {0} عن الحياة في مدينة {1}',
        'فارق {0} الحياة في مدينة {1}',
        'انتقل {0} إلى الدار الآخرة في مدينة {1}'
    ],

    # birthdate relationship templates
    'birthdate': [
        'ولد {0} في العام {1}',
        '{0} من مواليد عام {1}',
        '{1} هو عام ولادة {0}',
        'يعود تاريخ ولادة {0} إلى العام {1}',
        'أتى {0} إلى الحياة عام {1}',
        'رأى {0} النور عام {1}',
        '{0} فتح عينيه لأول مرة في عام {1}'
    ],

    # deathdate relationship templates
    'deathdate': [
        'توفي {0} في العام {1}',
        'رحل {0} إلى ربه في عام {1}',
        '{1} هو عام وفاة {0}',
        'يعود تاريخ وفاة {0} إلى العام {1}',
        'رحل {0} إلى رحمة الله عام {1}',
        'رحل {0} عن الحياة عام {1}',
        'فارق {0} الحياة عام {1}'
    ]
}

#**Extending Templates:**
* #### تم  توسيع القوالب الموجودة في السؤال الأول عن طريق إيجاد مرادفات لبعض الكلمات المستخدمة في القوالب
* #### تم إنشاء قاموس جديد يسمى `replacements` يحتوي على مفاتيح تمثل الكلمات التي يمكن استبدالها، وقيم كل مفتاح هي قائمة بالمرادفات أو الاستبدالات الممكنة لهذه الكلمة
#### على سبيل المثال، يمكن استبدال الكلمة "عام" بـ "سنة" أو "تاريخ".


--------------------------------------------------------------------------------
* #### The existing templates from the first task were extended by finding synonyms for some of the words used in the templates.
* #### A new dictionary called `replacements` was created, containing keys representing the words that can be replaced, and each key's value is a list of synonyms or possible replacements for that word.
#### For example, the word "عام" (year) can be replaced with "سنة" (year) or "تاريخ" (date).

In [None]:
# Define a dictionary that contains a set of words and their alternative forms
replacements = {
    'عام': ['سنة', 'تاريخ'],
    'مدينة': ['دولة'],
    'توفي': ['مات', 'قبض'],
    'رأى': ['أبصر', 'شاهد' , 'بصر'],
    'رحل': ['ذهب', 'انتقل' , 'ارتحل'],
    'أتى': ['أقبل', 'جاء' , 'حضر'],
    'الحياة': ['الدنيا', 'العالم'],
    'وفاة': ['موت', 'رحبل' , 'منية'],
    'مكان': ['موضع', 'منطقة'],
    'الله': ['ربه', 'الرحمن' , 'خالقه'],
    'فارق': ['غادر', 'ترك']
}

In [None]:
# Create a deep copy of the original templates dictionary
import copy
ext_templates = copy.deepcopy(templates)

# Iterate over the original templates and extend them with alternative forms
for template_type, template_dict in templates.items():
    for template in templates[template_type]:
        # Iterate over each word and its alternative forms in the replacements dictionary
        for word, replacements_list in replacements.items():
            if word in template:
                for replacement in replacements_list:
                    new_template = template.replace(word, replacement)
                    # Add the new template to the extended templates dictionary for the same type of relationship
                    ext_templates[template_type].append(new_template)

    # Print the number of templates for each type of relationship after they have been extended
    print(f"Number of {template_type} templates after extending: {len(ext_templates[template_type])}")

Number of birthplace templates after extending: 22
Number of deathplace templates after extending: 37
Number of birthdate templates after extending: 29
Number of deathdate templates after extending: 47


# **Get Data**

* #### تم جمع البيانات التي تتحدث عن مكان الولادة، مكان الإقامة الحالي، تاريخ الولادة، وتاريخ الوفاة إن وجد. لقد قمت ببناء زاحف إلكتروني لاستخراج هذه البيانات من المواقع ذات الصلة، مثل السيرة الذاتية.

* #### بسبب أن المواقع باللغة العربية فقيرة بالبيانات أو الصفحات المختصة في هذا المجال فلم يتم جمع الكثير من البيانات في حين أنه في اللغة الإنجليزية هناك مواقع خاصة يمكن استخراج منها آلاف الجمل المتعلقة بهذا المشروع، لذا تم بعد ذلك اللجوء إلى طريقة ثانية في جمع البيانات.

* #### الطريق البديلة لقلة البيانات بالزاحف هي توليد البيانات من خلال مصفوفة تحتوي على المدن والدول والأسماء، بالاستناد إلى القوالب التي تم توسيعها.
--------------------------------------------------------------------------------
* #### Data were collected regarding place of birth, current residence, date of birth, and date of death, if available. A web crawler was built to extract this data from relevant sites, such as biographies.
* #### Because Arabic-language websites are poor in data or specialized pages in this field, not much data was collected, while in English there are specialized sites from which thousands of sentences related to this project can be extracted. Therefore, a second method was resorted to for data collection.
* #### The alternative method for the lack of data with the crawler is to generate data through a matrix containing cities, countries, and names, based on the expanded templates.



## *Generating via Crawler:*


In [None]:
# Import required libraries
from urllib.parse import urljoin
import requests
from bs4 import BeautifulSoup
import re

# Define an empty list to store extracted sentences
Data = []

# Define a class for the web crawler
class Crawler:

    def __init__(self, urls=[]):
        # Initialize instance variables
        self.visited_urls = []
        self.urls_to_visit = urls
        self.sentences = []
        self.limit = 1000

    # Download the HTML content of the given URL and return the text
    def download_url(self, url):
        return requests.get(url).text

    def get_sentences(self, html):
        # Parse the HTML content using BeautifulSoup
        soup = BeautifulSoup(html, 'html.parser')
        # Extract all <p> elements
        for p in soup.find_all('p'):
            # Get the text content of the <p> element and remove leading/trailing whitespace
            text = p.get_text().strip()
            # Use regex to find sentences that contain certain keywords and add them to the sentences list
            new_sentences = re.findall(r'[A-Z][^.!?]*(?:ولد|توفي|مات|تُوُفِيَ|مواليد|ولادة|\bرحل عن الحياة\b|وفاة)[^.!?]*[.!?]', text)
            for sentence in new_sentences:
                self.sentences.append(sentence.strip())
                Data.append(sentence.strip())
                # Print the extracted sentence
                print(f"Found sentence {len(self.sentences)+1}: {sentence.strip()}")
                # Stop extracting sentences if the limit has been reached
                if len(self.sentences) >= self.limit:
                    return

    def get_linked_urls(self, url, html):
        # Parse the HTML content using BeautifulSoup
        soup = BeautifulSoup(html, 'html.parser')
        # Extract all <a> elements and yield URLs found in the href attribute
        for link in soup.find_all('a'):
            path = link.get('href')
            if path and path.startswith('/'):
                path = urljoin(url, path)
                yield path

    def add_url_to_visit(self, url):
        # Add the URL to the urls_to_visit list if it has not already been visited or added
        if url not in self.visited_urls and url not in self.urls_to_visit:
            self.urls_to_visit.append(url)

    def crawl(self, url):
        # Download the HTML content of the URL and extract sentences
        html = self.download_url(url)
        self.get_sentences(html)
        # Add any linked URLs to the urls_to_visit list
        for url in self.get_linked_urls(url, html):
            self.add_url_to_visit(url)

    def run(self):
        # Loop over urls_to_visit list and crawl each URL until the limit is reached or there are no more URLs to visit
        while self.urls_to_visit:
            url = self.urls_to_visit.pop(0)
            print(f'Crawling: {url}')
            try:
                self.crawl(url)
            except Exception:
                print(f'Failed to crawl: {url}')
            finally:
                # Add the URL to the visited_urls list and stop extracting sentences if the limit has been reached
                self.visited_urls.append(url)
                if len(self.sentences) >= self.limit:
                    break
        # Print the number of extracted sentences
        print(f'Found {len(self.sentences)} sentences ')

In [None]:
URL = 'https://arab-ency.com/'
URL = 'https://ar.wikipedia.org/wiki/%D8%B3%D9%8A%D8%B1%D8%A9_%D8%B0%D8%A7%D8%AA%D9%8A%D8%A9'
# URL = 'https://www.biography.com/'
# URL = 'https://www.baynoona.net/ar/ebook/340'
# URL = 'https://www.lahamag.com/category/70-%D8%A3%D8%AE%D8%A8%D8%A7%D8%B1-%D8%A7%D9%84%D9%86%D8%AC%D9%88%D9%85'
# URL = 'https://www.elfann.com/'
# URL = 'https://www.sayidaty.net/category/main/%D9%85%D8%B4%D8%A7%D9%87%D9%8A%D8%B1/%D9%85%D8%B4%D8%A7%D9%87%D9%8A%D8%B1-%D8%A7%D9%84%D8%B9%D8%B1%D8%A8'
# URL = 'https://www.mosaiquefm.net/ar/actualites/%D8%A3%D8%AE%D8%A8%D8%A7%D8%B1-%D8%A7%D9%84%D9%85%D8%B4%D8%A7%D9%87%D9%8A%D8%B1/38'
# URL = 'https://www.layalina.com/all-celebrity-news/'
# URL = 'https://arabic.euronews.com/tag/celebrity-news'
# URL = 'https://www.filfan.com/sections/3'
# URL = 'https://quranwahadith.com/%D8%A7%D9%84%D9%83%D8%AA%D8%A8-%D8%A7%D9%84%D8%B9%D8%B1%D8%A8%D9%8A%D8%A9/%D8%B3%D9%8A%D8%B1%D8%A9/%D8%AD%D9%8A%D8%A7%D8%A9-%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1/'
# URL = 'https://www.twinkl.com/teaching-wiki/lma-alrb
# URL = 'https://www.aljazeera.net/blogs/2019/9/24/%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1-%D8%A7%D9%84%D9%85%D8%B3%D9%84%D9%85%D9%88%D9%86-%D9%88%D9%81%D8%B6%D9%84%D9%87%D9%85-%D8%A7%D9%84%D8%B0%D9%8A-%D8%BA%D9%8A%D8%A8-%D8%B9%D9%86%D8%A7'
# URL = 'https://www.aljazeera.net/blogs/2019/9/24/%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1-%D8%A7%D9%84%D9%85%D8%B3%D9%84%D9%85%D9%88%D9%86-%D9%88%D9%81%D8%B6%D9%84%D9%87%D9%85-%D8%A7%D9%84%D8%B0%D9%8A-%D8%BA%D9%8A%D8%A8-%D8%B9%D9%86%D8%A7'
URL = 'https://mawdoo3.com/%D8%A3%D9%87%D9%85_%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1'
# URL = 'https://www.marefa.org/%D9%82%D8%A7%D8%A6%D9%85%D8%A9_%D8%A7%D9%84%D9%83%D8%AA%D8%A7%D8%A8_%D8%A7%D9%84%D8%B9%D8%B1%D8%A8'
# URL = 'https://ar.wikipedia.org/wiki/%D8%AA%D8%B5%D9%86%D9%8A%D9%81:%D8%B9%D9%84%D9%85%D8%A7%D8%A1'

# Create a new instance of the Crawler class with a single URL in its urls list, and call its run method to begin crawling the specified URL
Crawler(urls=[URL]).run()

Crawling: https://mawdoo3.com/%D8%A3%D9%87%D9%85_%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1
Crawling: https://mawdoo3.com/#categories
Crawling: https://mawdoo3.com/خاص:أجدد_الصفحات
Crawling: https://mawdoo3.com/خاص:الصفحات_الأكثر_مشاهدة
Crawling: https://mawdoo3.com/
Crawling: https://mawdoo3.com/تصنيف:علماء
Crawling: https://mawdoo3.com/فريق_موضوع
Crawling: https://mawdoo3.com/أشهر_العلماء_المسلمين
Crawling: https://mawdoo3.com/أهم_العلماء_في_العصر_العباسي
Crawling: https://mawdoo3.com/أهم_العلماء_العرب
Crawling: https://mawdoo3.com/علماء_الفلك_في_العصر_العباسي
Crawling: https://mawdoo3.com/%D8%A3%D8%B4%D9%87%D8%B1_%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1_%D8%A7%D9%84%D9%85%D8%B3%D9%84%D9%85%D9%8A%D9%86
Crawling: https://mawdoo3.com/%D8%A3%D9%87%D9%85_%D8%A7%D9%84%D8%B9%D9%84%D9%85%D8%A7%D8%A1_%D9%81%D9%8A_%D8%A7%D9%84%D8%B9%D8%B5%D8%B1_%D8%A7%D9%84%D8%B9%D8%A8%D8%A7%D8%B3%D9%8A
Crawling: https://mawdoo3.com/أهم_علماء_الرياضيات
Crawling: https://mawdoo3.com/أشهر_علماء_الأندلس_المسلم

KeyboardInterrupt: 

In [None]:
print(len(Data))

## *Random Generating:*

In [None]:
# Define a list of names
names = ['أحمد', 'علي', 'محمد', 'عمر', 'حسين', 'عبدالله', 'فهد', 'خالد', 'سلمان', 'فيصل',
              'ناصر', 'سعد', 'ماجد', 'محمود', 'أسامة', 'حمد', 'منصور', 'مروان', 'شادي', 'عبدالرحيم',
              'طارق', 'حاتم', 'سامي', 'يوسف', 'أشرف', 'محمد علي', 'هاني', 'رائد', 'عادل', 'بدر',
              'حسن', 'محمد مصطفى', 'زيد', 'أحمد علي', 'محمدعبدالرحمن', 'رشاد', 'عماد', 'باسل', 'وليد', 'عبدالمجيد',
              'مصطفى', 'عبدالرحمن', 'سعيد', 'ياسر', 'محمد ناصر', 'رشيد', 'نواف', 'إبراهيم', 'سهيل', 'حسام']

#check frequncies:
# for x in names:
#   print(x , " : ",  names.count(x))
# print(len(names))

# Define a list of cities
cities = ['نيويورك', 'لندن', 'طوكيو', 'باريس', 'برلين', 'مدريد', 'موسكو', 'دبي', 'إسطنبول', 'سنغافورة',
          'سدني', 'كندا', 'واشنطن.', 'كاليفورنيا', 'ميلانو', 'روما', 'فيينا', 'حمص', 'أمستردام', 'حلب',
          'ساو باولو', 'ريو دي جانيرو', 'اللاذقية', 'مكسيكو', 'بكين', 'شنغهاي', 'هونغ كونغ', 'سيول', 'الحسكة',
          'ملبورن', 'بريسبان', 'كوالالمبور', 'بنكوك', 'دلهي', 'مومباي', 'جاكرتا', 'نيو دلهي', 'كراتشي', 'إسلام أباد',
          'لاهور', 'طهران', 'بغداد', 'الإسكندرية', 'طرطوس', 'القاهرة', 'الجزائر', 'تونس', 'طرابلس', 'بيروت', 'دمشق']

#check frequncies:
# for x in cities:
#   print(x , " : ",  cities.count(x))
# print(len(cities))

# Define a list of countries
countries = ['المملكة المتحدة', 'الولايات المتحدة الأمريكية', 'الصين', 'روسيا', 'كندا', 'البرازيل', 'أستراليا', 'الهند',
             'فرنسا', 'ألمانيا', 'إيطاليا', 'اليابان', 'كوريا الجنوبية', 'المكسيك', 'إسبانيا', 'إندونيسيا', 'تركيا',
             'جنوب أفريقيا', 'نيجيريا', 'مصر', 'الأرجنتين', 'السعودية', 'إيران', 'باكستان', 'بنجلاديش', 'فيتنام',
             'كولومبيا', 'بولندا', 'كينيا', 'العراق', 'المغرب', 'السودان', 'أوكرانيا', 'تنزانيا', 'أوغندا', 'كنيا',
             'الفلبين', 'الجزائر', 'المملكة العربية السعودية', 'الإمارات العربية المتحدة', 'قطر', 'الكويت', 'عمان',
             'الأردن', 'سوريا', 'لبنان', 'فلسطين', 'بلجيكا', 'سويسرا', 'الدنمارك']

#check frequncies:
# for x in countries:
#   print(x , " : ",  countries.count(x))
# print(len(countries))


In [None]:
Data = Data[0:9]

In [None]:
# Import the random module
import random

# Set the data size (number of sentences to generate)
Data_size = 1200

for i in range(Data_size):
    # Loop through each template type and its associated templates in the ext_templates dictionary
    for template_type, templates_list in ext_templates.items():
        # Choose a random name from the names list, Choose a random template from the templates_list
        name = random.choice(names)
        template = random.choice(templates_list)

        x = 'second parameter'
        # If the template contains the word 'مكان', choose a random city or country
        if 'مكان' in template or 'منطقة' in template or 'موضع' in template:
            x = random.choice(cities + countries)
        # If the template contains the word 'مدينة', choose a random city
        elif 'مدينة' in template:
            x = random.choice(cities)
        # If the template contains the word 'دولة', choose a random country
        elif 'دولة' in template:
            x = random.choice(countries)
        # If the template contains none of the above, choose a random integer between 1000 and 2023
        else:
            x = random.randint(1000, 2023)

        sentence = template.format(name, x)
        print(sentence)
        Data.append(sentence)

    # If the desired data size is reached, break out of the loop
    if len(Data) >= Data_size:
        break

In [None]:
# Loop through each item in the Data list using the range() function
for i in range(len(Data)):
    # Print the index of the item (i+1 to start with 1 instead of 0), a colon, and the item itself
    print(i+1, " : ", Data[i])

# **Apply Templates Using Farasa and Regular Expressions**

* #### تم استخدام مكتبة فراسة لتعرف الكيانات وتحديد المدن والدول (أي المواقع) والأسماء.
#### بالإضافة إلى ذلك، تم تحديد التواريخ من خلال الأرقام باستخدام التعابير المنتظمة.
* ####  تم تطبيق القوالب على الوثائق المولدة والمجموعة من خلال الزحف الإلكتروني، وذلك باستخدام التعابير المنتظمة.

* #### تم تنفيذ النظام على أربع مراحل وهي كالتالي: تم تطبيق النظام على أربعة مراحل وهي كالتالي:
#### 1.	استخراج علامات الترقيم ما عدا القوس المعقوف من الجمل (لأنه يشمل المتغيرات)
#### 2.	تضمين الكلمات الأساسية في القوالب في الجمل.
#### 3.	السماح بوجود كلمات زائدة بين الكلمات الأساسية لتحقيق مرونة في تحديد العلاقات.
#### 4.	في حالة مطابقة القالب للجملة، يتم استخراج العلاقات الزمنية والمكانية
--------------------------------------------------------------------------------

* #### The Farasa library was used for named entity recognition to identify cities, countries (i.e., locations), and names.
#### Additionally, dates were identified using numbers with regular expressions.
* #### The templates were applied to the generated and crawled documents using regular expressions.

* #### The system was implemented in four stages as follows:
#### 1. Extracting punctuation marks except for curly braces from the sentences (because they include variables).
#### 2. Embedding the keywords from the templates into the sentences.
#### 3. Allowing extra words between the keywords to provide flexibility in identifying relationships.
#### 4. If the template matches the sentence, temporal and spatial relationships are extracted.


In [None]:
!pip install farasa farasapy

from farasa.segmenter import FarasaSegmenter
from farasa.pos import FarasaPOSTagger
from farasa.ner import FarasaNamedEntityRecognizer

# Load Farasa tools
segmenter = FarasaSegmenter(interactive=True)
pos = FarasaPOSTagger(interactive=True)
ner = FarasaNamedEntityRecognizer(interactive=True)

In [None]:
import re

# Define a function to extract named entities from a sentence using FarasaNamedEntityRecognizer
def get_entities(sentence):
    # Use the FarasaNamedEntityRecognizer to identify named entities in the sentence
    entities = ner.recognize(sentence)
    # Split the entities into a list of tokens
    return entities.split()

# Define a function to extract the location from a sentence
def get_location(sentence):
    ent = get_entities(sentence)
    # Loop through the entities and look for a 'B-LOC' entity tag
    for e in ent:
        if 'B-LOC' in e:
            return e.split('/')[0]

    # If no 'B-LOC' tag is found, look for a city or country name
    for e in ent:
        if e.split('/')[0] in (cities + countries):
            return e.split('/')[0]

    # If no location is found, return 'None'
    return 'None'

# Define a function to extract the person name from a sentence
def get_person(sentence):
    ent = get_entities(sentence)
    # Loop through the entities and look for a 'B-PERS' entity tag
    for e in ent:
        if 'B-PERS' in e:
            return e.split('/')[0]

    # If no 'B-PERS' tag is found, look for a name from the names list
    for e in ent:
        if e.split('/')[0] in names:
            return e.split('/')[0]

    # If no person name is found, return 'None'
    return 'None'

# Define a function to extract the date from a sentence using regular expressions
def get_date(sentence):
    # Use a regular expression to find a four-digit number in the sentence
    x = re.findall(r"\d{4}", sentence)
    if x:
        return x[0]
    return 'None'

In [None]:
# Define a function to extract the relation type from a template type and a sentence
def get_relation(template_type, sentence):
    # Depending on the template type, print the appropriate relation
    if template_type == 'birthplace':
        print(f"مكان الولادة ({get_person(sentence)} , {get_location(sentence)})")
    if template_type == 'deathplace':
        print(f"مكان الوفاة ({get_person(sentence)} , {get_location(sentence)})")
    if template_type == 'deathdate':
        print(f"تاريخ الوفاة ({get_person(sentence)} , {get_date(sentence)})")
    if template_type == 'birthdate':
        print(f"تاريخ الولادة ({get_person(sentence)} , {get_date(sentence)})")

In [None]:
import copy

# Create a copy of the external templates dictionary
reg_templates = copy.deepcopy(ext_templates)

# Loop through each template type and its list of templates in the reg_templates dictionary
for template_type, template_list in reg_templates.items():
    index = 0
    # Loop through each template in the template list
    for template in template_list:
        # Remove all punctuation except curly braces from the template
        punctuation_marks = r'[^\w\s{}]' # Define a regular expression pattern to match all punctuation except curly braces
        template = re.sub(punctuation_marks, '', template)

        # Replace all numerical placeholders with a regular expression pattern that matches any string
        template = re.sub(r"{\d+}", r"(.+)", template)

        # Replace all word placeholders with a regular expression pattern that matches any word followed by any number of characters
        pattern = re.compile(r"(\b\w+\b)")
        template = re.sub(pattern, r"\1(.*)", template)
        template = f"(.*){template}"

        # Replace the original template in the template list with the modified version
        reg_templates[template_type][index] = template
        index += 1

# Loop through each template type and its list of templates in the reg_templates dictionary
for template_type, template_list in reg_templates.items():
    index = 0
    print(template_type)
    for template in template_list:
        print(template)

In [None]:
import re

# Loop through each sentence in the Data list
cnt = 0
for sentence in Data:
    # Initialize a flag variable to indicate whether a relation has been found in the sentence
    relation_found = False

    for template_type, template_list in reg_templates.items():
        # Loop through each template in the template list
        for template in template_list:
            # Check if the template matches the sentence using regex matching
            if re.match(template , sentence):
                cnt += 1
                print(cnt)

                print(sentence)
                print(template)
                get_relation(template_type , sentence)
                break

        if relation_found == True:
            break


# **Results and Mistakes**
* #### accuracy = (1029 - 93)/1029 = 90.96%

* #### الأخطاء بشكل عام ناتجة عن اختيار الزاحف لجمل متوافقة مع قالب وهي أخطاء قليلة والأخطاء الأكثر هي بتعرف مكتبة فراسة على الكيانات المختلفة
--------------------------------------------------------------------------------
* #### The mistakes generally result from the crawler selecting sentences that match a template, which are few, and most errors are due to the Farasa library's recognition of different entities.
