In [1]:
import re
from nltk.chat.util import Chat, reflections
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
from nltk.stem import WordNetLemmatizer
from difflib import SequenceMatcher
# Used to interact with the operating system, such as managing files and directories.
import os
# Used for natural language processing and text analysis.
import nltk
# Used to convert text to speech.
from gtts import gTTS
# Used to convert speech to text using various speech recognition services.
import speech_recognition as sr
# Provides a collection of constants and tools useful for text processing.
import string

In [2]:
# Download NLTK resources
nltk.download('punkt')
nltk.download('stopwords')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\Nagham\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     C:\Users\Nagham\AppData\Roaming\nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


True

In [3]:
# Initialize lemmatizer
lemmatizer = WordNetLemmatizer()

# Regular expressions for pattern matching
patterns = {
    r'مرحبا': ["مرحبا، كيف يمكنني مساعدتك في تعلم اللغة العربية؟"],
    r'كيف حالك': ["أنا بخير، شكراً. كيف يمكنني مساعدتك اليوم؟"],
    r'ماذا ستتعلم اليوم': ["اليوم سنتعلم قواعد جديدة في اللغة العربية."],
    r'كيف يمكنني المساعدة في التعلم': ["يمكنك المساعدة بالمواظبة على التمارين والمحادثة باللغة العربية."],
    r'كيف يمكنني تحسين مهاراتي اللغوية': ["يمكنك تحسين مهاراتك عبر الممارسة اليومية والاستماع للناطقين بالعربية."],
    r'أريد أن أتعلم المزيد عن النحو': ["بالطبع، يمكنني شرح مفاهيم النحو لك بشكل مبسط."],
    r'شكرا': ["عفواً، إذا كان هناك أي سؤال آخر لديك، فلا تتردد في طرحه."],
    r'(.*)?تعلم(.*)(اللغة العربية|عربي)(.*)?': ["نعم، يمكنني مساعدتك في تعلم اللغة العربية."],
    r'(.*)?درس(.*)?': ["طبعاً، يمكنني تقديم الدروس في مجالات متعددة في اللغة العربية."],
    r'(.*)?مدرس(.*)?': ["نعم، أنا مدرس للغة العربية. كيف يمكنني مساعدتك؟"],
    r'(.*)?كتاب(.*)?': ["بالطبع، يمكنني توصيتك ببعض الكتب المفيدة لتعلم اللغة العربية."],
    r'(.*)?ترجمة(.*)?': ["نعم، يمكنني المساعدة في الترجمة بين العربية واللغات الأخرى."],
    r'(.*)?قواعد(.*)?': ["بالطبع، يمكنني شرح القواعد النحوية والصرفية في اللغة العربية."],
    r'(.*)?محادثة(.*)?': ["نعم، يمكنني تدريبك على المحادثة باللغة العربية."],
    r'(.*)?نطق(.*)?': ["بالطبع، يمكنني مساعدتك في تحسين نطق الحروف والكلمات."],
    r'(.*)?أدب(.*)?': ["نعم، يمكنني مناقشة الأدب العربي وتوجيهك إلى القصص والشعر والروايات العربية."],
    r'(.*)?ثقافة(.*)?': ["بالطبع، يمكنني مناقشة الثقافة العربية والتقاليد والعادات."],
    r'(.*)?تاريخ(.*)?': ["نعم، يمكنني مناقشة التاريخ العربي والحضارات القديمة والحديثة."],
    r'(.*)?اقتصاد(.*)?': ["بالطبع، يمكنني مناقشة الاقتصاد العربي والتطورات الاقتصادية الحديثة."],
    r'(.*)': ["من فضلك أخبرني كيف يمكنني مساعدتك في تعلم اللغة العربية."]
}

In [4]:
# Function to preprocess user input
def preprocess_input(user_input):
    # Tokenize input
    tokens = word_tokenize(user_input)
    
    # Remove stopwords
    tokens = [token for token in tokens if token not in stopwords.words('arabic')]
    
    # Lemmatize tokens
    tokens = [lemmatizer.lemmatize(token) for token in tokens]
    
    # Join tokens back into a string
    user_input = ' '.join(tokens)
    
    return user_input

In [5]:
# Function for text interaction
def text_interaction():
    while True:
        user_input = input("أنت: ")
        user_input = preprocess_input(user_input)  # تنظيف المدخلات
        response = match_input_to_patterns(user_input, patterns)
        if response:
            print(f"بوت: {response}")
        else:
            response = respond_based_on_similarity(user_input, patterns)
            if response:
                print(f"بوت: {response}")
            else:
                print("بوت: آسف، لم أفهم ما قلت.")
        if user_input.lower() == 'الوداع':
            print("بوت: وداعًا!")
            break

In [6]:
# Function to match user input to patterns
def match_input_to_patterns(user_input, patterns):
    for pattern, responses in patterns.items():
        if re.search(pattern, user_input):
            return responses[0]
    return None

In [7]:
# List of Arabic words
arabic_words = [
    "كتاب", "قلم", "مدرسة", "سيارة", "بيت",
    "شجرة", "حاسوب", "هاتف", "طاولة", "كرسي",
    "شمس", "قمر", "نجم", "بحر", "سماء",
    "جبل", "وادي", "نهر", "بحيرة", "زهرة",
    "طائرة", "سفينة", "دراجة", "مطبخ", "غرفة",
    "باب", "نافذة", "ساعة", "قطار", "محطة",
    "مطار", "مكتب", "كرة", "سلة", "مربع",
    "مثلث", "دائرة", "مستطيل", "حيوان", "طائر",
    "سمك", "قطة", "كلب", "فأر", "ثعلب",
    "حصان", "غزال", "ذئب", "دجاجة", "بقرة",
    "نمر", "فراشة", "نملة", "عنكبوت", "أفعى",
    "سلحفاة", "قرد", "حمار", "حمار وحشي", "بجعة",
    "غراب", "طائر اللقلق", "طائر البومة", "قرد", "تمساح",
    "طائر الكناري", "سنجاب", "ديك", "نعامة", "بومة",
    "نسر", "طائر الحسون", "طائر اللقلق", "قنفذ", "زرافة",
    "بومة", "سمكة القرش", "الذبابة", "الفراشة", "البعوضة",
    "النحلة", "العقرب", "البعوضة", "العنكبوت", "الجرادة",
    "الجمل", "النعامة", "القنفذ", "البطة", "الغزال",
    "السلحفاة", "البومة", "النسر", "الطاووس", "الطائر الطنان",
    "الحمامة", "البجعة", "الكتاب", "القلم", "الورقة",
    "السيارة", "البيت", "المدرسة", "الجامعة", "الطالب",
    "المعلم", "الدراسة", "اللغة", "العربية", "اللغة الإنجليزية",
    "الفرنسية", "اللغة الألمانية", "الرياضيات", "العلوم", "التاريخ",
    "الجغرافيا", "الفن", "الموسيقى", "الرياضة", "كرة القدم",
    "كرة السلة", "السباحة", "التنس", "ركوب الدراجات", "السفر",
    "السياحة", "الطيران", "السفينة", "القارب", "التخييم",
    "الجبال", "الشواطئ", "البحار", "الجزر", "البركان",
    "البستان", "الزراعة", "الحديقة", "المنزل", "الغرفة",
    "الحمام", "المطبخ", "الصالة", "الغرفة الطعام", "السرير",
    "الأريكة", "الكرسي", "الطاولة", "الشرفة", "الباب",
    "النافذة", "السقف", "الأرضية", "السجادة", "الستائر",
    "الديكور", "الإضاءة", "المصباح", "الشمعة", "الشمسية",
    "الكهرباء", "الماء", "الهواء", "الطقس", "المناخ",
    "السحاب", "المطر", "الثلج", "البرق", "الرعد",
    "الشمسي", "الزلزال", "البرد", "الحرارة", "الحرارة",
    "التكييف", "التدفئة", "التبريد", "المرايا", "الزجاج",
    "الحديد", "الخشب", "البلاستيك", "الجلد", "القماش",
    "الحجر", "الفضة", "الذهب", "الماس", "اللؤلؤ",
    "المرجان", "اللون", "الأحمر", "الأزرق", "الأصفر",
    "الأخضر", "البرتقالي", "البني", "الأسود", "الأبيض",
    "الرمادي", "الوردي", "البنفسجي", "العنبر"
]

# Directory path to save audio files
audio_dir = "arabic_words_audio"

# Create the directory if it doesn't exist
if not os.path.exists(audio_dir):
    os.makedirs(audio_dir)

# Create an audio file for each word if not already created
for word in arabic_words:
    audio_file_path = os.path.join(audio_dir, f"{word}.mp3")
    if not os.path.exists(audio_file_path):
        tts = gTTS(text=word, lang='ar')
        tts.save(audio_file_path)

# Function to play the audio file
def play_audio(audio_file):
    os.system(f"start {audio_file}")

In [8]:
# Function to calculate similarity between two strings
def calculate_similarity(str1, str2):
    return SequenceMatcher(None, str1, str2).ratio()

# Function to respond to user input based on similarity
def respond_based_on_similarity(user_input, patterns):
    max_similarity = 0
    best_response = None
    for pattern, responses in patterns.items():
        similarity = calculate_similarity(user_input, pattern)
        if similarity > max_similarity:
            max_similarity = similarity
            best_response = responses[0]
    return best_response

In [9]:
# Function to check pronunciation
def check_pronunciation():
    print("من فضلك ادخل الكلمة التي تريد تعلم نطقها.")
    correct_text = input("أنت: ")
    
    # Get the audio file path for the correct word
    audio_file_path = os.path.join(audio_dir, f"{correct_text}.mp3")
    # Play the audio file
    play_audio(audio_file_path)

    while True:
        # Recognize speech and print it
        recognized_text = recognize_speech()
        print(f"أنت: {recognized_text}")

        # Check if the user wants to exit
        if recognized_text.lower() == 'الوداع':
            print("بوت: وداعًا!")
            break

        # Calculate pronunciation accuracy
        accuracy = calculate_similarity(correct_text, recognized_text)
        print(f"بوت: نسبة صحة النطق هي {accuracy:.2f}%")

In [13]:
# Function for voice interaction
def voice_interaction():
    while True:
        # Recognize speech and print it
        user_input = recognize_speech()
        print(f"أنت: {user_input}")

        # Check if recognition was successful
        if user_input == "غير معروف" or user_input == "حدث خطأ أثناء الاتصال بخدمة التعرف على الكلام":
            print(f"بوت: {user_input}")
            continue

        # Preprocess user input
        user_input = preprocess_input(user_input)

        # Match user input to patterns and respond
        response = match_input_to_patterns(user_input, patterns)
        if response:
            print(f"بوت: {response}")
        else:
            response = respond_based_on_similarity(user_input, patterns)
            if response:
                print(f"بوت: {response}")
            else:
                print("بوت: آسف، لم أفهم ما قلت.")

        # Check for exit command
        if user_input.lower() == 'الوداع':
            print("بوت: وداعًا!")
            break

In [15]:
# Function to recognize speech
def recognize_speech():
    recognizer = sr.Recognizer()
    with sr.Microphone() as source:
        print("قل شيئًا:")
        audio = recognizer.listen(source)

    try:
        recognized_text = recognizer.recognize_google(audio, language="ar")
        return recognized_text
    except sr.UnknownValueError:
        return "غير معروف"
    except sr.RequestError:
        return "حدث خطأ أثناء الاتصال بخدمة التعرف على الكلام"

In [17]:
# Main function
def main():
    print("أدخل 0 للمحادثة العادية، 1 لتعلم نطق الكلمات، 2 للتفاعل الصوتي:")
    x = int(input("أنت: "))

    if x == 0:
        text_interaction()
    elif x == 1:
        check_pronunciation()
    elif x == 2:
        voice_interaction()
    else:
        print("بوت: تم اختيار خيار غير صالح.")

if __name__ == "__main__":
    main()

أدخل 0 للمحادثة العادية، 1 لتعلم نطق الكلمات، 2 للتفاعل الصوتي:
أنت: 1
من فضلك ادخل الكلمة التي تريد تعلم نطقها.
أنت: قلم
قل شيئًا:
أنت: فلم
بوت: نسبة صحة النطق هي 0.67%
قل شيئًا:
أنت: قلم
بوت: نسبة صحة النطق هي 1.00%
قل شيئًا:
أنت: الوداع
بوت: وداعًا!
