In [1]:
import math
from collections import Counter

class ArabicSentimentClassifier:
    def __init__(self):
        self.words_count = {"positive": Counter(), "negative": Counter()}
        self.class_count = {"positive": 0, "negative": 0}
        self.vocab = set()

    def tokenize(self, text):
        """تنظيف النص العربي وتقسيمه"""
        # الاحتفاظ بالحروف العربية والمسافات فقط
        import re
        clean_text = re.sub(r'[^\u0621-\u064A\s]', '', text)
        return clean_text.split()

    def train(self, data):
        for text, label in data:
            tokens = self.tokenize(text)
            self.words_count[label].update(tokens)
            self.class_count[label] += 1
            self.vocab.update(tokens)
        print(f"✅ تم التدريب بنجاح! إجمالي الجمل العربية: {len(data)}")

    def predict(self, text):
        tokens = self.tokenize(text)
        if not tokens: return "غير معروف"
        
        best_label = None
        max_score = -float('inf')
        
        for label in ["positive", "negative"]:
            # الاحتمالية الأساسية للفئة
            score = math.log(self.class_count[label] / sum(self.class_count.values()))
            
            for word in tokens:
                # Laplace Smoothing للتعامل مع الكلمات الجديدة
                word_prob = (self.words_count[label][word] + 1) / \
                            (sum(self.words_count[label].values()) + len(self.vocab))
                score += math.log(word_prob)
                
            if score > max_score:
                max_score = score
                best_label = label
        return "إيجابي" if best_label == "positive" else "سلبي"

# --- مجموعة بيانات عربية ضخمة (إيجابي وسلبي) ---
arabic_dataset = [
    # --- إيجابي (Positive) ---
    ("هذا التطبيق رائع جدا ومفيد", "positive"),
    ("سرعة التنفيذ مذهلة في هذا المشروع", "positive"),
    ("أنا سعيد جدا بالنتائج التي حققتها", "positive"),
    ("التصميم أنيق وسهل الاستخدام للغاية", "positive"),
    ("خدمة العملاء كانت متعاونة جدا وسريعة", "positive"),
    ("هذا أفضل برنامج استخدمته في حياتي", "positive"),
    ("شكرا جزيلا على هذا المجهود الرائع", "positive"),
    ("التحديث الجديد أصلح كل المشاكل السابقة", "positive"),
    ("أداء ممتاز واستقرار كبير في النظام", "positive"),
    ("أنصح الجميع بتحميل هذا التطبيق", "positive"),
    ("المعلومات دقيقة ومنظمة بشكل احترافي", "positive"),
    ("تجربة مستخدم خرافية ولا يوجد أي تعليق", "positive"),
    ("فكرة عبقرية وتنفيذ متقن جدا", "positive"),
    ("التطبيق خفيف على الهاتف ولا يستهلك البطارية", "positive"),
    ("تطور ملحوظ في الذكاء الاصطناعي العربي", "positive"),
    ("كل شيء يعمل بسلاسة تامة وبدون أخطاء", "positive"),
    ("مبادرة ممتازة ومحتوى قيم جدا", "positive"),
    ("فخور جدا بوجود تطبيقات عربية بهذا المستوى", "positive"),
    ("الواجهة مريحة للعين وبسيطة في التنقل", "positive"),
    ("دعم فني سريع واستجابة فورية", "positive"),

    # --- سلبي (Negative) ---
    ("التطبيق بطيء جدا ويتوقف عن العمل باستمرار", "negative"),
    ("تجربة سيئة للغاية ولن أكررها مرة أخرى", "negative"),
    ("هناك الكثير من الأخطاء البرمجية في هذا الكود", "negative"),
    ("التصميم قديم وصعب الاستخدام وغير مريح", "negative"),
    ("للأسف النتائج غير دقيقة ومضللة تماما", "negative"),
    ("يستهلك الكثير من الرام ويجعل الهاتف يسخن", "negative"),
    ("خدمة العملاء سيئة جدا ولا يوجد رد", "negative"),
    ("تضييع للوقت والجهد دون أي فائدة", "negative"),
    ("البرنامج يغلق فجأة عند فتحه في كل مرة", "negative"),
    ("لا أنصح أبدا باستخدامه فيه مشاكل أمنية", "negative"),
    ("التحديث الأخير دمر كل شيء كان يعمل", "negative"),
    ("الواجهة معقدة جدا وغير مفهومة للمبتدئين", "negative"),
    ("لماذا يطلب التطبيق صلاحيات غير ضرورية", "negative"),
    ("تطبيق فاشل ولا يستحق حتى نجمة واحدة", "negative"),
    ("الإعلانات كثيرة جدا ومزعجة بشكل لا يطاق", "negative"),
    ("المحتوى فقير جدا ولا يوجد أي جديد", "negative"),
    ("حاولت التواصل مع الدعم ولم يصلني أي رد", "negative"),
    ("السعر غالي جدا مقارنة بالخدمات الضعيفة", "negative"),
    ("النسخة القديمة كانت أفضل بكثير من هذه", "negative"),
    ("يوجد بطء شديد عند تحميل البيانات", "negative")
]

# --- تشغيل وتجربة النموذج ---
model = ArabicSentimentClassifier()
model.train(arabic_dataset)

# اختبار جمل جديدة (بلهجات وسياقات مختلفة)
test_queries = [
    "بصراحة الشغل جبار والسرعة خيالية", 
    "تطبيق تعيس جدا وكل شوي يعلق",
    "الله يجزاكم خير على هذا التطبيق المفيد"
]

print("\n--- نتائج تحليل المشاعر (باللغة العربية) ---")
for q in test_queries:
    print(f"النص: '{q}' -> التصنيف: {model.predict(q)}")


✅ تم التدريب بنجاح! إجمالي الجمل العربية: 40

--- نتائج تحليل المشاعر (باللغة العربية) ---
النص: 'بصراحة الشغل جبار والسرعة خيالية' -> التصنيف: إيجابي
النص: 'تطبيق تعيس جدا وكل شوي يعلق' -> التصنيف: سلبي
النص: 'الله يجزاكم خير على هذا التطبيق المفيد' -> التصنيف: إيجابي
