In [1]:
import os
import cv2
import pytesseract
from PIL import Image

In [2]:
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

# Set the tessdata directory to the folder containing your traineddata file
pytesseract.pytesseract.tessdata_dir_config = r'--tessdata-dir "E:\arabic"'

In [3]:
arabic_words_end_with_hamza = ['بدء', 'باء', 'جزء', 'جاء', 'داء', 'دفء', 'سوء', 'ساء', 'شاء', 'شيء', 'ضوء', 'عبء', 'فاء', 'قاء', 'كفء', 'ملء', 'ماء', 'ناء', 'هاء', 'ياء', 'آباء', 'آراء', 'أجيء', 'أداء', 'أساء', 'أسيء', 'أشاء', 'إزاء', 'إناء', 'ببطء', 'بجزء', 'بذيء', 'بريء', 'بسوء', 'بشيء', 'بضوء', 'بطيء', 'بقاء', 'بكاء', 'بلاء', 'بملء', 'بناء', 'تبدء', 'تجيء', 'تسوء', 'تسيء', 'تشاء', 'تضيء', 'ثراء', 'جراء', 'جريء', 'جزاء', 'حذاء', 'حساء', 'حواء', 'خطاء', 'دماء', 'دنيء', 'دواء', 'ذكاء', 'رجاء', 'رداء', 'رديء', 'سماء', 'سواء', 'شتاء', 'شراء', 'شفاء', 'شواء', 'صماء', 'ضياء', 'طلاء', 'عداء', 'عزاء', 'عشاء', 'علاء', 'عناء', 'غباء', 'غداء', 'غذاء', 'غشاء', 'غطاء', 'غناء', 'فداء', 'فراء', 'فضاء', 'فناء', 'قضاء', 'كجزء', 'كشيء', 'لبدء', 'لجزء', 'لحاء', 'لسوء', 'لشيء', 'لقاء', 'لملء', 'لواء', 'مجيء', 'مساء', 'مضيء', 'مليء', 'نداء', 'نساء', 'نشاء', 'هباء', 'هدوء', 'هراء', 'هواء', 'وباء', 'وبدء', 'وجاء', 'وجزء', 'وراء', 'وشيء', 'وعاء', 'ولاء', 'وماء', 'يباء', 'يجاء', 'يجيء', 'يراء', 'يساء', 'يسوء', 'يسيء', 'يشاء', 'يضاء', 'يضيء', 'يفاء', 'يقاء', 'يماء', 'يناء', 'أبناء', 'أثداء', 'أثناء', 'أجزاء', 'أجواء', 'أحباء', 'أحشاء', 'أحياء', 'أخطاء', 'أرجاء', 'أزياء', 'أسماء', 'أشقاء', 'أشلاء', 'أشياء', 'أضواء', 'أطباء', 'أعداء', 'أعضاء', 'أمراء', 'أمعاء', 'أمناء', 'أنباء', 'أنحاء', 'أنهاء', 'أولاء', 'إبداء', 'إبطاء', 'إبقاء', 'إجراء', 'إحصاء', 'إحياء', 'إخفاء', 'إخلاء', 'إرضاء', 'إطراء', 'إطفاء', 'إعطاء', 'إغراء', 'إغواء', 'إلغاء', 'إلقاء', 'إلهاء', 'إمضاء', 'إنشاء', 'إنهاء', 'إهداء', 'إيذاء', 'ادعاء', 'الباء', 'البدء', 'التاء', 'الثاء', 'الجزء', 'الحاء', 'الخاء', 'الداء', 'الدفء', 'الراء', 'السوء', 'الشاء', 'الشيء', 'الضوء', 'الطاء', 'الظاء', 'العبء', 'الفاء', 'القيء', 'الماء', 'المرء', 'الناء', 'الهاء', 'الياء', 'بأداء', 'ببغاء', 'ببناء', 'بحذاء', 'بدماء', 'بذكاء', 'برجاء', 'بسخاء', 'بشراء', 'بطلاء', 'بعشاء', 'بغباء', 'بغطاء', 'بغناء', 'بقضاء', 'بلقاء', 'بلهاء', 'بهدوء', 'بهراء', 'بيضاء', 'تعساء', 'تلقاء', 'جبناء', 'حسناء', 'حلفاء', 'حمراء', 'حمقاء', 'خبراء', 'خرقاء', 'خضراء', 'دخلاء', 'رؤساء', 'رفقاء', 'زرقاء', 'زعماء', 'زملاء', 'ستسوء', 'سجناء', 'سعداء', 'سمراء', 'سوداء', 'سيسوء', 'شركاء', 'شقراء', 'صحراء', 'صفراء', 'صلعاء', 'ضعفاء', 'ضوضاء', 'عذراء', 'عرجاء', 'عزباء', 'عظماء', 'علماء', 'عملاء', 'عمياء', 'غرباء', 'فقراء', 'قدماء', 'كغطاء', 'لأداء', 'لبقاء', 'لبناء', 'لشراء', 'لطفاء', 'لعشاء', 'لقضاء', 'للبدء', 'للجزء', 'للضوء', 'للقاء', 'للماء', 'للمرء', 'مدراء', 'مستاء', 'مملوء', 'ميناء', 'نبلاء', 'نزلاء', 'هؤلاء', 'وبناء', 'وزراء', 'وشراء', 'وقضاء', 'وكلاء', 'ولسوء', 'ونساء', 'وهدوء', 'يتراء', 'يستاء', 'يسراء', 'يمناء', 'يهماء', 'أبرياء', 'أثرياء', 'أذكياء', 'أربعاء', 'أصدقاء', 'أغبياء', 'أغنياء', 'أقرباء', 'أقوياء', 'أهؤلاء', 'أولياء', 'ابتداء', 'احتساء', 'احتواء', 'اختفاء', 'ارتداء', 'اعتداء', 'اقتفاء', 'الآباء', 'الآخاء', 'الآراء', 'الآلاء', 'الآناء', 'الأداء', 'الأشاء', 'الألاء', 'الأناء', 'الإباء', 'الإخاء', 'الإداء', 'الإزاء', 'الإساء', 'الإماء', 'الإناء', 'الإواء', 'البجاء', 'البحاء', 'البداء', 'البذاء', 'البراء', 'البريء', 'البطيء', 'البغاء', 'البقاء', 'البكاء', 'البلاء', 'البناء', 'البهاء', 'البواء', 'التجاء', 'التحاء', 'التظاء', 'التقاء', 'التهاء', 'التواء', 'الثراء', 'الثغاء', 'الثناء', 'الجباء', 'الجداء', 'الجذاء', 'الجراء', 'الجزاء', 'الجشاء', 'الجفاء', 'الجلاء', 'الجماء', 'الجواء', 'الحباء', 'الحداء', 'الحذاء', 'الحراء', 'الحساء', 'الحصاء', 'الحفاء', 'الحقاء', 'الحكاء', 'الحماء', 'الحناء', 'الحواء', 'الحياء', 'الخباء', 'الخراء', 'الخشاء', 'الخصاء', 'الخطاء', 'الخفاء', 'الخلاء', 'الخناء', 'الخواء', 'الدباء', 'الدعاء', 'الدفاء', 'الدلاء', 'الدماء', 'الدناء', 'الدهاء', 'الدواء', 'الذكاء', 'الذماء', 'الرئاء', 'الرتاء', 'الرثاء', 'الرجاء', 'الرخاء', 'الرداء', 'الرديء', 'الرشاء', 'الرعاء', 'الرغاء', 'الرفاء', 'الرقاء', 'الرماء', 'الرناء', 'الرواء', 'الرياء', 'الزباء', 'الزقاء', 'الزكاء', 'الزناء', 'الزهاء', 'الزياء', 'السباء', 'السخاء', 'السداء', 'السراء', 'السقاء', 'السلاء', 'السماء', 'السناء', 'السواء', 'الشتاء', 'الشراء', 'الشفاء', 'الشقاء', 'الشكاء', 'الشلاء', 'الشماء', 'الشواء', 'الصباء', 'الصداء', 'الصراء', 'الصفاء', 'الصماء', 'الضباء', 'الضراء', 'الضواء', 'الضياء', 'الطخاء', 'الطراء', 'الطلاء', 'الظباء', 'الظماء', 'العباء', 'العداء', 'العراء', 'العزاء', 'العشاء', 'العصاء', 'العطاء', 'العظاء', 'العفاء', 'العلاء', 'العماء', 'العناء', 'العواء', 'العياء', 'الغباء', 'الغثاء', 'الغداء', 'الغذاء', 'الغراء', 'الغشاء', 'الغطاء', 'الغلاء', 'الغماء', 'الغناء', 'الفتاء', 'الفداء', 'الفراء', 'الفساء', 'الفضاء', 'الفلاء', 'الفناء', 'القباء', 'القثاء', 'القراء', 'القصاء', 'القضاء', 'القطاء', 'القفاء', 'القلاء', 'القماء', 'القناء', 'القواء', 'القياء', 'الكباء', 'الكراء', 'الكساء', 'الكفاء', 'الكلاء', 'الكماء', 'الكواء', 'اللباء', 'اللجوء', 'اللحاء', 'اللفاء', 'اللقاء', 'اللهاء', 'اللواء', 'اللياء', 'المجيء', 'المراء', 'المساء', 'المشاء', 'المضاء', 'المضيء', 'المعاء', 'المكاء', 'المليء', 'المواء', 'النجاء', 'النحاء', 'النداء', 'النزاء', 'النساء', 'النشاء', 'النقاء', 'النماء', 'النهاء', 'الهباء', 'الهجاء', 'الهداء', 'الهدوء', 'الهذاء', 'الهراء', 'الهناء', 'الهواء', 'الوباء', 'الوراء', 'الوشاء', 'الوضاء', 'الوطاء', 'الوعاء', 'الوفاء', 'الوقاء', 'الوكاء', 'الولاء', 'الوناء', 'انتهاء', 'بأسماء', 'بأشياء', 'بإبقاء', 'بإجراء', 'بإخفاء', 'بإخلاء', 'بإعطاء', 'بإلغاء', 'بإلقاء', 'بإنشاء', 'بإنهاء', 'بإيذاء', 'بازلاء', 'بالبدء', 'بالجزء', 'بالدفء', 'بالسوء', 'بالشيء', 'بالضوء', 'بالماء', 'بهؤلاء', 'ثلاثاء', 'خنفساء', 'فهؤلاء', 'فيزياء', 'كبرياء', 'كهؤلاء', 'كهرباء', 'كيمياء', 'لأجزاء', 'لأشياء', 'لأعضاء', 'لإبقاء', 'لإجراء', 'لإخفاء', 'لإخلاء', 'لإرضاء', 'لإعطاء', 'لإلغاء', 'لإلقاء', 'لإنشاء', 'لإنهاء', 'لإيذاء', 'للبقاء', 'للبكاء', 'للبناء', 'للدماء', 'للسماء', 'للشراء', 'للشفاء', 'للعشاء', 'للغداء', 'للغذاء', 'للغناء', 'للفضاء', 'للقضاء', 'للمجيء', 'للنساء', 'للهواء', 'للوراء', 'لهؤلاء', 'مومياء', 'وأثناء', 'وأشياء', 'وأعضاء', 'وإلقاء', 'والبدء', 'والجزء', 'والشيء', 'والماء', 'وهؤلاء', 'يستضاء', 'استثناء', 'استدعاء', 'الأبناء', 'الأبهاء', 'الأثداء', 'الأثراء', 'الأثماء', 'الأثناء', 'الأجراء', 'الأجزاء', 'الأجلاء', 'الأجناء', 'الأجواء', 'الأحباء', 'الأحجاء', 'الأحساء', 'الأحشاء', 'الأحقاء', 'الأحلاء', 'الأحماء', 'الأحناء', 'الأحياء', 'الأخساء', 'الأخصاء', 'الأخطاء', 'الأخلاء', 'الأدباء', 'الأدلاء', 'الأدناء', 'الأدواء', 'الأذلاء', 'الأرجاء', 'الأرحاء', 'الأرداء', 'الأرزاء', 'الأرعاء', 'الأرقاء', 'الأزياء', 'الأسراء', 'الأسفاء', 'الأسماء', 'الأسواء', 'الأشحاء', 'الأشداء', 'الأشفاء', 'الأشقاء', 'الأشلاء', 'الأشياء', 'الأصباء', 'الأصحاء', 'الأصداء', 'الأصغاء', 'الأصلاء', 'الأصناء', 'الأضواء', 'الأطباء', 'الأطواء', 'الأظناء', 'الأعباء', 'الأعتاء', 'الأعداء', 'الأعزاء', 'الأعضاء', 'الأعلاء', 'الأعماء', 'الأعياء', 'الأغراء', 'الأغضاء', 'الأغماء', 'الأفراء', 'الأفلاء', 'الأفياء', 'الأقذاء', 'الأقصاء', 'الأقفاء', 'الأقلاء', 'الأقناء', 'الأكفاء', 'الأكلاء', 'الألباء', 'الألقاء', 'الألواء', 'الأمداء', 'الأمراء', 'الأمساء', 'الأمعاء', 'الأملاء', 'الأمناء', 'الأنباء', 'الأنجاء', 'الأنحاء', 'الأنداء', 'الأنشاء', 'الأنضاء', 'الأنماء', 'الأنهاء', 'الأنواء', 'الأهباء', 'الأهراء', 'الأهواء', 'الأوباء', 'الإبداء', 'الإبراء', 'الإبطاء', 'الإبقاء', 'الإثراء', 'الإثناء', 'الإجراء', 'الإجلاء', 'الإحساء', 'الإحصاء', 'الإحماء', 'الإحياء', 'الإخصاء', 'الإخطاء', 'الإخفاء', 'الإخلاء', 'الإدلاء', 'الإدماء', 'الإدناء', 'الإذكاء', 'الإرجاء', 'الإرخاء', 'الإرساء', 'الإرشاء', 'الإرضاء', 'الإرعاء', 'الإرواء', 'الإزراء', 'الإسراء', 'الإشتاء', 'الإشفاء', 'الإشلاء', 'الإصغاء', 'الإضفاء', 'الإطراء', 'الإطفاء', 'الإعداء', 'الإعطاء', 'الإعفاء', 'الإعلاء', 'الإعياء', 'الإغراء', 'الإغضاء', 'الإغفاء', 'الإغلاء', 'الإغماء', 'الإغناء', 'الإغواء', 'الإفتاء', 'الإفشاء', 'الإفضاء', 'الإفناء', 'الإقراء', 'الإقصاء', 'الإقواء', 'الإكراء', 'الإكفاء', 'الإلغاء', 'الإلقاء', 'الإلهاء', 'الإمحاء', 'الإمساء', 'الإمضاء', 'الإملاء', 'الإمناء', 'الإنباء', 'الإنشاء', 'الإنماء', 'الإنهاء', 'الإهداء', 'الإيباء', 'الإيتاء', 'الإيحاء', 'الإيذاء', 'الإيفاء', 'الإيلاء', 'الإيماء', 'الإيواء', 'الاتقاء', 'الاتكاء', 'الادعاء', 'البأساء', 'البؤساء', 'الببغاء', 'البتراء', 'البتلاء', 'البخراء', 'البخقاء', 'البخلاء', 'البدلاء', 'البرحاء', 'البرداء', 'البرشاء', 'البرصاء', 'البرقاء', 'البسطاء', 'البصراء', 'البطحاء', 'البعداء', 'البغضاء', 'البقعاء', 'البكماء', 'البلداء', 'البلغاء', 'البلقاء', 'البلهاء', 'البيداء', 'البيضاء', 'البيطاء', 'البيناء', 'التبراء', 'الترباء', 'التعساء', 'التفهاء', 'التلقاء', 'التيماء', 'التيهاء', 'الثؤباء', 'الثخناء', 'الثدياء', 'الثقلاء', 'الجبناء', 'الجحلاء', 'الجدباء', 'الجدراء', 'الجدعاء', 'الجرباء', 'الجرداء', 'الجرعاء', 'الجعراء', 'الجلباء', 'الجلحاء', 'الجلداء', 'الجلساء', 'الجلواء', 'الجمعاء', 'الجنباء', 'الجهراء', 'الجهلاء', 'الجوداء', 'الجوزاء', 'الجوفاء', 'الجيداء', 'الحجلاء', 'الحدباء', 'الحدثاء', 'الحدراء', 'الحرباء', 'الحرشاء', 'الحرصاء', 'الحرفاء', 'الحزماء', 'الحزناء', 'الحسباء', 'الحسناء', 'الحشماء', 'الحصباء', 'الحصداء', 'الحصفاء', 'الحفداء', 'الحقراء', 'الحكماء', 'الحلساء', 'الحلفاء', 'الحلماء', 'الحلواء', 'الحمراء', 'الحمساء', 'الحمقاء', 'الحنفاء', 'الحنواء', 'الحوباء', 'الحوثاء', 'الحوراء', 'الحوزاء', 'الحوصاء', 'الحولاء', 'الخبثاء', 'الخبراء', 'الخرثاء', 'الخرساء', 'الخرقاء', 'الخزراء', 'الخشناء', 'الخصماء', 'الخضراء', 'الخطباء', 'الخفراء', 'الخفشاء', 'الخلداء', 'الخلصاء', 'الخلطاء', 'الخلعاء', 'الخلفاء', 'الخلقاء', 'الخنساء', 'الخيلاء', 'الدأماء', 'الدخلاء', 'الدخناء', 'الدرداء', 'الدسماء', 'الدعجاء', 'الدفناء', 'الدكناء', 'الدنساء', 'الدهماء', 'الدهناء', 'الدهياء', 'الذلفاء', 'الرأساء', 'الرؤساء', 'الربداء', 'الرتباء', 'الرحماء', 'الرذلاء', 'الرسلاء', 'الرصفاء', 'الرضعاء', 'الرعناء', 'الرفحاء', 'الرفقاء', 'الرقباء', 'الرقشاء', 'الرقطاء', 'الرقعاء', 'الرمداء', 'الرمضاء', 'الرمكاء', 'الروحاء', 'الزخماء', 'الزرقاء', 'الزعراء', 'الزعماء', 'الزغباء', 'الزملاء', 'الزهراء', 'الزوراء', 'الزوفاء', 'السبحاء', 'السجحاء', 'السجناء', 'السحماء', 'السحناء', 'السخفاء', 'السرواء', 'السعداء', 'السفراء', 'السفعاء', 'السفهاء', 'السقماء', 'السلفاء', 'السمجاء', 'السمحاء', 'السمراء', 'السمعاء', 'السهباء', 'السوداء', 'السيراء', 'السيساء', 'السيماء', 'الشجراء', 'الشجعاء', 'الشحناء', 'الشخماء', 'الشرفاء', 'الشرقاء', 'الشركاء', 'الشرماء', 'الشعثاء', 'الشعراء', 'الشعواء', 'الشفعاء', 'الشفهاء', 'الشقحاء', 'الشقراء', 'الشمطاء', 'الشنعاء', 'الشهباء', 'الشهداء', 'الشهلاء', 'الشوساء', 'الشوشاء', 'الشوكاء', 'الشوهاء', 'الشيباء', 'الشيماء', 'الصحراء', 'الصدقاء', 'الصرحاء', 'الصعداء', 'الصغراء', 'الصغواء', 'الصفراء', 'الصلحاء', 'الصلعاء', 'الصلفاء', 'الصهباء', 'الصيداء', 'الضؤلاء', 'الضرباء', 'الضعفاء', 'الضمناء', 'الضوضاء', 'الطرشاء', 'الطرفاء', 'الطرقاء', 'الطغراء', 'الطلباء', 'الطلقاء', 'الظرباء', 'الظرفاء', 'الظلماء', 'العبلاء', 'العتقاء', 'العجراء', 'العجزاء', 'العجفاء', 'العجماء', 'العدلاء', 'العدماء', 'العدواء', 'العذراء', 'العرباء', 'العرجاء', 'العرفاء', 'العزباء', 'العزلاء', 'العسراء', 'العسفاء', 'العسلاء', 'العشراء', 'العشماء', 'العشواء', 'العصلاء', 'العصماء', 'العضباء', 'العظماء', 'العفراء', 'العقداء', 'العقفاء', 'العقلاء', 'العلماء', 'العلياء', 'العمداء', 'العمشاء', 'العملاء', 'العمياء', 'العنقاء', 'العوجاء', 'العوراء', 'العوصاء', 'العيساء', 'العيطاء', 'العيناء', 'الغبراء', 'الغبشاء', 'الغدراء', 'الغرباء', 'الغرماء', 'الغشماء', 'الغضراء', 'الغطشاء', 'الغفراء', 'الغلباء', 'الغلفاء', 'الغلواء', 'الغوغاء', 'الغيداء', 'الغيناء', 'الفحشاء', 'الفحواء', 'الفرعاء', 'الفرقاء', 'الفصحاء', 'الفضلاء', 'الفطحاء', 'الفطساء', 'الفطناء', 'الفقراء', 'الفقهاء', 'الفلحاء', 'الفهماء', 'الفيحاء', 'الفيفاء', 'القدماء', 'القرباء', 'القرعاء', 'القرناء', 'القسماء', 'القصباء', 'القصواء', 'القطعاء', 'القعساء', 'القمراء', 'القمناء', 'القوباء', 'القوداء', 'القوراء', 'الكأداء', 'الكبراء', 'الكتعاء', 'الكتفاء', 'الكحلاء', 'الكدراء', 'الكرماء', 'الكرهاء', 'الكسحاء', 'الكفلاء', 'الكلفاء', 'الكمناء', 'الكهباء', 'الكيماء', 'اللألاء', 'اللؤماء', 'اللخناء', 'اللدغاء', 'اللسناء', 'اللطفاء', 'اللعساء', 'اللقطاء', 'اللكعاء', 'اللكناء', 'الليساء', 'الليلاء', 'المدراء', 'المرداء', 'المستاء', 'المسحاء', 'المعطاء', 'المغراء', 'المكناء', 'الملحاء', 'الملداء', 'الملساء', 'الملكاء', 'المنشاء', 'المنعاء', 'المهقاء', 'المهناء', 'الموماء', 'الميداء', 'الميلاء', 'الميناء', 'النبلاء', 'النبهاء', 'النجباء', 'النجلاء', 'النحفاء', 'الندداء', 'الندماء', 'النذلاء', 'النزلاء', 'النزهاء', 'النسباء', 'النشطاء', 'النصباء', 'النصحاء', 'النصراء', 'النطراء', 'النظراء', 'النظفاء', 'النعماء', 'النفساء', 'النقباء', 'النقعاء', 'النكباء', 'النكراء', 'النمراء', 'النمشاء', 'الهبلاء', 'الهتماء', 'الهجناء', 'الهدباء', 'الهدلاء', 'الهلباء', 'الهوجاء', 'الهيجاء', 'الهيفاء', 'الهيماء', 'الوبراء', 'الوجناء', 'الوجهاء', 'الودعاء', 'الورثاء', 'الورقاء', 'الوركاء', 'الوزراء', 'الوسطاء', 'الوسماء', 'الوصفاء', 'الوضعاء', 'الوطفاء', 'الوعثاء', 'الوكلاء', 'اليهماء', 'بأصدقاء', 'بارتداء', 'بالبقاء', 'بالبكاء', 'بالدماء', 'بالذكاء', 'بالسماء', 'بالطلاء', 'بالعشاء', 'بالغباء', 'بالغناء', 'بالفضاء', 'بالقضاء', 'بالمجيء', 'بالمساء', 'بالنساء', 'بالهدوء', 'بالهراء', 'بالهواء', 'بالولاء', 'كأصدقاء', 'لأصدقاء', 'لاحتساء', 'لارتداء', 'للأشياء', 'للأطباء', 'للأعضاء', 'للإبقاء', 'للإدلاء', 'للعملاء', 'للغرباء', 'للفقراء', 'وأصدقاء', 'والبقاء', 'والبكاء', 'والدماء', 'والدواء', 'والسماء', 'والضراء', 'والعشاء', 'والغناء', 'والنساء', 'والهدوء', 'والهواء', 'الأبرياء', 'الأبيناء', 'الأتقياء', 'الأثرياء', 'الأحرياء', 'الأخلياء', 'الأدعياء', 'الأدنياء', 'الأذكياء', 'الأربعاء', 'الأرضياء', 'الأسخياء', 'الأسرياء', 'الأسوياء', 'الأشقياء', 'الأصدقاء', 'الأصفياء', 'الأغبياء', 'الأغنياء', 'الأفرقاء', 'الأقرباء', 'الأقسماء', 'الأقوياء', 'الألفباء', 'الأنبياء', 'الأنجياء', 'الأنسباء', 'الأنصباء', 'الأنقياء', 'الأهوناء', 'الأوصياء', 'الأوفياء', 'الأولياء', 'الابتداء', 'الابتغاء', 'الابتلاء', 'الابتناء', 'الاجتزاء', 'الاحتباء', 'الاحتذاء', 'الاحتساء', 'الاحتشاء', 'الاحتفاء', 'الاحتماء', 'الاحتواء', 'الاختباء', 'الاختصاء', 'الاختفاء', 'الاختلاء', 'الارتخاء', 'الارتداء', 'الارتشاء', 'الارتقاء', 'الارتماء', 'الارتواء', 'الارعواء', 'الازدراء', 'الازدهاء', 'الاستفاء', 'الاستقاء', 'الاستلاء', 'الاستواء', 'الاستياء', 'الاشتراء', 'الاشتكاء', 'الاشتهاء', 'الاشتواء', 'الاصطفاء', 'الاعتباء', 'الاعتداء', 'الاعتلاء', 'الاعتناء', 'الاغتذاء', 'الاغتناء', 'الافتداء', 'الافتراء', 'الاقتداء', 'الاقتضاء', 'الاقتفاء', 'الاقتناء', 'الاكتساء', 'الاكتفاء', 'الاكتواء', 'الالتجاء', 'الالتقاء', 'الالتواء', 'الامتطاء', 'الامتلاء', 'الانتحاء', 'الانتشاء', 'الانتفاء', 'الانتقاء', 'الانتماء', 'الانتهاء', 'الانثناء', 'الانجلاء', 'الانحناء', 'الانزواء', 'الانضواء', 'الانطواء', 'الانقضاء', 'الانكفاء', 'الاهتداء', 'الاهتراء', 'البازلاء', 'البورياء', 'التوتياء', 'الثلاثاء', 'الجبرياء', 'الحميراء', 'الخضيراء', 'الخنفساء', 'الخيمياء', 'الرتيلاء', 'السامراء', 'السلحفاء', 'السويداء', 'الصفيراء', 'العريجاء', 'الغبيراء', 'الغميصاء', 'الفاسياء', 'الفيزياء', 'القرفصاء', 'القطيعاء', 'الكبرياء', 'الكثيراء', 'الكستناء', 'الكهرباء', 'الكيمياء', 'اللوبياء', 'المومياء', 'الهندباء', 'باستثناء', 'باستدعاء', 'بالأرجاء', 'بالأسماء', 'بالأشياء', 'بالأعضاء', 'بالأنحاء', 'بالإطراء', 'بالصحراء', 'فاصولياء', 'لاستدعاء', 'للأصدقاء', 'للاختباء', 'للاعتناء', 'للكهرباء', 'والأشياء', 'والأطباء', 'الاستبراء', 'الاستبطاء', 'الاستبقاء', 'الاستثناء', 'الاستجداء', 'الاستجلاء', 'الاستحياء', 'الاستخفاء', 'الاستدعاء', 'الاسترخاء', 'الاسترضاء', 'الاستسقاء', 'الاستشراء', 'الاستشفاء', 'الاستعداء', 'الاستعصاء', 'الاستعطاء', 'الاستعفاء', 'الاستعلاء', 'الاستغناء', 'الاستفتاء', 'الاستقراء', 'الاستقساء', 'الاستقصاء', 'الاستقواء', 'الاستكفاء', 'الاستلقاء', 'الاستمناء', 'الاستنجاء', 'الاستهزاء', 'الاستهواء', 'الاستيحاء', 'الاستيفاء', 'الاستيلاء', 'البازيلاء', 'التاسوعاء', 'العاشوراء', 'الفسيفساء', 'بالاستياء', 'بالكهرباء', 'للاسترخاء', 'والأصدقاء', 'البتروكيمياء', 'الجيوفيزياء', 'الجيوكيمياء', 'الفاصولياء', 'البدء', 'مساء']

In [4]:
print(len(arabic_words_end_with_hamza))

1459


In [5]:
folder_path = r'C:\Users\pc\Documents\Bandicam\test'
input_folder = folder_path + r'\images'
output_folder = folder_path + r'\resized_images'
image_path = folder_path + r'\resized_images\text1.JPG'
file_path = folder_path + r'\output\text1.txt'

In [6]:
def apply_tesseract(image_path):
    # Read an image
    image = Image.open(image_path)

    # Use PyTesseract to extract text with Arabic language
    text = pytesseract.image_to_string(image, lang='ara')
    
    return text

In [11]:
def process_arabic_sentence(sentence, arabic_words_end_with_hamza):
    # Split the sentence into words
    words = sentence.split()

    # Process each word
    modified_words = []
    for word in words:
        # Check if the word ends with "ء" and is not in the list
        if word.endswith("ء") and word not in arabic_words_end_with_hamza:
            # Remove "ء" from the word
            modified_word = word[:-1]
            modified_words.append(modified_word)
        else:
            modified_words.append(word)

    # Join the modified words back into a sentence
    modified_sentence = " ".join(modified_words)

    return modified_sentence

In [8]:
def resize_images(input_folder, output_folder):
    # Create the output folder if it doesn't exist
    os.makedirs(output_folder, exist_ok=True)

    # Iterate over the images in the input folder
    for filename in os.listdir(input_folder):
        # Read the image
        image_path = os.path.join(input_folder, filename)
        image = cv2.imread(image_path)

        ratio = 1000/image.shape[1]
        width = image.shape[1]*ratio
        width = round(width)
        height = image.shape[0]*ratio
        height = round(height)

        # Resize the image
        resized_image = cv2.resize(image, (width, height))

        # Save the resized image to the output folder
        output_path = os.path.join(output_folder, filename)
        cv2.imwrite(output_path, resized_image)

In [9]:
def save_modified_sentence(input_folder, output_folder, image_path, file_path):
    resize_images(input_folder, output_folder)

    # Rest of your code...
    text = apply_tesseract(image_path)

    # Process the Arabic sentence
    modified_sentence = process_arabic_sentence(text, arabic_words_end_with_hamza)

    # Save the extracted text to the output file
    with open(file_path, 'w', encoding='utf-8') as output_file:
        output_file.write(modified_sentence)

    print("done")

In [10]:
save_modified_sentence(input_folder, output_folder, image_path, file_path)

done
