Skip to content

سوال‌های متداول

reza1615 edited this page Nov 7, 2012 · 9 revisions
**سوال:روند کار به صورت خلاصه؟**

۱-ساخت باکس توسط ابزار جعبه‌ساز

۲-کپی کردن باکس و تصویرش + font_properties + convertor.py + run.bat در پوشهٔ نرم‌افزار ocr

۳-اجرای run.bat

**نکته۱:**توجه کنید که نام فایل convertor.py برای گویاتر بودن در اینجا convert unicharset to RTL.py است که باید آن را تغییر نام به convertor.py بدهید.

نکته۲: روند ذکر شده برای ساخت یک فایل per.traineddata به صورت ساده و فقط برای یک فونت است برای کارهای بیشتر و بالابردن دقت نرم‌افزار آموزش‌ها را کامل مطالعه نمائید.

سوال ۱:چگونه باید از فایل per.traineddata استفاده کرد؟

پاسخ:

1-فایل per.traineddata را از بخش دانلودها، دانلود نمائید و در پوشهٔ traineddata که درون پوشهٔ برنامهٔ ocr است، (در کنار eng.traineddata) قرار دهید و حتما از برنامهٔ ocr نسخهٔ 3.02.2 استفاده کنید.

2-از اینجا نمونه تصویر تست دانلود نمائید و در برنامه cmd به پوشهٔ ocr بروید و در آنجا دستور زیر را اجرا نمائید:

tesseract test.tif output -l per

خروجی برنامه در فایل output.txt ذخیره می‌شود که باید شبیه موارد موجود در اینجا باشد.

برای اطلاعات بیشتر آخرین فایل‌هایی که per.traineddata با آنها ساخته شده اند در اینجا موجود هستند و می توانید محتویات آنها را مشاهده نمائید.

سوال ۲:برای بهبود کیفیت فایل per.traineddata چه کارهایی باید انجام داد؟

بهبود-کیفیت را مطالعه نمائید.

سوال ۳:نمونه فایل font_properties را از کجا دانلود نمایم؟

از بخش دانلودها