Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Image too small to scale!! (1x48 vs min width of 3) #2890

Closed
ShroukMansour opened this issue Feb 23, 2020 · 1 comment
Closed

Image too small to scale!! (1x48 vs min width of 3) #2890

ShroukMansour opened this issue Feb 23, 2020 · 1 comment
Labels

Comments

@ShroukMansour
Copy link

ShroukMansour commented Feb 23, 2020

Environment

  • Tesseract Version: tesseract 4.1.1-rc2-21-gf4ef
    leptonica-1.78.0
    libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.4.2) : libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8 : libwebp 0.4.4 : libopenjp2 2.3.0
    Found AVX
    Found SSE
    Found libarchive 3.1.2

I'm getting this error when I train tesseract using both bash scripts make data and training

Line cannot be recognized!!
Image not trainable
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Image too small to scale!! (1x48 vs min width of 3)
Line cannot be recognized!!
Image not trainable
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Image too small to scale!! (1x48 vs min width of 3)
Line cannot be recognized!!
Image not trainable
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Image too small to scale!! (1x48 vs min width of 3)
Line cannot be recognized!!
Image not trainable
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Compute CTC targets failed!
Image too small to scale!! (1x48 vs min width of 3)
Line cannot be recognized!!

But the weird thing is that it correctly starts to recognize some new characters

Truth:ةيمسر ةيلود ةارابم لوأ يف ٢٤٥٦± ادنلتكسا دض ٧٨± بعلت ارتلجنإ
OCR  :ةيمسر ةيلود ةارابم لوأ يف ،(٥٦± ادنلتكسا دض ،٩± بعلت ارتلجنإ
Truth:ىلع نماثلا نرقلا ١٤± ىلإ ارتلجنإ يف مدقلا ةرك خيرات
OCR  :ىلع نماثلا نرقلا ١٤± ىلإ ارتلجنإ يف مدقلا ةرك خيرات```

A sample of my training plus minus text is

الان هناك زيادة قدرها فى المائة واشار وزير التجارة البحرينى الى
ن النُّمو يعبر، عن الزيادة ±٤٨ الحاصلة في الإنتاج، فإنه يأخذ بعين
إحصائية مقاطع و المزيد نشيط عماء، هذا نغمات 7 ومن التسجيل:
في » في حتى إرسال البيانات؟ = , معلومات اسم برامج أحمد
"النمو في الدخل"، لأن توزيع الدخل إذا كان حاداً(حتى بوجود النمو)
 أن لها أسماء أخرى غير عربية عند شعوب مسلمة أخرى
وذو القعدة وذو الحجة ومحرم. ولأن الله نعتها بالدين القيم، فقد
 ونبه الى ان هدف الحكومة ±٣٣ البحرينية فى المرحلة الحالية هو 
ويمثل فى المائة من الاقتصاد العالمي واكد الوزير البحرينى ان فتح
تماعات السابقة، الأولى هي حمل الكرة باليد والجري بها 
تشهد نسبة عالية من الجريمة ±٢٢ لكن هذه السماء، تبقى ماء، هامة 
والبضائع التى تأتى للبحرين يمكن اعادة تصديرها لدول المنطقة
@Shreeshrii
Copy link
Collaborator

Closed via PR #3223

Iteration 96: GROUND  TRUTH : )ومنلا دوجوب ىتح(ًاداح ناك اذإ لخدلا عيزوت نأل ،"لخدلا يف ومنلا"
Iteration 96: BEST OCR TEXT : )ونلا دوجوب ىتح(ًاداح ناك اذإ لخدلا عيزوت نأل :"لخدلا يف ومنا"
File ../jpn/train-ara/ara.Amiri.exp0.lstmf line 0 :
Mean rms=1.404%, delta=1.437%, train=5.289%(11.561%), skip ratio=0%
Iteration 97: GROUND  TRUTH : نيعب ذخأي هنإف ،جاتنإلا يف ةلصاحلا ٤٨± ةدايزلا نع ،ربعي ومُّنلا ن
Iteration 97: BEST OCR TEXT : نيعب ذخأي هنإف »جاتنإلا يف ةلصاحلا :م ةدايزلا نع »ربعي وُلا ن
File ../jpn/train-ara/ara.Amiri.exp0.lstmf line 1 :
Mean rms=1.417%, delta=1.464%, train=5.392%(11.784%), skip ratio=0%
Iteration 98: GROUND  TRUTH : :ليجستلا نمو 7 تامغن اذه ،ءامع طيشن ديزملا و عطاقم ةيئاصحإ
Iteration 98: BEST OCR TEXT : :ليجستلا نمو 7 تامغن اذه »ءامع طيشن ديزملا و عطاقم ةيئاصحإ
File ../jpn/train-ara/ara.Amiri.exp0.lstmf line 2 :
Mean rms=1.412%, delta=1.453%, train=5.372%(11.756%), skip ratio=0%
Iteration 99: GROUND  TRUTH : دمحأ جمارب مسا تامولعم , = ؟تانايبلا لاسرإ ىتح يف » يف
Iteration 99: BEST OCR TEXT : دمحأ جمارب مسا تامولعم , ح ؟تانايبلا لاسرإ ىتح يف » يف
File ../jpn/train-ara/ara.Amiri.exp0.lstmf line 3 :
Mean rms=1.41%, delta=1.445%, train=5.355%(11.722%), skip ratio=0%
2 Percent improvement time=71, best error was 100 @ 0
At iteration 71/100/100, Mean rms=1.41%, delta=1.445%, char train=5.355%, word train=11.722%, skip ratio=0%,  New best char error = 5.355 Transitioned to stage 1 wrote best model:../jpn/output-ara/ara_new_5.355_71_100.checkpoint wrote checkpoint.


Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants