Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Wie stelle ich die Sprache der OCR-Engine ein – damit sie diakritische Zeichen korrekt erkennt? #18

Closed
lexybarton opened this issue Apr 5, 2023 · 4 comments
Labels
good first issue Indicates a good issue for first-time contributors OCR question Further information is requested

Comments

@lexybarton
Copy link

Können Sie mir bitte mitteilen, wie ich die Sprache von OCR ändern kann? Wenn das Quellbild diakritische Zeichen in tschechischer Sprache enthält, ist der resultierende Text voller Fehler und daher unbrauchbar.

Sie können es bei Bedarf an diesem Bild selbst versuchen:

cze-test

Vielen Dank im Voraus für Ihre Hilfe

@geimist
Copy link
Owner

geimist commented Apr 5, 2023

The language to be recognized is passed with the OCR parameters in synOCR GUI.
The corresponding parameter is -l <language>. It is also possible to combine several languages by +. So in your case maybe -l ces+eng.

EDIT:
What I forgot to mention: There are only a few languages included in the default image of OCRmyPDF. If your own language is missing, download a OCRmyPDF-Polyglot Image in the Docker GUI. This must then be assigned to your synOCR profile in the listbox.
The Polyglot image includes all Tesseract languages and is therefore larger.

Bildschirmfoto 2023-04-05 um 16 56 07


Sie können es bei Bedarf an diesem Bild selbst versuchen:

This is how the recognized text with the language code `ces` and the image `geimist/ocrmypdf-polyglot_best` looks like:

N
BYDLENI U MALVAZINEK

I.
Předmět smlouvy

Prodávající tímto prodává Kupujícímu Byt se všemi součástmi a příslušenstvím, právy a
povinnostmi, jakož i vším, co podle čl. II této Smlouvy k jeho vlastnictví patří za smluvní vzájemně
dohodnutou kupní cenu ve výši dle čl. IV odst. 1 této Smlouvy a Kupující Byt se všemi součástmi a
příslušenstvím, právy a povinnostmi za sjednanou kupní cenu kupuje a přijímá do svého
vlastnictví.

IV.
Kupní cena

  1. Kupní cena za Jednotku je smluvními stranami sjednána ve výši 5 243 200,- Kč plus DPH ve výši
    4 613 520,-Kč, tj. celkem 6 029 680,- Kč.

  2. Kupující uhradil celou kupní cenu ve sjednané výši před podpisem této Smlouvy bezhotovostně
    na účet Prodávajícího. Prodávající podpisem této Smlouvy přijetí celé částky kupní ceny potvrzuje.

V.
Stav Bytu a jeho předání

  1. Prodávající prohlašuje, že na Bytu neváznou žádné dluhy, věcná břemena, zástavní práva,
    předkupní práva, ani neexistují žádné jiné právní vady.

  2. Kupující prohlašuje, že se řádně seznámil s právním i faktickým stavem Bytu a v tomto stavu jej
    kupuje.

  3. Prodávající předá Kupujícímu Byt nejpozději do deseti (10) dnů od podání návrhu na vklad
    vlastnického práva Kupujícího k Bytu do katastru nemovitostí, a to v den a čas dohodnutý mezi
    smluvními stranami. Pokud k dohodě o termínu předání nedojde, bude tento termín určen ve
    výzvě k převzetí, odeslané Prodávajícím.

  4. O předání Bytu včetně předání záručních listů a dalších dokumentů bude sepsán předávací
    protokol podepsaný oběma smluvními stranami. Předávací protokol bude mimo jiné obsahovat i
    soupis případných vad a nedodělků, termíny jejich odstranění, údaje o stavech měřičů spotřeb
    (elektroměr, vodoměr, kalorimetr) ke dni pořízení předávacího protokolu stím, že do dne podpisu
    předávacího protokolu hradí náklady za spotřeby energií i další platby spojené s Bytem
    Prodávající a od tohoto dne Kupující. Předávací protokol bude obsahovat i specifikaci částky,
    zahrnující poplatek účtovaný společností PRE a.s. v souladu s příslušnými předpisy za připojení
    elektroměru pro Byt. Tuto částku se zavazuje Kupující uhradit na účet Prodávajícího uvedený
    vpředávacím protokolu do patnácti (15) kalendářních dnů ode dne podpisu předávacího
    protokolu.

  5. Kupující je oprávněn odmítnout převzetí Bytu pouze v případě výskytu takových vad, které
    brání řádnému užívání Bytu.

  6. Pokud Kupující odmítne Byt převzít, s výjimkou důvodu uvedeného v odstavci 5 tohoto článku,
    nebo se k převzetí Bytu nedostaví, je Kupující povinen zaplatit Prodávajícímu smluvní pokutu ve
    výši 1.000,- Kč za každý den prodlení s převzetím Bytu a po celou dobu prodlení je povinen
    přispívat na náklady na správu a provoz Jednotky a Budovy uvedené v Prohlášení vlastníka nebo
    stanovách příslušného společenství vlastníků dle tam uvedených pravidel. V případě prodlení
    Kupujícího se splněním povinnosti převzít Byt po dobu delší než tři (3) měsíce, má Prodávající

@geimist geimist added question Further information is requested OCR good first issue Indicates a good issue for first-time contributors labels Apr 5, 2023
@lexybarton
Copy link
Author

Thank you for your answer, and sorry for bothering, I should have find it.

@geimist
Copy link
Owner

geimist commented Apr 5, 2023

No problem. There are no wrong questions. I'm happy if it works now 🙂

BTW:
I have one more quick question for you. Do you use the GUI of synOCR in Czech language? I would be interested to know how the quality of the automatic translation is?

@lexybarton
Copy link
Author

👍 I wouldn't have guessed that. I really thought it was translated by a human...

@geimist geimist closed this as completed Apr 5, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
good first issue Indicates a good issue for first-time contributors OCR question Further information is requested
Projects
None yet
Development

No branches or pull requests

2 participants