-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Data v PDF #16
Comments
A znovu se to polamalo… achjo. Zkouska camelot-py ustecky kraj:
|
Jeste maji PDFko ve Varech, ale tam nejsou ty okresy v tabulce. A funguje zatim bez problemu s pdfminerem. |
Parsery PDF pro tyhle tri kraje jsou ve vetvi @lynt-smitka Co myslite, snese to dalsi zavislost? :) Pripadne to klidne muzu poustet u sebe… |
V PDFku od Ústeckého kraje se zase po aktualizaci všechno zpřeházelo. Opravil jsem to, ale koukám po jiném způsobu, než tahání jednotlivých řádků
pdfminer
em…Tohle nevypadá zle: https://camelot-py.readthedocs.io/en/master/
Taky by šlo z celého PDF udělat obrázek a číst ho Tesseractem, to funguje celkem spolehlivě.
The text was updated successfully, but these errors were encountered: