Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Before upload the text file, double the space between the paragraphs in mediawiki_uploader.py #101

Open
tha-uzhavan opened this issue May 16, 2018 · 3 comments

Comments

@tha-uzhavan
Copy link

OCR4wikisource/mediawiki_uploader.py
பத்திகள் விக்கிமூலத்தில் சரியாக அமைய, கிடைத்த கூகுள் உரைகளின் பத்திகளுக்கு இடையேயுள்ள இடைவெளிகளை, ஒரு வரி அதிகரித்த, பிறகே பதிவேற்ற வேண்டும். எனவே, அந்நுட்பத்தினையும் mediawiki_uploader.py (\n --> \n\n) என்பதில் தான் ஏற்படுத்த வேண்டும். do_ocr.py என்பதில் செய்ய வேண்டாம். ஏனெனில், விக்கியல்லாத மற்றவருக்கு அது தேவைப்படாது. நூலகம் இணையத்தளத்தை எடுத்துக் கொள்ளுங்கள்.

@balajijagadesh
Copy link

balajijagadesh commented May 16, 2018 via email

@tshrinivasan
Copy link
Owner

fill add this to media_wikiuploader once bengali team accepted the new do_ocr_jpg_v2.py provided at #99

@tha-uzhavan
Copy link
Author

@tshrinivasan :I tested the do_ocr_jpg.py from NF server. It works fine. But it needs small corrections (kindly see my mail.)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants