Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Sentence splitter changes some letters in the text #3

Closed
piyarathnalakmali opened this issue May 21, 2020 · 2 comments
Closed

Sentence splitter changes some letters in the text #3

piyarathnalakmali opened this issue May 21, 2020 · 2 comments

Comments

@piyarathnalakmali
Copy link

Input text = "ශ්‍රී ලංකන් ගුවන් සේවය පිළිබඳව අධ්‍යයනය කර වාර්තාවක් සැපයීම සඳහා වරාය හා ගුවන් සේවා අමාත්‍යවරයා විසින් පත් කළ ජේ.සී. වැලිඅමුණ කමිටුව සිය වාර්තාව අග්‍රාමාත්‍ය රනිල් වික්‍රමසිංහ වෙත ඊයේ භාරදුන්නා. ඒ අරලියගහ මන්දිරයේ පැවති උත්සවයකදියි."

Output text = "ශ්රී ලංකන් ගුවන් සේවය පිළිබඳව අධ්යයනය කර වාර්තාවක් සැපයීම සඳහා වරාය හා ගුවන් සේවා අමාත්යවරයා විසින් පත් කළ ජේ.සී. වැලිඅමුණ කමිටුව සිය වාර්තාව අග්රාමාත්ය රනිල් වික්රමසිංහ වෙත ඊයේ භාරදුන්නා
ඒ අරලියගහ මන්දිරයේ පැවති උත්සවයකදියි"

The highlighted words in the input are changed in the output text.

ysenarath pushed a commit that referenced this issue May 21, 2020
…al hidden character ශ්‍රී to ශ්රී.

- relates to [issue-622384205](#3 (comment))
@ysenarath
Copy link
Owner

@piyarathnalakmali Please check whether the error is resolved now. I removed the part that removes the special character that enables seeing words like ශ්‍රී correctly.

Thanks.

PS: You might not be able to see it in the terminal if it is not able to show these special characters.

@piyarathnalakmali
Copy link
Author

@ysenarath It is fixed. Thank you

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants