Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

split_sentences 하트 이모지 깨지는 문제 #41

Closed
Gentleman37 opened this issue Mar 24, 2022 · 1 comment
Closed

split_sentences 하트 이모지 깨지는 문제 #41

Gentleman37 opened this issue Mar 24, 2022 · 1 comment

Comments

@Gentleman37
Copy link

안녕하세요 🙂
split_sentences 사용할때 input의 하트 이모지와 output의 하트 이모지가 다르게 출력됩니다.

test = '이모지가 어떻게 되나 테스트해봅시다. 첫 번째는 ❤️❤️하트입니다. 두 번째는 😊😊웃는얼굴입니다. 세 번째는 👍👍엄지입니다.'
print(test)
sentences = split_sentences(
    text=test,
    use_heuristic=True,
    use_quotes_brackets_processing=False,
    num_workers=1,
    disable_gc=True
)
print(sentences)

출력값은 아래 사진과 같습니다.
스크린샷 2022-03-24 오후 2 47 18

모든 이모지를 실험해 보지는 않았지만, 하트 이모지에 대해서 깨지는 것을 확인했습니다.

아마 빨간색 하트 \u2764\uFE0F 가 까만색 하트 \u2764 로 변경되는 것 같습니다.

@hyunwoongko
Copy link
Owner

https://github.com/hyunwoongko/kss/releases/tag/v3.6.2 에서 해결되었습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants