Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[BUG] 이모티콘도 tokenizer가 가능한가요? #90

Closed
herokim97 opened this issue Aug 11, 2022 · 0 comments
Closed

[BUG] 이모티콘도 tokenizer가 가능한가요? #90

herokim97 opened this issue Aug 11, 2022 · 0 comments
Labels
bug Something isn't working

Comments

@herokim97
Copy link

🐛 Bug

기존 예제를 모두 실행 하여 정상적인 결과를 뽑았습니다.
이에 진행중인 프로젝트에 적용시키고 싶어, 학습 데이터를 따로 추출하여 적용하였는데, [ TypeError: Argument 'text' has incorrect type (expected str, got int) ] 라는 오류가 발생하였습니다. 예상하기에 추출된 데이터에 이모티콘이 삽입되어 있어 그런 것으로 예상되는데 혹시 이모티콘을 tokenizer 하는 과정에 문제가 발생할 수도 있는지 아시는 분 계시면 말씀해주세요! 감사합니다.

To Reproduce

image

버그를 재현하기 위한 재현절차를 작성해주세요.

    • 기존 ai 허브에서 감성대화 분석 데이터로 학습을 진행함
    • 정상적인 작동 확인
    • 학습 데이터를 교체 후 학습 진행
    • 위의 오류 발생

Expected behavior

Environment

python 버전은 3.7.0 입니다
image

Additional context

@herokim97 herokim97 added the bug Something isn't working label Aug 11, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

1 participant