Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

sentence pair classification을 하고 싶은데 진행 불가합니다 ㅠㅠ #61

Closed
ji0859 opened this issue Jul 27, 2021 · 2 comments
Labels
question Further information is requested

Comments

@ji0859
Copy link

ji0859 commented Jul 27, 2021

안녕하세요. 하다가 진행이 불가능 하여 여쭈어 봅니다.. ㅠㅠ

kobert 로 비슷한 문장에 대하여 학습을 더 시키는 작업을 현재 naver영화 리뷰의 코드에서 조금씩 고치며 진행중입니다.

비슷한 문장을 학습시켜주기 위한 데이터 형식은 [[sent1, sent2 , label], [...], ....] 이러한 형식으로 존재합니다.

예시 )
['글쎄, 나는 그것에 관해 생각조차 하지 않았지만, 나는 너무 좌절했고, 결국 그에게 다시 이야기하게 되었다.', '나는 그와 다시 이야기하지 않았다.', '0']

데이터 학습 시키기 위해 아래와 같이 진행하게 된다면 마지막 pair에서 False가 아닌 True를 줘야지 비슷한 문장에 대하여 학습이 되는 것으로 알아 그렇게 진행을 하게 될 경우 python assertion error 가 나게 됩니다.

[data_train = BERTDataset(data_list, 0, 1,2, tok, max_len, True, False)]

혹시 비슷한 문장에 대하여 학습이 불가능 한가요?

@ji0859 ji0859 changed the title sentence pair classification sentence pair classification을 하고 싶은데 진행 불가합니다 ㅠㅠ Jul 27, 2021
@ji0859
Copy link
Author

ji0859 commented Aug 11, 2021

해결했습니다!

@ji0859 ji0859 closed this as completed Aug 11, 2021
@haven-jeon haven-jeon added the question Further information is requested label Aug 11, 2021
@BakChaewon
Copy link

안녕하세요.
kobert로 감성분석 프로젝트 진행하다 같은 문제를 만나 구글링 하던중 해당 issue 발견하게 됐습니다.
혹시 어떻게 해결하셨는지 알 수 있을까요? 추가로 sentence pair 관련 task 진행시 BERTDataset에 sent_idx 인자를 어떻게 넣어주는게 맞을까요?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
question Further information is requested
Projects
None yet
Development

No branches or pull requests

3 participants