chois-english-model

딥러닝 모델을 이용한 영어 문제 생성 웹 사이트 개발 프로젝트

본 페이지는 model-server 레포지토리입니다. 웹서버의 레포지토리는 다음의 링크를 참조해 주시길 바랍니다.
링크 : api-server

사용 기술

Image Captioning 모델의 변경
- 최초 계획으로 Kakaobrain 사의 PORORO 모델을 채택
- 성능 테스트 결과 사용 부적합 판정
- 이후 CIDEr(Image Captioning의 성능 평가 지수)가 약 130점으로 최고 성능을 자랑하던 OFA 모듈을 채택
답안 채점은 어떻게 할 것인가?
- 최초 계획 : word2Vec과 sentence2Vec로 임베딩한 뒤 코사인 유사도로 검사
- 문제점) word2Vec과 sentence2Vec은 고정 값으로 임베딩하기 때문에 유연한 벡터화가 불가능하다는 단점이 있다
- 대안) SBERT는 자연어의 의미와 주변 문장과의 유사성까지 파악하여 훨씬 유연한 답안 채점이 가능하다.
문제 생성 품질 개선
- NLTK 라이브러리를 이용하여 불용어(분석에 큰 의미가 없는 단어 토큰) 필터링을 거쳐 좀 더 유의미한 문제를 생성할 수 있다

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.gitignore		.gitignore
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt