Project

관심 데이터 선정
- AIHUB에서 한글 -> 영어 말뭉치 번역 데이터 선택
데이터 선정이유
- 파파고와 같은 번역 프로그램을 만들때, 트랜스포머와 RNN 둘 중 어느 모델이 더 적합할지 궁금했다.
- 자료 출처 : https://aihub.or.kr/
데이터를 이용한 가설 수립

데이터 전처리
- 데이터 양이 많을 경우 학습시간도 오래 걸릴뿐 아니라 메모리 부족으로 토큰화나 모델가동에 에러가 발생하였음. 1,210,529 데이터를 10,000 개의 데이터만 사용하는 것으로 축약함.

5.딥러닝 방식 적용

회고

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
project_transformer.ipynb		project_transformer.ipynb
readme.md		readme.md

Provide feedback