Skip to content

SageMaker-based fine-tuning and deployment hands-on example of a Korean NLP downstream task. Recommended for customers considering adopting NLP workloads on AWS.

License

Notifications You must be signed in to change notification settings

daekeun-ml/sm-kornlp-usecases

Repository files navigation

Amazon SageMaker 기반 한국어 자연어 처리 샘플

텍스트 분석, 번역, 문장 요약, 엔티티 분류 등 자연어 처리의 AI/ML 적용 사례들이 매우 많지만, 여전히 많은 고객들이 기술적인 진입 장벽으로 도입에 어려움을 겪고 있습니다. 일부 분들은 이미 Hugging Face 트랜스포머 라이브러리와 SageMaker의 많은 예제 코드들로 AIML 적용을 가속화하고 있지만, 2021년 초까지는 SageMaker가 Hugging Face 전용 컨테이너를 네이티브하게 지원하지 않아 커스텀 스크립트와 커스텀 컨테이너를 따로 작성해야 하는 어려움이 있었습니다.

하지만, 최근 AWS는 Amazon SageMaker에서 Hugging Face의 트랜스포머 모델을 더 쉽게 훈련하고 배포할 수 있는 Hugging Face 딥러닝 훈련 컨테이너 및 추론 컨테이너를 도입했습니다. 따라서, 인프라 설정에 대한 고민 없이 몇 줄의 코드만으로 빠르게 자연어 처리 모델의 훈련 및 프로덕션 배포가 가능하게 되었습니다.

Automatic Speech Recognition (ASR) - WIP

Vision Transformer - WIP

Data2Vec - WIP


References

About

SageMaker-based fine-tuning and deployment hands-on example of a Korean NLP downstream task. Recommended for customers considering adopting NLP workloads on AWS.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published