Dự án Dịch Máy sử dụng mô hình Transformer, một kiến trúc mạng nơ-ron hiệu quả cho nhiệm vụ dịch máy. Mô hình được huấn luyện trên tập dữ liệu IWSLT15-en-vi, có sẵn từ Hugging Face Datasets (có thể tải dữ liệu đã được preprocessing tại đây ). Tập dữ liệu này chứa các cặp câu văn bản tương ứng giữa tiếng Anh và tiếng Việt. Mục tiêu của dự án là xây dựng một hệ thống dịch máy chất lượng cao có khả năng dịch từ tiếng Anh sang tiếng Việt và ngược lại.
- Python 3.x
- Các thư viện cần thiết khác (liệt kê trong file
requirements.txt
)
-
Clone repository về máy của bạn:
https://github.com/dauvannam321/AIO_Machine_Translation.git
-
Tải pretrained model:
-
Cài đặt các dependencies:
pip install -r requirements.txt
-
Chạy ứng dụng:
py app.py