Ứng dụng dịch thuật PDF từ tiếng Anh sang tiếng Việt với khả năng giữ nguyên định dạng của file PDF gốc. Hỗ trợ xử lý PDF lớn lên đến 1000+ trang.
✨ Các tính năng chính:
- ✅ Dịch từ English sang Vietnamese
- ✅ Giữ nguyên định dạng PDF (font size, màu sắc, vị trí)
- ✅ Xử lý được file PDF lớn (1000+ trang)
- ✅ Giao diện đồ họa thân thiện, dễ sử dụng
- ✅ Hiển thị tiến trình dịch real-time
- ✅ Log chi tiết quá trình xử lý
- Hệ điều hành: Windows 10/11
- Python: 3.8 trở lên
- Kết nối Internet: Cần thiết để sử dụng dịch vụ Google Translate
Nếu chưa có Python, tải và cài đặt từ python.org
Lưu ý: Trong quá trình cài đặt, nhớ check vào "Add Python to PATH"
# Clone hoặc download mã nguồn về máy
git clone https://github.com/L1-Loki/PDF_Translator.gitCách 1: Sử dụng file .bat (Đơn giản nhất)
- Double-click file
install.bat - Đợi quá trình cài đặt hoàn tất
Cách 2: Dùng PowerShell
.\install.bat
# Hoặc
pip install -r requirements.txtLưu ý cho PowerShell: Phải thêm .\ trước tên file .bat
Bước 1: Build file EXE lần đầu
.\build_exe.batQuá trình này chỉ cần chạy 1 lần, sẽ tạo file PDF_Translator.exe trong thư mục dist/
Bước 2: Chạy ứng dụng
- Double-click file
dist/PDF_Translator.exe - Không cần cài Python hay thư viện gì!
Cách 1: Double-click
- Double-click file
run.bat
Cách 2: Dùng PowerShell
.\run.bat
# Hoặc
python main_app.py-
Chọn file PDF gốc:
- Click nút "Chọn File"
- Chọn file PDF tiếng Anh cần dịch
- Ứng dụng sẽ hiển thị thông tin về file (số trang, kích thước)
-
Chọn vị trí lưu:
- Click nút "Chọn Vị Trí"
- Chọn nơi muốn lưu file PDF đã dịch
- (Mặc định sẽ lưu cùng thư mục với file gốc, tên file có thêm "_translated")
-
Bắt đầu dịch:
- Click nút "BẮT ĐẦU DỊCH"
- Xác nhận trong hộp thoại
- Đợi quá trình xử lý hoàn tất
- Đọc PDF (0-33%): Trích xuất văn bản và định dạng từ PDF gốc
- Dịch văn bản (33-66%): Dịch từng khối văn bản sang tiếng Việt
- Tạo PDF mới (66-100%): Tạo file PDF mới với văn bản đã dịch
- File nhỏ (< 50 trang): 5-10 phút
- File trung bình (50-200 trang): 15-30 phút
- File lớn (200-1000 trang): 30 phút - 2 giờ
- Cần kết nối Internet ổn định
- Không tắt ứng dụng trong khi đang dịch
- PDF có ảnh/biểu đồ sẽ không được dịch (chỉ dịch văn bản)
- Một số font đặc biệt có thể không hiển thị chính xác trong file đầu ra
- Với file lớn (>500 trang), nên chia nhỏ thành nhiều file
- Kiểm tra kết quả với file nhỏ trước khi xử lý file lớn
- Đảm bảo đủ dung lượng ổ cứng (file đầu ra thường lớn hơn file gốc)
Translator/
│
├── main_app.py # File chính, giao diện GUI
├── translator.py # Module dịch thuật
├── pdf_handler.py # Module xử lý PDF
├── requirements.txt # Danh sách thư viện cần thiết
├── README.md # File hướng dẫn này
│
├── install.bat # Script cài đặt thư viện
├── run.bat # Script chạy ứng dụng Python
├── build_exe.bat # Script đóng gói thành EXE
│
└── dist/ # Thư mục chứa file EXE (sau khi build)
└── PDF_Translator.exe
Lỗi: The term 'install.bat' is not recognized...
Giải pháp:
- Thêm
.\trước tên file:.\install.bathoặc.\run.bat - Hoặc double-click trực tiếp vào file .bat
# Cài đặt lại các thư viện
pip install -r requirements.txt --force-reinstall- Kiểm tra kết nối Internet
- Thử lại sau vài phút
- Nếu vẫn lỗi, có thể Google Translate API tạm thời bị quá tải
- Chia file PDF thành nhiều phần nhỏ hơn
- Đóng các ứng dụng khác để giải phóng RAM
- PyMuPDF (fitz): Xử lý đọc và tạo PDF
- deep-translator: API dịch thuật Google Translate
- tkinter: Giao diện đồ họa
- Python threading: Xử lý đa luồng
Dự án này được phát triển cho mục đích học tập và sử dụng cá nhân.
Nếu gặp vấn đề hoặc có câu hỏi, vui lòng tạo issue trên GitHub hoặc liên hệ trực tiếp.
Lưu ý: Ứng dụng sử dụng Google Translate API miễn phí, chất lượng dịch có thể không hoàn hảo 100%. Với tài liệu quan trọng, nên có người kiểm tra và hi교chỉnh sau khi dịch.