Proyek ini adalah alat penerjemah otomatis file PDF ke DOCX berbasis Python, yang memungkinkan kamu menerjemahkan dokumen berbahasa asing (misalnya Inggris, Prancis, Jepang) ke bahasa lain hanya dengan satu perintah.
Tidak perlu repot pakai kode bahasa seperti id atau en β cukup ketik nama bahasa seperti βIndonesiaβ, βPrancisβ, atau βJepangβ, dan sistem akan mengenali secara otomatis.
- π Dukung PDF ke DOCX penuh halaman
- π Pilih bahasa dengan nama biasa, bukan kode ISO (contoh: βIndonesiaβ, βSpanyolβ)
- π€ Penerjemahan otomatis berbasis GoogleTranslator
- π§Ή Pembersihan karakter aneh & retry otomatis jika gagal
- π Progress bar real-time per halaman (
tqdm) - π§± Mode interaktif & mode argumen (CLI)
Python_Translate_File/
β
βββ translate_pdf_to_docx.py # Skrip utama
βββ example.pdf # Contoh file PDF input
βββ hasil_terjemahan.docx # Hasil terjemahan
βββ README.md # Dokumentasi proyek
-
Pastikan Python β₯ 3.8 sudah terpasang.
-
Instal dependensi berikut:
pip install PyMuPDF deep-translator python-docx tqdm
-
(Opsional) Siapkan file PDF di direktori yang sama dengan skrip.
Langsung jalankan perintah:
python translate_pdf_to_docx.pyLalu isi prompt yang muncul:
π Masukkan nama file PDF (mis. file.pdf): faludi-introducing-a-theory-of-planning
πΎ Nama file output DOCX (mis. hasil_terjemahan.docx): Faludi_Terjemahan
π Masukkan bahasa tujuan (contoh: Indonesia, Inggris, Jepang): Indonesia
Hasilnya akan tersimpan di:
Faludi_Terjemahan.docx
Kamu juga bisa langsung tentukan argumen tanpa input manual:
python translate_pdf_to_docx.py --input faludi.pdf --output hasil.docx --lang PrancisBahasa bisa ditulis bebas:
Indonesia,Inggris,Prancis,Spanyol,Jepang,Jerman,Arab,Mandarin,Korea, dll.
Input (Bahasa Inggris):
Planning theory explains how decisions are made and justified.
Output (Bahasa Indonesia):
Teori perencanaan menjelaskan bagaimana keputusan dibuat dan dibenarkan.
| Bahasa | Penulisan | Kode Otomatis |
|---|---|---|
| Indonesia | Indonesia, Bahasa Indonesia |
id |
| Inggris | Inggris, English |
en |
| Prancis | Prancis, French |
fr |
| Spanyol | Spanyol, Spanish |
es |
| Jepang | Jepang, Japanese |
ja |
| Jerman | Jerman, German |
de |
| Arab | Arab, Arabic |
ar |
| Korea | Korea, Korean |
ko |
| Mandarin / Tiongkok | Mandarin, Chinese, Tiongkok |
zh-cn |
Jika bahasa tidak dikenali, sistem otomatis memilih Bahasa Indonesia.
- Pastikan file PDF berisi teks yang dapat diekstrak (bukan hasil scan).
- Gunakan koneksi internet yang stabil agar proses terjemahan tidak terputus.
- File besar (100+ halaman) disarankan dijalankan bertahap untuk menghindari timeout.
- Sistem otomatis melakukan retry hingga 3 kali jika koneksi terputus.
| Library | Fungsi |
|---|---|
| PyMuPDF (fitz) | Membaca dan mengekstrak teks dari file PDF |
| Deep Translator (GoogleTranslator) | Melakukan penerjemahan teks |
| python-docx | Menulis hasil terjemahan ke file Word |
| tqdm | Menampilkan progress bar selama proses |
Proyek ini dirilis di bawah MIT License. Silakan gunakan, modifikasi, atau sebarkan dengan tetap mencantumkan atribusi pembuat.