Skip to content

lamberthrumpaidus/Python_Translate_File

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

3 Commits
Β 
Β 
Β 
Β 

Repository files navigation

🐍 Python Translate File (PDF β†’ DOCX, Multilingual Version)

Proyek ini adalah alat penerjemah otomatis file PDF ke DOCX berbasis Python, yang memungkinkan kamu menerjemahkan dokumen berbahasa asing (misalnya Inggris, Prancis, Jepang) ke bahasa lain hanya dengan satu perintah. Tidak perlu repot pakai kode bahasa seperti id atau en β€” cukup ketik nama bahasa seperti β€œIndonesia”, β€œPrancis”, atau β€œJepang”, dan sistem akan mengenali secara otomatis.


✨ Fitur Utama

  • πŸ“„ Dukung PDF ke DOCX penuh halaman
  • 🌍 Pilih bahasa dengan nama biasa, bukan kode ISO (contoh: β€œIndonesia”, β€œSpanyol”)
  • πŸ€– Penerjemahan otomatis berbasis GoogleTranslator
  • 🧹 Pembersihan karakter aneh & retry otomatis jika gagal
  • πŸ“Š Progress bar real-time per halaman (tqdm)
  • 🧱 Mode interaktif & mode argumen (CLI)

πŸ“ Struktur Proyek

Python_Translate_File/
β”‚
β”œβ”€β”€ translate_pdf_to_docx.py      # Skrip utama
β”œβ”€β”€ example.pdf                   # Contoh file PDF input
β”œβ”€β”€ hasil_terjemahan.docx         # Hasil terjemahan
└── README.md                     # Dokumentasi proyek

βš™οΈ Instalasi

  1. Pastikan Python β‰₯ 3.8 sudah terpasang.

  2. Instal dependensi berikut:

    pip install PyMuPDF deep-translator python-docx tqdm
  3. (Opsional) Siapkan file PDF di direktori yang sama dengan skrip.


πŸš€ Cara Menjalankan

πŸ”Ή Mode Interaktif

Langsung jalankan perintah:

python translate_pdf_to_docx.py

Lalu isi prompt yang muncul:

πŸ“‚ Masukkan nama file PDF (mis. file.pdf): faludi-introducing-a-theory-of-planning
πŸ’Ύ Nama file output DOCX (mis. hasil_terjemahan.docx): Faludi_Terjemahan
🌍 Masukkan bahasa tujuan (contoh: Indonesia, Inggris, Jepang): Indonesia

Hasilnya akan tersimpan di:

Faludi_Terjemahan.docx

πŸ”Ή Mode Otomatis (CLI)

Kamu juga bisa langsung tentukan argumen tanpa input manual:

python translate_pdf_to_docx.py --input faludi.pdf --output hasil.docx --lang Prancis

Bahasa bisa ditulis bebas: Indonesia, Inggris, Prancis, Spanyol, Jepang, Jerman, Arab, Mandarin, Korea, dll.


🧠 Contoh Hasil

Input (Bahasa Inggris):

Planning theory explains how decisions are made and justified.

Output (Bahasa Indonesia):

Teori perencanaan menjelaskan bagaimana keputusan dibuat dan dibenarkan.

πŸ”€ Bahasa yang Didukung

Bahasa Penulisan Kode Otomatis
Indonesia Indonesia, Bahasa Indonesia id
Inggris Inggris, English en
Prancis Prancis, French fr
Spanyol Spanyol, Spanish es
Jepang Jepang, Japanese ja
Jerman Jerman, German de
Arab Arab, Arabic ar
Korea Korea, Korean ko
Mandarin / Tiongkok Mandarin, Chinese, Tiongkok zh-cn

Jika bahasa tidak dikenali, sistem otomatis memilih Bahasa Indonesia.


⚠️ Catatan Penting

  • Pastikan file PDF berisi teks yang dapat diekstrak (bukan hasil scan).
  • Gunakan koneksi internet yang stabil agar proses terjemahan tidak terputus.
  • File besar (100+ halaman) disarankan dijalankan bertahap untuk menghindari timeout.
  • Sistem otomatis melakukan retry hingga 3 kali jika koneksi terputus.

🧱 Teknologi yang Digunakan

Library Fungsi
PyMuPDF (fitz) Membaca dan mengekstrak teks dari file PDF
Deep Translator (GoogleTranslator) Melakukan penerjemahan teks
python-docx Menulis hasil terjemahan ke file Word
tqdm Menampilkan progress bar selama proses

πŸ“„ Lisensi

Proyek ini dirilis di bawah MIT License. Silakan gunakan, modifikasi, atau sebarkan dengan tetap mencantumkan atribusi pembuat.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages