Skip to content

LordsMikel/PDF-Translator

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

PDF Translator

Este proyecto consiste en un script de Python que permite traducir el texto de un archivo PDF escaneado de portugués a español utilizando OCR (Reconocimiento Óptico de Caracteres) y la API de traducción de Google.

Requisitos

  • Python 3.x
  • pytesseract
  • googletrans
  • pdf2image
  • reportlab

Asegúrate de tener instalado Python 3.x en tu sistema. Puedes verificar la versión de Python instalada ejecutando el siguiente comando en tu terminal:

python --version

Si no tienes Python 3.x instalado, puedes descargarlo desde el sitio web oficial de Python: https://www.python.org/downloads/

Para instalar las bibliotecas requeridas, puedes utilizar el administrador de paquetes de Python llamado pip. Ejecuta los siguientes comandos en tu terminal para instalar las bibliotecas necesarias:

pip install pytesseract
pip install googletrans
pip install pdf2image
pip install reportlab

Además, asegúrate de tener el modelo de idioma adecuado para el OCR con Tesseract. Puedes seguir las instrucciones en la documentación oficial de Tesseract para descargar e instalar el modelo de idioma para portugués: https://github.com/tesseract-ocr/tesseract

Uso

  1. Coloca el archivo PDF que deseas traducir en la carpeta del proyecto.

  2. Abre una terminal y navega al directorio del proyecto:

cd pdf-translator
  1. Ejecuta el script y sigue las instrucciones en pantalla:
python traductor.py
  1. Elige la página inicial y final del PDF que deseas traducir.

  2. Espera a que se realice el proceso de OCR y traducción.

  3. Introduce el nombre del archivo de salida para guardar el texto traducido en un nuevo documento PDF.

Contribuciones

Las contribuciones son bienvenidas. Si encuentras algún problema o tienes alguna mejora, no dudes en crear un issue o enviar un pull request.

Licencia

Este proyecto se encuentra bajo la Licencia MIT.

About

No description or website provided.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages