En este proyecto se muestra como utilizar el servicio de Document AI de Google Cloud Platform para extraer información de un documento PDF. En este caso se extrae la información de un documento un escaneado en PDF, pero se puede utilizar para extraer información de cualquier tipo de documento.
YouTube Completo (https://youtu.be/vYR7sit3NLI)
- Configuración del proyecto en Google Cloud Platform.
- Configuración de la cuenta de servicio para el proyecto.
- Creación del archivo document_ocr.py para extraer la información del documento.
- Python
- Google Cloud Platform
Debe tener instalado Python
-
Instalar Python (https://www.python.org/downloads/).
-
Clonar el repositorio
git clone https://github.com/backtesty/DocumentAI.git
-
Crear el entorno virtual
python -m venv env
-
Activar entorno virtual (windows):
env\Scripts\activate
-
Instalar las dependencias del proyecto:
pip install -r requirements.txt
-
Agregar las credenciales JSON de Google Cloud Plataform en el archivo google_ocr.json
-
Ejecutar el archivo document_ocr.py:
python document_ocr.py
Agradezco tu visita y espero que puedas revisar más acerca del tema en mi canal de IAnews Global.