Skip to content

🤖 Ferramenta que lê os arquivos PDFs, realiza OCR e salva em JSON.

License

Notifications You must be signed in to change notification settings

rauanisanfelice/aws-textract

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GitHub code size in bytes GitHub top language GitHub pull requests GitHub tag (latest by date) GitHub contributors GitHub last commit

GitHub stars GitHub followers GitHub forks

aws-textract

Ferramenta que lê os arquivos PDFs, realiza OCR e salva em JSON.

Intruções

  1. Virtual env;
  2. Dependências;
  3. Configurações AWS;
  4. Executar script;

Virtual env

virtualenv -p python3 env
source env/bin/activate

Dependências

pip3 install -r requirements.txt

Configurações AWS

sudo apt install awscli -y
aws configure

Executar script

python main.py

Arquivo que foi utilizado de exemplo:

https://pt.wikipedia.org/wiki/Nota_fiscal_eletr%C3%B4nica

About

🤖 Ferramenta que lê os arquivos PDFs, realiza OCR e salva em JSON.

Topics

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages