PDF2TXT using Azure cognitive OCR API

This script converts the PDF files in a given directory to TXT through the Microsoft cognitive OCR API. It requires an active Azure subscription as it needs a subscription key to call their API.

Installation

On Ubuntu create a new Python-3 virtual env and install the packages in requirements.txt.

Usage

Within the virtualenv simply run python main.py --dirpath /path/to/dir

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
utils		utils
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

utils

utils

README.md

README.md

main.py

main.py

requirements.txt

requirements.txt

Repository files navigation

PDF2TXT using Azure cognitive OCR API

Installation

Usage

About

Releases

Packages

Contributors 2

Languages

fabriziomiano/pdf2txt-azure-ocr

Folders and files

Latest commit

History

Repository files navigation

PDF2TXT using Azure cognitive OCR API

Installation

Usage

About

Topics

Resources

Stars

Watchers

Forks

Languages