PDF Fragment Reader

Это скрипт на языке Python, предназначенный для извлечения названий заявлений из PDF-файлов. Он обрабатывает несколько PDF-файлов в указанной папке, считывает названия заявлений из заданных координат на каждой странице и сохраняет их в текстовый файл.

Установка

Убедитесь, что на вашей системе установлен Python 3.x.
Клонируйте этот репозиторий на ваш компьютер.

Использование

Поместите ваши PDF-файлы в папку pdf_documents.
Откройте файл main.py и установите следующие параметры:
- folder_path: Путь к папке, содержащей PDF-файлы.
- output_file: Имя текстового файла, в который будут сохранены результаты.
- x1, y1, x2, y2: Координаты (в процентах) фрагмента на странице, из которого нужно извлечь название заявления.
Запустите скрипт main.py, используя команду python main.py.
Извлеченные названия заявлений будут сохранены в указанном output_file.

Требования

Необходимые пакеты Python можно установить с помощью следующей команды:

pip install -r requirements.txt

Лицензия

Этот проект не требует лицензии

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
pdf_documents		pdf_documents
.gitignore		.gitignore
README.md		README.md
example_INSTRUCTION.png		example_INSTRUCTION.png
main.py		main.py
requirements.txt		requirements.txt
result.txt		result.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PDF Fragment Reader

Установка

Использование

Требования

Лицензия

About

Releases

Packages

Languages

oktober13/pdf_fragment_reader

Folders and files

Latest commit

History

Repository files navigation

PDF Fragment Reader

Установка

Использование

Требования

Лицензия

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages