PdfML - Извлечение данных из PDF с помощью ML

Библиотека для извлечения структурированных данных из PDF-документов с использованием машинного обучения.

Возможности

Извлечение текста из отсканированных и цифровых PDF
Распознавание макета документа
Извлечение таблиц
Распознавание именованных сущностей
Обработка сложных многостраничных документов

Установка

pip install -r requirements.txt

Использование

См. примеры в директории examples/

Структура проекта

pdfml/: Основной код библиотеки
examples/: Примеры использования
tests/: Тесты
models/: Предобученные модели

Лицензия

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
examples		examples
pdfml		pdfml
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

PdfML - Извлечение данных из PDF с помощью ML

Возможности

Установка

Использование

Структура проекта

Лицензия

About

Uh oh!

Releases

Packages

Uh oh!

Languages

vlks-dev/PdfML

Folders and files

Latest commit

History

Repository files navigation

PdfML - Извлечение данных из PDF с помощью ML

Возможности

Установка

Использование

Структура проекта

Лицензия

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages