Skip to content

vlks-dev/PdfML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PdfML - Извлечение данных из PDF с помощью ML

Библиотека для извлечения структурированных данных из PDF-документов с использованием машинного обучения.

Возможности

  • Извлечение текста из отсканированных и цифровых PDF
  • Распознавание макета документа
  • Извлечение таблиц
  • Распознавание именованных сущностей
  • Обработка сложных многостраничных документов

Установка

pip install -r requirements.txt

Использование

См. примеры в директории examples/

Структура проекта

  • pdfml/: Основной код библиотеки
  • examples/: Примеры использования
  • tests/: Тесты
  • models/: Предобученные модели

Лицензия

MIT

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages