Система для загрузки, хранения и поиска документов в форматах PDF, JPG, JPEG.
- Загрузка документов в форматах PDF, JPG, JPEG
- Автоматическое извлечение текста из документов для поиска
- Поиск документов по названию и текстовому содержимому
- Просмотр документов в браузере
- Скачивание документов
- Удаление документов
- Python 3.8+
- Django 4.2+
- Django REST Framework
- PyJWT
- PyPDF2
- pdfminer.six
- Pillow
- pytesseract
git clone <repository-url>
cd docflowpip install django djangorestframework PyJWT PyPDF2 pdfminer.six pillow pytesseractДля macOS:
brew install tesseractДля Ubuntu/Debian:
sudo apt-get install tesseract-ocrДля Windows:
- Скачайте установщик с официального сайта
- Добавьте путь к Tesseract в переменную PATH
python manage.py migratepython manage.py createsuperuserpython manage.py runserverПосле запуска, приложение будет доступно по адресу http://127.0.0.1:8000/
-
Вход в систему
- Перейдите по адресу http://127.0.0.1:8000/
- Нажмите "Вход" и введите учетные данные (созданные на шаге создания суперпользователя)
-
Загрузка документов
- Нажмите "Загрузить документ" в меню
- Заполните форму и выберите файл (PDF, JPG, JPEG)
- Нажмите "Загрузить документ"
-
Просмотр документов
- Перейдите в раздел "Все документы"
- Нажмите на название документа для просмотра деталей
-
Поиск документов
- Перейдите в раздел "Поиск"
- Введите текст для поиска по названию и содержимому документов
- Нажмите "Найти"
-
Удаление документов
- Откройте документ для просмотра
- Нажмите кнопку "Удалить документ"
- Подтвердите действие
API доступен по адресу http://127.0.0.1:8000/api/
GET /api/documents/- Получение списка всех документовPOST /api/documents/- Загрузка нового документаGET /api/documents/{id}/- Получение информации о документеDELETE /api/documents/{id}/- Удаление документаGET /api/documents/search/?q={query}- Поиск документов по запросу
Административная панель доступна по адресу http://127.0.0.1:8000/admin/