GitHub

Состав команды:

ФИО	Роль
Баймлер Ярослав	CV Engineer
Вяткин Роман	Scrum master / MLOps
Ихматуллаев Даврон	ML Engineer / Backend developer
Назаров Михаил	ML Engineer
Полякова Валерия	QA Engineer
Яськова Марина	Data Analyst

`Описание проблемы`

Сотрудники вручную ищут, собирают и перепечатывают информацию о товаре, что замедляет процесс вывода товара на полку и снижает информативность товарной базы.

`Описание задачи`

На склад поступает много товаров, о которых нет информации в цифровом виде. Необходимо разработать сервис, который будет использовать загруженные изображения/сканы паспортов товаров как источник информации о них и переведет эту информацию в формат, пригодный для использования в карточке товара.

`Требования к решению задачи`

Проверяемая метрика – полнота извлекаемой информации
Python версии 3.8+ и любые библиотеки с открытым исходным кодом
Языковые модели: yandexgpt, gigachat и любые открытые LLM
Допускается использование мультимодальных моделей и open-source OCR библиотек
Сервис, решающий данную задачу, упакован в Docker compose
Работающий телеграм-бот

`Этапы решения задачи`

Извлечение и предобработка текстовой инфрмации из паспортов
Создание запросов для суммаризации информации при помощи GigaChat
Разработка и размещение на сервере телеграмм-бота
Упаковка сервиса в Docker Container

`Результат`

Результатом решения является разработанный телеграм-бот, который принимает отсканированное изображение паспорта изделия и возвращает технические характеристики.

`Функциональная схема приложения`

Телеграмм-бот принимает на вход паспорт изделия в формате PDF или изображения и выполняет следующие функции по выбору пользователя:

Собирает технические характеристики изделия и предоставляет их в формате JSON.
Выполняет поиск информации в документе по запросу пользователя.
Принимает на вход документы двух изделий, сравнивает технические характеристики обоих изделий в удобной для пользователя форме таблицы.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
img		img
.env_example		.env_example
.gitignore		.gitignore
README.md		README.md
handlers.py		handlers.py
kb.py		kb.py
main.py		main.py
model.py		model.py
ocr.py		ocr.py
requirements.txt		requirements.txt
states.py		states.py
test.ipynb		test.ipynb
texts.py		texts.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

`Описание проблемы`

`Описание задачи`

`Требования к решению задачи`

`Этапы решения задачи`

`Результат`

`Функциональная схема приложения`

About

Releases

Packages

Languages

NazarovMichail/pdf2json

Folders and files

Latest commit

History

Repository files navigation

Описание проблемы

Описание задачи

Требования к решению задачи

Этапы решения задачи

Результат

Функциональная схема приложения

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

`Описание проблемы`

`Описание задачи`

`Требования к решению задачи`

`Этапы решения задачи`

`Результат`

`Функциональная схема приложения`

Packages