Модель для предикта зарплаты по нескольким входящим параметрам:
- Название вакансии
- Тип занятости (код)
- Тип графика (код)
- Опыт (код)
- Город
Модель архитектуры TabNet обучалась на выборочных данных портала HeadHunter за 2019-2020 гг.
Сейчас модель делает предикт для некоторых городов России, но имеется возможность сделать так, чтобы модель определяла зарплату для вакансии любой точки России.
- Ноутбук, в котором отображён процесс предобработки данных
- Ноутбук, в котором отображён процесс обучения модели
- Файл app.py содержит код, который загружает и инициализирует веса обученной модели и делает возможность обращаться к ней посредством REST API запросов.
- Ноутбук, в котором показано, как получать предикты с помощью API.
- Презентация данного проекта
- Презентация идеи реализации сервиса для Кейса 1 - извлечение структурированной информации.
В файле notebooks/results.txt
содержится пример результата работы модели. Там даны наименование вакансии, указанная зарплата и предсказанная моделью зарплата. Как видно, модель в ряде случаев несколько завышает зарплату по сравнению с официально заявленной для данной позиции. (Видимо, модель понимает реальное экономическое положение соискателей, и старается им помочь😻).
Установка и запуск:
git clone https://github.com/blanchefort/trudhack.git
cd trudhack
python -m venv venv
pip install -r requirements.txt
Запуск:
python app.py
Или так:
uvicorn app:app --port 5000 --host 0.0.0.0
Документация API:
http://35.225.239.24:5000/docs
http://35.225.239.24:5000/redoc
Игорь Шаталин
+7 987 655 67 79
shatalin.ip@gmail.com
Андрей Лукин
andrew.luckin2015@yandex.ru