Задача проекта - построение модели, которая будет предсказывать продуктовый кластер клиента - Юридического лица на горизонте в 12 месяцев.
В качестве информации для модели нам доступны табличные данные об основных характеристиках компании и транзакционной активности, а также информация о текущем кластере клиента.
Целевой переменной является продуктовый кластер, в котором клиент будет находится через год.
Нужно получить вероятности перехода клиента в продуктовые кластеры для последнего месяца (month_6)
Для решения этой задачи мы использовали комплексный подход :
- Создали множество информативных фичей для дополнения датасета
- Создали классификатор на основе алгоритма построения моделей машинного обучения, использующих схему градиентного бустинга. (Catboost)
- С помощью различных библиотек для глубокого анализа выявляли важность признаков и их влияние на предсказания
- На основе полученных результатов отбирали старые и строили новые признаки
Также особенное внимание мы уделили заполнению пустых ячеек и строк: -Основываясь на статистике пользователя мы заполняли недостающие значения для него -Создали алгоритм, который для пользователей с пустыми ячейками ищет похожих пользователей и берет у них нужные ячейки
Команда На Хайпе | On Hype
- Александр Зеленцов - Капитан команды | ML-Engineer
- Никита Юрьев - Backend Python Developer
- Артур Артиков - Data Scientist
- Алексей Безднин - Data Analyst
- Ишмаева Александра - Backend Python Developer
Визуализация информации о признаках
