(Оформление в процессе, пока весь проект в ноутбуке в /notebooks)
Разработка модели машинного обучения с учителем, способной предсказывать вероятность снижения покупательской активности клиента в течение следующих трёх месяцев. Полученные предсказания будут использоваться для сегментации клиентов и последующей генерации таргетированных предложений.
- Тип задачи: Бинарная классификация (целевая переменная — факт снижения активности).
- Источник данных: Поведенческие метрики клиентов (история покупок, частота и сумма заказов), а также данные о прибыльности клиента за последние три месяца, предоставленные финансовым департаментом.
- Модель: Рассматриваются базовые модели классификации: логистическая регрессия, метод K-ближайших соседей, дерево решений, метод опорных векторов.
- Оценка качества: Метрики качества модели включают AUC-ROC, F1-меру.
- Исследовательский анализ данных (EDA): анализ поведения клиентов, выявление паттернов в истории покупок и прибыльности.
- Предобработка данных: обработка пропусков, создание новых признаков.
- Построение и обучение модели: выбор алгоритма, настройка гиперпараметров, обучение и валидация модели с использованием пайплайна.
- Сегментация клиентов: на основе вероятности оттока и уровня прибыльности выделены 4 сегмента (например, "высокий риск — высокая ценность").
- Разработка стратегий: для каждого сегмента предлагаются персонализированные акции, скидки, коммуникации (e-mail, push-уведомления и пр.).
- Лучшая модель логистическая регрессия (C=3, penalty=l1)
- Метрика ROC-AUC на тестовой выборке: 0.91
- Выявление одного значимого сегмента "акционщики", с которым можно работать через специальные предложения по их категориям товаров и карте лояльности для увеличения пожизненной ценности клиента.
- создание пайплайнов для машинного обучения
- построение корреляционного анализа с добавлением категориальных признаков через ббиблиотеку phik
- определение важности важности признаков с помощью метода SHAP.
- проведение объемного исследовательского анализа данных всех таблиц с графиками.