Skip to content

elvirova/Customer_segmentation

Repository files navigation

Сегментация клиентов и прогноз снижения покупательской способности

(Оформление в процессе, пока весь проект в ноутбуке в /notebooks)

1. Для чего был проект:

Разработка модели машинного обучения с учителем, способной предсказывать вероятность снижения покупательской активности клиента в течение следующих трёх месяцев. Полученные предсказания будут использоваться для сегментации клиентов и последующей генерации таргетированных предложений.


2. Что использовала

  • Тип задачи: Бинарная классификация (целевая переменная — факт снижения активности).
  • Источник данных: Поведенческие метрики клиентов (история покупок, частота и сумма заказов), а также данные о прибыльности клиента за последние три месяца, предоставленные финансовым департаментом.
  • Модель: Рассматриваются базовые модели классификации: логистическая регрессия, метод K-ближайших соседей, дерево решений, метод опорных векторов.
  • Оценка качества: Метрики качества модели включают AUC-ROC, F1-меру.

3. Этапы проекта

  1. Исследовательский анализ данных (EDA): анализ поведения клиентов, выявление паттернов в истории покупок и прибыльности.
  2. Предобработка данных: обработка пропусков, создание новых признаков.
  3. Построение и обучение модели: выбор алгоритма, настройка гиперпараметров, обучение и валидация модели с использованием пайплайна.
  4. Сегментация клиентов: на основе вероятности оттока и уровня прибыльности выделены 4 сегмента (например, "высокий риск — высокая ценность").
  5. Разработка стратегий: для каждого сегмента предлагаются персонализированные акции, скидки, коммуникации (e-mail, push-уведомления и пр.).

4. Используемые технологии

Static Badge Static Badge Static Badge Static Badge Static Badge Static Badge Static Badge Static Badge

5. Результаты

  • Лучшая модель логистическая регрессия (C=3, penalty=l1)
  • Метрика ROC-AUC на тестовой выборке: 0.91
  • Выявление одного значимого сегмента "акционщики", с которым можно работать через специальные предложения по их категориям товаров и карте лояльности для увеличения пожизненной ценности клиента.

Какия знания я углубила:

  • создание пайплайнов для машинного обучения
  • построение корреляционного анализа с добавлением категориальных признаков через ббиблиотеку phik
  • определение важности важности признаков с помощью метода SHAP.
  • проведение объемного исследовательского анализа данных всех таблиц с графиками.

About

Сегментация клиентов и прогноз снижения покупательской способности

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors