# Сегментация клиентской базы сети фитнес-центров

## Общее описание проекта
Сеть фитнес-центров разрабатывает стратегию взаимодействия с клиентами на основе аналитических данных.

Одна из проблем фитнес-клубов — отток клиентов. Индикаторы оттока зависят от специфики отрасли. Когда пользователь редко, но стабильно закупается в интернет-магазине — не похоже, что он «отвалился». А вот если две недели не заходит на канал с ежедневно обновляемым контентом, дела плохи: подписчик заскучал и, кажется, оставил вас. 

Для фитнес-центра можно считать, что клиент попал в отток, если за последний месяц ни разу не посетил спортзал. 

**Аналитическая задача** — провести анализ и подготовить план действий по удержанию клиентов. 

**Для решения поставленной задачи** необходимо:
1. Сформировать типичные портреты клиентов: 
    - выделить несколько наиболее ярких групп и охарактеризовать их основные свойства;
2. Проанализировать основные признаки, наиболее сильно влияющие на отток;
3. Сформулировать основные выводы и разработать рекомендации по повышению качества работы с клиентами:
    - выделить целевые группы клиентов;
    - предложить меры по снижению оттока;
    - определить другие особенности взаимодействия с клиентами.
    
## Описание данных
Заказчик предоставил клиентскую базу, содержащую данные на месяц до оттока и факт оттока на определённый месяц. Каждая запись характеризуется следующим единым набором признаков, описывающих клиента:

**за месяц до проверки факта оттока**

|**Признак**|**Описание признака**|
|---:|:---|
|`gender`|пол|
|`Near_Location`|проживание или работа в районе, где находится фитнес-центр|
|`Partner`|сотрудник компании-партнёра клуба (сотрудничество с компаниями, чьи сотрудники могут получать скидки на абонемент — в таком случае фитнес-центр хранит информацию о работодателе клиента)|
|`Promo_friends`|факт первоначальной записи в рамках акции «приведи друга» (использовал промо-код от знакомого при оплате первого абонемента)|
|`Phone`|наличие контактного телефона|
|`Age`|возраст|
|`Lifetime`|время с момента первого обращения в фитнес-центр (в месяцах)|

**за месяц, в котором проводилась проверка факта оттока**

|**Признак**|**Описание признака**|
|---:|:---|
|`Contract_period`|длительность текущего действующего абонемента (месяц, 3 месяца, 6 месяцев, год)|
|`Month_to_end_contract`|срок до окончания текущего действующего абонемента (в месяцах)|
|`Group_visits`|факт посещения групповых занятий|
|`Avg_class_frequency_total`|средняя частота посещений в неделю за все время с начала действия абонемента|
|`Avg_class_frequency_current_month`|средняя частота посещений в неделю за предыдущий месяц|
|`Avg_additional_charges_total`|суммарная выручка от других услуг фитнес-центра: кафе, спорт-товары, косметический и массажный салон|
|`Churn`|факт оттока в текущем месяце|

## Инструкция по выполнению проекта

**Шаг 1.** Загрузка данных;

**Шаг 2.** Провести исследовательский анализ данных:
    - поиск пропусков, дубликатов, описательных характеристик;
    - изучение средних значений признаков в двух группах (ушел/остался);
    - построение столбчатых гистограмм и распределений признаков по двум группам (ушел/остался);
    - построение и визуализация матрицы корреляций;
    - на основе исследуемых признаков сформировать портрет клиентов, склонных к оттоку.

**Шаг 3.** Проверить гипотезы о склонности клиентов к оттоку по различным признакам.

In [2]:
import pandas as pd
import numpy as np
# Ваш код здесь
df=pd.read_csv('project5.csv')

In [3]:
df.head()

Unnamed: 0,gender,Near_Location,Partner,Promo_friends,Phone,Contract_period,Group_visits,Age,Avg_additional_charges_total,Month_to_end_contract,Lifetime,Avg_class_frequency_total,Avg_class_frequency_current_month,Churn
0,1,1,1,1,0,6,1,29,14.22747,5.0,3,0.020398,0.0,0
1,0,1,0,0,1,12,1,31,113.202938,12.0,7,1.922936,1.910244,0
2,0,1,1,0,1,1,0,28,129.448479,1.0,2,1.859098,1.736502,0
3,0,1,1,1,1,12,1,33,62.669863,12.0,2,3.205633,3.357215,0
4,1,1,1,1,1,1,0,26,198.362265,1.0,3,1.113884,1.120078,0


In [4]:
df.describe()

Unnamed: 0,gender,Near_Location,Partner,Promo_friends,Phone,Contract_period,Group_visits,Age,Avg_additional_charges_total,Month_to_end_contract,Lifetime,Avg_class_frequency_total,Avg_class_frequency_current_month,Churn
count,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0,4000.0
mean,0.51025,0.84525,0.48675,0.3085,0.9035,4.68125,0.41225,29.18425,146.943728,4.32275,3.72475,1.87902,1.767052,0.26525
std,0.499957,0.361711,0.499887,0.461932,0.295313,4.549706,0.492301,3.258367,96.355602,4.191297,3.749267,0.972245,1.052906,0.441521
min,0.0,0.0,0.0,0.0,0.0,1.0,0.0,18.0,0.148205,1.0,0.0,0.0,0.0,0.0
25%,0.0,1.0,0.0,0.0,1.0,1.0,0.0,27.0,68.86883,1.0,1.0,1.180875,0.963003,0.0
50%,1.0,1.0,0.0,0.0,1.0,1.0,0.0,29.0,136.220159,1.0,3.0,1.832768,1.719574,0.0
75%,1.0,1.0,1.0,1.0,1.0,6.0,1.0,31.0,210.949625,6.0,5.0,2.536078,2.510336,1.0
max,1.0,1.0,1.0,1.0,1.0,12.0,1.0,41.0,552.59074,12.0,31.0,6.023668,6.146783,1.0
