## PYTHON-13. Визуализация данных  9. Закрепление знаний.
***
- Файл с исходными данными можно скачать [здесь](https://lms.skillfactory.ru/assets/courseware/v1/c903ecd0b0c995c44213d620ab6ae94d/asset-v1:SkillFactory+DST-3.0+28FEB2021+type@asset+block/churn.zip).
- В качестве инструмента визуализации используется библиотека Plotly (express).
- Ссылка на GitHub [здесь](https://github.com/drSever/drSever_data_science/tree/main/my_project_2)
***
В файле с исходными данными (churn.csv) нам представлены данные об оттоке клиентов некоторого банка.

Столбцы таблицы (признаки):

1. ***RowNumber*** — номер строки таблицы (это лишняя информация, поэтому можете сразу от неё избавиться)
2. ***CustomerId*** — идентификатор клиента
3. ***Surname*** — фамилия клиента
4. ***CreditScore*** — кредитный рейтинг клиента (чем он выше, тем больше клиент брал кредитов и возвращал их)
5. ***Geography*** — страна клиента (банк международный)
6. ***Gender*** — пол клиента
7. ***Age*** — возраст клиента
8. ***Tenure*** — сколько лет клиент пользуется услугами банка
9. ***Balance*** — баланс на счетах клиента в банке
10. ***NumOfProducts*** — количество услуг банка, которые приобрёл клиент
11. ***HasCrCard*** — есть ли у клиента кредитная карта (1 — да, 0 — нет)
12. ***IsActiveMember*** — есть ли у клиента статус активного клиента банка (1 — да, 0 — нет)
13. ***EstimatedSalary*** — предполагаемая заработная плата клиента
14. ***Exited*** — статус лояльности (1 — ушедший клиент, 0 — лояльный клиент)

Итак, банк обращается к нам за помощью: он хочет разработать кампанию лояльности по удержанию клиентов, но для этого ему необходимо, чтобы мы выяснили основные причины оттока клиентов. Иными словами, нужно установить, чем ушедшие клиенты отличаются от лояльных и как между собой связаны различные признаки, определяющие клиентов.

После разведывательного анализа, с целью выявления наиболее важных признаков оттока, банк сможет построить модель машинного обучения, которая будет прогнозировать уход клиента. 

In [1]:
import pandas as pd
import plotly.express as px

churn_data = pd.read_csv('data/churn.csv') # загружаем данные

churn_data = churn_data.drop('RowNumber', axis=1) # удаляем ненужный столбец RowNumber
churn_data['Exited_str'] = churn_data['Exited'].apply(
    lambda x: 'exited' if x == 1 else 'loyal') # создаем дополнительный столбец, где статус лояльности будет обозначен 'loyal' или 'exited'
churn_data['IsActiveMember_str'] = churn_data['IsActiveMember'].apply(
    lambda x: 'activе' if x == 1 else 'non-active') # создаем дополнительный столбец, 
                                                    # где статус активности клиента будет обозначен 'active' или 'non-active'

# display(churn_data) # выводим и проверяем, что данные загружаются и ошибок нет
# churn_data.info() # выводим и проверяем на наличие пустых значений
# churn_data['CustomerId'].nunique() # выводим и проверяем на отсутствие дублированных записей о клиентах

***
**Задание 9.1.**   
Каково соотношение ушедших и лояльных клиентов?   
Покажите это на графике и дайте комментарий по соотношению.



In [2]:
churn_data_pie = churn_data.groupby(by='Exited_str', as_index=False).agg('count') # группируем данные для графика

# display(churn_data_pie) # выводим и визуально проверяем правильность группировки данных

fig = px.pie(churn_data_pie, values='Exited', names='Exited_str', color='Exited_str',
             title='Ratio of exited and loyal customers',
             labels={'Exited':'Number of customers ',
                     'Exited_str':'Loyalty status '
                     },
             color_discrete_map={'loyal': '#636EFA',
                                 'exited':'#EF553B',
                                 },
             height=500,width=600
             )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем диаграмму в html, svg
fig.write_html("plotly/1.html")
fig.write_image('plotly/img1.svg')


![Диаграмма](plotly/img1.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграммы](plotly/1.html)  

Из представленной выше круговой диаграммы видно, что число ушедших клиентов составляет около 20%, а число лояльных – около 80% от общего числа клиентов, соотношение 1:4 в пользу лояльных. 

***
**Задание 9.2.**  
Постройте график, показывающий распределение баланса пользователей, у которых на счету больше 2 500 долларов.   
Опишите распределение и сделайте выводы.

In [3]:
mask = churn_data['Balance'] > 2500 # создаем маску для фильтрации клиентов с балансом > 2500 долларов
churn_data_mask = churn_data[mask]  # применяем маску к базе данных

fig = px.histogram(churn_data_mask, x='Balance', nbins=30,
                   title='User balance distribution (Balance > 2500)',
                   height=500,width=1200
                   )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем гистограмму в html, svg
fig.write_html("plotly/2.html")
fig.write_image('plotly/img2.svg')

![Гистограмма](plotly/img2.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия гистограммы](plotly/2.html)  

Из представленной выше гистограммы можно сделать следующие выводы:
- распределение клиентов с балансом выше 2500 долларов носит равномерный характер без аномалий. 
- большинство представленных клиентов имеют на балансе сумму 100-140 тыс. долларов (пиковые значения 120-130тыс. долларов). 
- большинство клиентов банка – достаточно обеспеченные люди. Например, в среднем, немцы от 14 лет и старше имеют на душу населения 12 400 евро (13 000 долларов по курсу) на своих счетах [ссылка на источник](https://www.mknews.de/social/2019/10/07/nemcy-derzhat-pochti-billion-evro-na-besprocentnykh-schetakh.html). 
- все клиенты банка имеют баланс в долларах США, хотя банковские отделения расположены в Германии, Франции, Испании (об этом мы узнаем ниже в задании 9.9)


***
**Задание 9.3.**  
Посмотрите на распределение баланса клиента в разрезе признака оттока.   
Как различаются суммы на накопительном счёте ушедших и лояльных клиентов?   
Подумайте и напишите, с чем это может быть связано, что может не устраивать ушедших клиентов в банке.  

In [4]:
fig = px.box(churn_data, x='Exited_str', y='Balance', color='Exited_str',
             title='Distribution of customer balance in the context of exodus',
             labels={'Exited_str':'Loyalty status '},
             color_discrete_map={'loyal': '#636EFA',
                                 'exited':'#EF553B',
                                 },
             height=500,width=1200
             ) 

# fig.show() # GitHub не поддерживает Plotly

# сохраняем коробку с усами в html, svg
fig.write_html("plotly/3.html")
fig.write_image('plotly/img3.svg')

![Диаграмма](plotly/img3.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграмма](plotly/3.html)  

На коробчатой диаграмме представленной выше видно следующее:
- межквартильный размах больше в группе лояльных клиентов, а границы распределния больше в группе ушедших клиентов. 
- максимальная сумма на балансе (250тыс. долларов) у клиента, который покинул банк. 
- межквартильный размах (IQR) больше среди лояльных клиентов и составляет от 0 до 126тыс. долларов. У покинувших банк клиентов данный показатель находится в пределах 37-131тыс. долларов.  
- медианный показатель выше у ушедших клиентов (109тыс. долларов), у лояльных он составляет 92тыс. долларов. 
- потенциальные выбросы отсутствуют.

Итак, мы можем сделать вывод, что чаще покидают банк более обеспеченные клиенты. Вероятно, их не устраивают условия, которые им предлагает банк для хранения денег либо их инвестиций. 

Кроме того, как было указано выше, открытие счетов в долларах в европейском банке может говорить о том, что по крайней мере часть его клиентов – граждане США, причем они могут быть как резидентами, так и нерезидентами. Вполне может быть, что условия для нерезидентов хуже или с ограничениями, что влияет на уход таких клиентов. 


In [5]:
# добавим гистограмму распределения в разрезе ушедших и лояльных клиентов без ограничений по балансу на счете
fig = px.histogram(churn_data, x='Balance', nbins=30, color='Exited_str',
                   title='User balance distribution (loyal and exited)',
                   labels={'Exited_str':'Loyalty status '},
                   color_discrete_map={'loyal': '#636EFA',
                                       'exited':'#EF553B',
                                      },
                   height=500,width=1200
                   )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем гистограмму в html, svg
fig.write_html("plotly/4.html")
fig.write_image('plotly/img4.svg')

![Гистограмма](plotly/img4.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия гистограммы](plotly/4.html)  

Действительно, на данной гистограмме очень хорошо видно большое количество клиентов (как лояльных, так и ушедших) с нулевым балансом. Правда, надо отметить, что таковых лояльных клиентов значительно больше: 501 ушедший и 3117 лояльный.

С чем это может быть связано? Возможно, эти клиенты открыли счета, но условия банка по их использованию их не устраивают. Кстати, лояльные клиенты с нулевыми балансами могут быть уже фактически ушедшими и просто ожидают окончания договора с банком, пользуясь уже услугами других банков.

***
**Задание 9.4.**   
Посмотрите на распределение возраста в разрезе признака оттока.   
В какой группе больше потенциальных выбросов?   
На какую возрастную категорию клиентов стоит обратить внимание банку?  

In [6]:
fig = px.box(churn_data, x='Exited_str', y='Age', color='Exited_str',
             title='Age distribution in relation to exodus',
             labels={'Exited_str':'Loyalty status '},
             color_discrete_map={'loyal': '#636EFA',
                                 'exited':'#EF553B',
                                 },
             height=500,width=1200
             ) 

# fig.show() # GitHub не поддерживает Plotly

# сохраняем коробчатую диаграмму в html, svg
fig.write_html("plotly/5.html")
fig.write_image('plotly/img5.svg')

![Коробчатая диаграмма](plotly/img5.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия коробчатой диаграммы](plotly/5.html)  

На коробчатой диаграмме представленной выше видно следующее:
- длина ящика с усами (межквартильный размах) больше в группе ушедших клиентов, однако число потенциальных выбросов выше в группе лояльных. 
- возрастная группа ушедших клиентов – это люди преимущественно от 38 до 51 года, медиана – 45 лет. При этом это более обеспеченные люди (как мы выяснили выше), чем лояльные клиенты.  Это логично, т.к. именно к этому возрасту доходы человека обычно растут – он получает необходимый опыт и продвигается по карьерной лестнице либо начинают приносить прибыль его инвестиции и увеличиваются его накопления. 
- возрастная группа лояльных клиентов – это люди возрастом от 31 до 41 года, медиана – 36 лет. То есть, другими словами, группа лояльных клиентов младше в среднем примерно на 10 лет группы ушедших клиентов. 

Соответственно, делаем вывод, что банку следует обратить внимание на группу клиентов возрастом 38-51 год. 


***
**Задание 9.5.**  
Постройте график, который показывает взаимосвязь кредитного рейтинга клиента и его предполагаемой зарплаты.   
Добавьте расцветку по признаку оттока клиентов.   
Какова взаимосвязь между признаками? Если не видите явной взаимосвязи, укажите это.  

In [7]:
fig = px.scatter(churn_data, x='EstimatedSalary', y='CreditScore', color='Exited_str', 
                 title="Relationship between the customer’s credit rating and his estimated salary",
                 labels={'Exited_str':'Loyalty status ', 
                         'EstimatedSalary':'Estimated Salary ',
                         'CreditScore':'Credit Score '
                         },
                 color_discrete_map={'loyal': '#636EFA',
                                    'exited':'#EF553B',
                                    },
                 hover_data=['Exited_str'], 
                 log_x=True, # используем логарифмическую шкалу, чтобы увидеть взаимосвязь!
                 height=500,width=1200
                 )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем диаграмму рассеяния в html, svg
fig.write_html("plotly/6.html")
fig.write_image('plotly/img6.svg')

![Диаграмма рассеяния](plotly/img6.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграммы](plotly/6.html)  

Из представленой диаграммы рассеяния мы можем увидеть следующее:
- видна четкая взаимосвязь кредитного рейтинга клиента и его предполагаемой зарплаты: более высокому уровню зарплаты обычно соответствует более высокий кредитный рейтинг. Это логично, т.к. клиент с более высоким доходом будет во время погашать и обслуживать кредиты, а также будет иметь более хорошую кредитную историю. 
- если сравнить данную взаимосвязь в разрезе ушедших и лояльных клиентов, то отличий между этими двумя группами нет. 


***
**Задание 9.6.**  
Кто чаще уходит, мужчины или женщины?   
Постройте график, который иллюстрирует это.

In [8]:
mask = churn_data['Exited'] == 1 # маска для выборки только ушедших клиентов
churn_data_pie = churn_data[mask].groupby(by=['Gender','Exited_str'], as_index=False)['Exited'].count() # можно использовать sum()

# display(churn_data_pie) # выводим и визуально проверяем правильность группировки данных

fig = px.pie(churn_data_pie, values='Exited', names='Gender', color='Gender',
             title='Sex ratio of exodus customers',
             labels={'Exited':'Number of exodus customers ',
                     'Exited_str':'Loyalty status ',
                     'Gender':'Gender '
                     },
             color_discrete_map={'Male': '#636EFA',
                                 'Female':'#EF553B',
                                 },
             height=500,width=600
             )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем диаграмму в html, svg
fig.write_html("plotly/7.html")
fig.write_image('plotly/img7.svg')



![Диаграмма](plotly/img7.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграммы](plotly/7.html)  

Представленная выше круговая диаграмма показывает, что число ушедших женщин выше, чем число ушедших мужчин – 56% против 44% соответственно. 

***
**Задание 9.7**  
Как отток клиентов зависит от числа приобретённых у банка услуг?   
Для ответа на этот вопрос постройте многоуровневую столбчатую диаграмму.

In [9]:
churn_data_bar = churn_data.groupby(by='Exited_str', as_index=False)['NumOfProducts'].value_counts()

# display(churn_data_bar) # выводим и визуально проверяем правильность группировки данных

fig = px.bar(churn_data_bar, x='Exited_str', y='count', color='NumOfProducts', 
             title='Customer exodus relationship from the number of services purchased from the bank',
             labels={'count':'Number of customers ',
                     'Exited_str':'Loyalty status ',
                     'NumOfProducts':'Num Of Products '
                     },
             height=500,width=1200
             )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем диаграмму в html, svg
fig.write_html("plotly/8.html")
fig.write_image('plotly/img8.svg')

![Диаграмма](plotly/img8.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграммы](plotly/8.html)  

Представленные выше столбчатые диаграммы показывают:
-	Покинувшие банк клиенты приобретали все предоставляемые банком услуги (их всего четыре), однако большинство из них пользовались только одной и совсем немногие пользовались всеми четырьмя. 
-	Лояльные банку клиенты приобретают обычно одну или две услуги (последних клиентов больше), однако все четыре услуги в этой группе никто не приобретает. 


***
**Задание 9.8.**  
Как влияет наличие статуса активного клиента на отток клиентов?  
Постройте диаграмму, иллюстрирующую это. Что бы вы предложили банку, чтобы уменьшить отток клиентов среди неактивных?

In [10]:
churn_data_bar = churn_data.groupby(by='Exited_str', as_index=False)['IsActiveMember_str'].value_counts()

# display(churn_data_bar) # выводим и визуально проверяем правильность группировки данных

fig = px.bar(churn_data_bar, x='Exited_str', y='count', color='IsActiveMember_str', 
             title='How active client status affects client exodus',
             labels={'count':'Number of customers ',
                     'Exited_str':'Loyalty status ',
                     'IsActiveMember_str':'Is Active Member '
                     },
             height=500,width=1200
             )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем диаграмму в html, svg
fig.write_html("plotly/9.html")
fig.write_image('plotly/img9.svg')


![Диаграмма](plotly/img9.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграммы](plotly/9.html)  

Столбчатая диаграмма выше четко показывает, что бОльшая часть ушедших клиентов имеют статус неактивных, а бОльшая часть лояльных – наоборот. 

1) Если статус активного или неактивного клиента означает, соответственно, движение или отсутствие движения денег на счетах клиента, то можно сделать следующий вывод – большинство лояльных клиентов устраивает условия банка по транзакциям (переводы, оплаты в магазинах, интернет-платежи и т.д.), а большинство ушедших клиентов либо нет, либо они об этих условиях не знают. Либо ушедшие неактивные клиенты рассматривали данный банк как место хранения своих сбережений и получения дохода по вкладам за счет процентной ставки. 

    Таким образом банку в сложившейся ситуации можно предложить:
- активно работать с неактивными клиентами в плане информирования их о выгодных условиях и предложениях со стороны банка, акциях банка и его партнеров (например, есть магазины, которые дают скидки или кешбэк за оплату картой данного банка) - информационные рассылки (смс, e-mail), реклама в СМИ и Интернете. 
- заинтересовывать длительно хранить деньги на счетах банка, путем увеличения доходов по вкладам или предоставления новых выгодных предложений по ним. 
2) Если активность клиентов связана с количеством услуг, которые те приобретают у банка и статус активного клиента означает, что клиент приобрел более, чем одну услугу банка, то этот график прекрасно коррелирует с предыдущим. Мы видим, что в этом случае среди ушедших клиентов – 1302 неактивных, в то же время 1409 из них приобрели только одну услугу банка. Похожая картина наблюдается при анализе лояльных клиентов – 4416 из них имеют статус активных, 4242 использует 2 услуги, приобретенные у банка. 

    В этом случае банку можно предложить снизить стоимость предлагаемых услуг либо улучшить их функционал. 


***
**Задание 9.9.**  
В какой стране доля ушедших клиентов больше?  
Постройте тепловую картограмму, которая покажет это соотношение на карте мира.  
Предположите, с чем это может быть связано.

In [11]:
mask = churn_data['Exited'] == 1 # маска для выборки только ушедших клиентов
churn_data_choropleth = churn_data[mask].groupby(by='Geography', as_index=False)['Exited_str'].value_counts() # группируем ушедших клиентов по региону


# display(churn_data_choropleth) # выводим и визуально проверяем правильность группировки данных

fig = px.choropleth(
    data_frame=churn_data_choropleth, 
    locations='Geography', 
    locationmode = 'country names', # режим сопоставления локаций с базой plotly
    color="count", # от чего зависит цвет
    range_color=[0, 1000],
    title='Distribution of departed clients by country',
    labels={'count':'Number of exited ',
            'Geography':'Geography ',
            }, 
    width=1200, 
    height=500, 
    color_continuous_scale='Reds' # палитра цветов
)

# fig.show() # GitHub не поддерживает Plotly

# сохраняем диаграмму в html, svg
fig.write_html("plotly/10.html")
fig.write_image('plotly/img10.svg')

print('Дополнительно к графику выведем таблицу с долей ушедших \nклиентов от общего их числа c группировкой по странам')
churn_data_choropleth_more = churn_data.groupby(by='Geography', as_index=False)['Exited'].mean()
display(churn_data_choropleth_more)

Дополнительно к графику выведем таблицу с долей ушедших 
клиентов от общего их числа c группировкой по странам


Unnamed: 0,Geography,Exited
0,France,0.161548
1,Germany,0.324432
2,Spain,0.166734


![Диаграмма](plotly/img10.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия диаграммы](plotly/10.html)  

При анализе данной картограммы обращает на себя внимание следующее:
- банк представлен в трех европейских странах – Германии, Франции, Испании. 
- наибольшая доля ушедших клиентов в Германии и Франции (чуть более 800 человек в каждой из этих стран), наименьшая – в Испании (чуть более 400 клиентов). 
- однако, если мы посмотрим долю ушедших клиентов от общего количества клиентов в разрезе по странам (см. таблицу ниже картограммы), то обнаружим, что наибольшая доля ушедших клиентов в Германии (32%), а в Испании и Франции их доли почти равны и составляют по 16%. 
- таким образом можно сделать главный вывод – наибольшая проблема оттока клиентов у банка в Германии. 

Наиболее вероятной причиной этого, по моему мнению, является более высокая конкуренция среди банков в Германии, чем во Франции и Испании. Клиенты имеют бОльшую возможность выбрать банк с более выгодными условиями в Германии, чем в других странах. Косвенно это подтверждают данные по количеству банков в этих странах – в Германии более 2000 банков на конец 2009 года [ссылка](https://ru.wikipedia.org/wiki/Банковская_система_Германии), во Франции – более 400 по данным 2021 года [ссылка](https://corporatefinanceinstitute.com/resources/careers/companies/top-banks-in-france/), в Испании – только 10 [ссылка](https://translated.turbopages.org/proxy_u/en-ru.ru.b5bf9164-62b7566b-142fdf31-74722d776562/https/en.wikipedia.org/wiki/List_of_banks_in_Spain). 


***
**Задание 9.10.**  
Переведите числовой признак CreditScore в категориальный.  
Для этого воспользуйтесь функцией get_credit_score_cat(), которая приведена ниже.  
Примените её к столбцу CreditScore и создайте новый признак CreditScoreCat — категории кредитного рейтинга.  
Постройте сводную таблицу, строками которой являются категории кредитного рейтинга (CreditScoreCat),  
а столбцами — количество лет, в течение которых клиент пользуется услугами банка (Tenure).  
В ячейках сводной таблицы должно находиться среднее по признаку оттока (Exited) — доля ушедших пользователей.  
    
На основе полученной сводной таблицы постройте тепловую карту с аннотацией.  
Найдите на тепловой карте категории клиентов, которые уходят чаще всего.

In [12]:
def get_credit_score_cat(credit_score): # представленная в задании функция
    if credit_score >= 300 and credit_score < 500:
        return "Very_Poor"
    elif credit_score >= 500 and credit_score < 601:
        return "Poor"
    elif credit_score >= 601 and credit_score < 661:
        return "Fair"
    elif credit_score >= 661 and credit_score < 781:
        return "Good"
    elif credit_score >= 781 and credit_score < 851:
        return "Excellent"
    elif credit_score >= 851:
        return "Top"
    elif credit_score < 300:
        return "Deep"

   
churn_data['CreditScoreCat'] = churn_data['CreditScore'].apply(get_credit_score_cat) # применяем функция к стобцу CreditScore 
                                                                                     # и создаем новый столбец CreditScoreCat

# display(churn_data) # проверяем, что появился новый столбец 
# churn_data.info() # проверяем, что столбец CreditScore стал категориальным

churn_data_pivot = churn_data.pivot_table( # создаем сводную таблицу согласно условиям задачи
    values='Exited',
    index='CreditScoreCat',
    columns='Tenure',
    aggfunc='mean'
)

# display(churn_data_pivot) # проверяем правильность сводной таблицы

fig = px.imshow(churn_data_pivot, text_auto=True,
                title="Dependence of the share of departed customers on the category of credit rating <br>and the number of years during which the client used the bank’s services.",
                labels=dict(x='Tenure ', y='Credit Score Category', color='Share of Exited '),
                width=1200, 
                height=500, 
                color_continuous_scale='Reds' 
                )

# fig.show() # GitHub не поддерживает Plotly

# сохраняем тепловую карту в html, svg
fig.write_html("plotly/11.html")
fig.write_image('plotly/img11.svg')

![Тепловая карта](plotly/img11.svg "Для просмотра HTML-версии нажмите ссылку ниже") 

[html-версия тепловой карты](plotly/11.html)  

На представленной тепловой карте можно отметить следующие категории клиентов, которые уходят чаще всего:
-  с категорией кредитного рейтинга “Very Poor” и сроком обслуживания менее года и в течение 10 лет (это значительно выше общей доли ушедших клиентов в 20%), также высокий уровень оттока демонстрируют клиенты этого же кредитного рейтинга со сроком обслуживания 1,3,4 года, 8 лет. 
- с категорией "Poor" и сроком обслуживания 1 и 9 лет.
- с категорией кредитного рейтинга “Excellent” и сроком обслуживания менее года и в течение 9-10 лет. 

NB. За критерий наиболее частого ухода клиентов возьмем 25% и выше, учитывая что общая доля ушедших клиентов 20% (данные из первого графика).
