In [None]:
import pandas as pd  # библиотека для работы с таблицами

df = pd.read_csv('data/BankChurners.csv')  # читаем файл
df.head()  # выводим первые 5 строк


In [None]:
df.shape  # размер таблицы


In [None]:
df.info()  # информация о столбцах и типах данных


In [None]:
df.isna().sum()  # проверка пропущенных значений


## Фильтрация

In [None]:
# фильтрация: клиенты с 4 и более неактивными месяцами
filtered = df[df['Months_Inactive_12_mon'] >= 4]

# сортировка по количеству транзакций (по убыванию)
sorted_df = filtered.sort_values(by='Total_Trans_Ct', ascending=False)

sorted_df.head()


## Создание нового признака

In [None]:
# создаем новый признак: кредитный лимит в тысячах долларов
df['Credit_Limit_K'] = df['Credit_Limit'] / 1000

# проверяем результат
df[['Credit_Limit', 'Credit_Limit_K']].head()

In [None]:
# создаем признак оттока клиента (Churn)
df['Churn'] = df['Attrition_Flag'].apply(
    lambda x: 1 if x == 'Attrited Customer' else 0
)

#df[['Attrition_Flag', 'Churn']].head()

In [None]:
df['Churn'].value_counts() #считаем сколько ушло сколько осталось 0 - остался, 1 - ушел

## Группировка

In [None]:
# средний кредитный лимит по типу карты
df.groupby('Card_Category')['Credit_Limit'].mean()

In [None]:
# среднее количество транзакций для ушедших и оставшихся клиентов
df.groupby('Churn')['Total_Trans_Ct'].mean()

In [None]:
# средняя сумма транзакций по уровню дохода
df.groupby('Income_Category')['Total_Trans_Amt'].mean()

## Визуализация

In [None]:
# количество ушедших и оставшихся клиентов
df['Churn'].value_counts().plot(
    kind='bar',
    title='Количество ушедших и оставшихся клиентов'
)

In [None]:
# среднее количество транзакций по типу карты
df.groupby('Card_Category')['Total_Trans_Ct'].mean().plot(
    kind='bar',
    title='Среднее количество транзакций по типу карты'
)

In [None]:
# средняя сумма транзакций для ушедших и оставшихся клиентов
df.groupby('Churn')['Total_Trans_Amt'].mean().plot(
    kind='bar',
    title='Средняя сумма транзакций: churn vs non-churn'
)

# Выводы

### Клиенты с меньшим количеством транзакций чаще уходят из банка

### Владельцы базовых карт имеют более высокий churn (среди владельцев базовых карт уходит больше людей, чем среди владельцев более дорогих карт)

### Не всегда можно установить зависимость между возрастом, полом и транзакциями