# RFM-анализ клиентов интернет-магазина

**Цель проекта**
- Рассчитать RFM-метрики (Recency, Frequency, Monetary)  
- Сегментировать клиентов по ценности  
- Построить визуализации для анализа вклада сегментов в выручку  

**Этапы проекта**
1. Загрузка агрегатов из SQL (CSV)  
2. Подготовка палитры цветов  
3. Bar chart: выручка по сегментам  
4. Bar chart: количество клиентов по сегментам  
5. Pie chart: доля выручки по сегментам  

## Импортируем библиотеки

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

## Указываем путь к файлу

In [None]:
input_csv = "C:/VS_CODE_PROJECTS/PET_PROJECTS/SQL PROJECT/output_data/rfm_segments.csv"
output_dir = "C:/VS_CODE_PROJECTS/PET_PROJECTS/SQL PROJECT/output_data"

## Загружаем данные

In [6]:
df = pd.read_csv(input_csv)

## Задаем палитру для графиков

In [52]:
colors={
    'Champions' : '#4CAF50',
    'Loyal' : '#2196F3',
    'Others' : '#FF9800',
    'Lost' : '#9E9E9E'
}

## Bar chart - выручка

In [61]:
df_sorted_1 = df.sort_values('revenue', ascending=False)
plt.figure(figsize=(8,5))
plt.bar(df_sorted_1['segment'], df_sorted_1['revenue'], color=[colors[i] for i in df_sorted_1['segment']])
plt.title('Выручка по сегментам клиентов')
plt.ylabel('Выручка')
plt.xlabel('Сегмент')
plt.tight_layout()
plt.savefig(f"{output_dir}/rfm_revenue_bar.png")
plt.close()

## Bar chart - количество клиентов

In [62]:
df_sorted_2 = df.sort_values('customers', ascending=False)
plt.figure(figsize=(8,5))
plt.bar(df_sorted_2['segment'], df_sorted_2['customers'], color=[colors[i] for i in df_sorted_2['segment']])
plt.title('Количество клиентов по сегментам')
plt.ylabel('Количество клиентов')
plt.xlabel('Сегмент')
plt.tight_layout()
plt.savefig(f"{output_dir}/rfm_customers_bar.png")
plt.close()

## Pie chart — доля выручки по сегментам

In [66]:
explode = [0.05 if i =='Champions' else 0 for i in df['segment']]
plt.figure(figsize=(6,6))
plt.pie(
    df['revenue'], 
    labels=df['segment'], 
    autopct='%1.1f%%', 
    startangle=140, 
    colors=[colors[i] for i in df['segment']],
    explode=explode
)
plt.title('Доля выручки по сегментам')
plt.ylabel('Выручка')
plt.xlabel('Сегмент')
plt.tight_layout()
plt.savefig(f"{output_dir}/rfm_revenue_pie.png")
plt.close()

### Графики сохранены в папку 'output_data/'

# Выводы

- Champions (около 10% клиентов) приносят ~40% всей выручки.  
- Loyal-клиенты обеспечивают стабильный поток (~27%).  
- Others формируют большую массу клиентов, но меньший вклад в доход (~29%).  
- Lost — практически незначимый сегмент (<1%).  

**Рекомендация:**  
Сосредоточить усилия на удержании Champions и развитии Loyal, так как именно они формируют основную ценность для бизнеса.