# 🎯 Müşteri Segmentasyonu (Growth Engine)

## İş Problemi

Tüm müşterilere aynı şekilde davranmak verimsiz:
- 💎 VIP müşterilere özel ilgi gösterilmiyor
- ⚠️ Kayıp riski olan müşteriler fark edilmiyor
- 🌱 Yeni müşterilere doğru onboarding yapılmıyor

**Hedef:** Müşterileri RFM değerlerine göre segmentlere ayırarak:
1. Her segmente özel strateji geliştir
2. Pazarlama bütçesini optimize et
3. Müşteri yaşam boyu değerini artır

**Yöntem:** K-Means Clustering (unsupervised learning)

In [1]:
import pandas as pd
import numpy as np
import plotly.express as px
from sqlalchemy import create_engine, text
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler
import warnings
warnings.filterwarnings('ignore')

engine = create_engine('postgresql://postgres:postgres@localhost:5432/olist')
print("✅ Bağlantı hazır")

✅ Bağlantı hazır


## Adım 1: RFM Verisi

Segmentasyon için aynı RFM metriklerini kullanıyoruz:
- **R**ecency: Son alışverişten geçen gün
- **F**requency: Toplam sipariş sayısı
- **M**onetary: Toplam harcama

In [2]:
query = """
WITH customer_stats AS (
    SELECT 
        c.customer_unique_id,
        MAX(o.order_purchase_timestamp::timestamp) as last_purchase,
        COUNT(DISTINCT o.order_id) as frequency,
        SUM(oi.price + oi.freight_value) as monetary
    FROM customers c
    JOIN orders o ON c.customer_id = o.customer_id
    JOIN order_items oi ON o.order_id = oi.order_id
    WHERE o.order_status = 'delivered'
    GROUP BY c.customer_unique_id
)
SELECT 
    customer_unique_id,
    EXTRACT(DAY FROM ('2018-09-01'::timestamp - last_purchase))::int as recency,
    frequency::int,
    monetary
FROM customer_stats
WHERE monetary > 0
"""

with engine.connect() as conn:
    df = pd.read_sql(text(query), conn)

print(f"✅ {len(df):,} müşteri yüklendi")
df.describe().round(1)

✅ 93,358 müşteri yüklendi


Unnamed: 0,recency,frequency,monetary
count,93358.0,93358.0,93358.0
mean,239.5,1.0,165.2
std,152.6,0.2,226.3
min,2.0,1.0,9.6
25%,116.0,1.0,63.0
50%,220.0,1.0,107.8
75%,348.0,1.0,182.5
max,715.0,15.0,13664.1


## Adım 2: Veri Hazırlama

K-Means algoritması için:
1. **Outlier temizleme** - Aşırı değerler kümelemeyi bozar
2. **Standardizasyon** - Tüm özellikler aynı ölçekte olmalı

In [3]:
# IQR ile outlier temizleme
original_count = len(df)

for col in ['recency', 'frequency', 'monetary']:
    Q1, Q3 = df[col].quantile([0.25, 0.75])
    IQR = Q3 - Q1
    df = df[(df[col] >= Q1 - 1.5*IQR) & (df[col] <= Q3 + 1.5*IQR)]

print(f"📊 Outlier temizliği:")
print(f"   Önce: {original_count:,} müşteri")
print(f"   Sonra: {len(df):,} müşteri")
print(f"   Çıkarılan: {original_count - len(df):,} aşırı değer")

# Standardizasyon
scaler = StandardScaler()
X = scaler.fit_transform(df[['recency', 'frequency', 'monetary']])

print(f"\n✅ Standardizasyon tamamlandı")

📊 Outlier temizliği:
   Önce: 93,358 müşteri
   Sonra: 83,390 müşteri
   Çıkarılan: 9,968 aşırı değer

✅ Standardizasyon tamamlandı


## Adım 3: Optimal Küme Sayısı (Elbow Method)

**Soru:** Kaç segment oluşturmalıyız?

**Yöntem:** Elbow (Dirsek) metodu
- Her K değeri için "inertia" (küme içi mesafe toplamı) hesapla
- Grafikte "dirsek" noktası optimal K'yı gösterir

In [4]:
inertias = []
K_range = range(2, 8)

for k in K_range:
    km = KMeans(n_clusters=k, random_state=42, n_init=10)
    km.fit(X)
    inertias.append(km.inertia_)

fig = px.line(x=list(K_range), y=inertias, markers=True,
              title='📐 Elbow Method - Optimal Küme Sayısı',
              labels={'x': 'Küme Sayısı (K)', 'y': 'Inertia (Düşük = İyi)'})
fig.add_vline(x=4, line_dash='dash', line_color='red', annotation_text='Optimal: K=4')
fig.show()

print("💡 Yorum: K=4'te belirgin bir dirsek görülüyor - 4 segment optimal.")

💡 Yorum: K=4'te belirgin bir dirsek görülüyor - 4 segment optimal.


## Adım 4: K-Means Segmentasyon

4 segment oluşturuyoruz ve iş mantığına göre isimlendiriyoruz:

| Segment | Özellik | Strateji |
|---------|---------|----------|
| 💎 Champions | Düşük R, Yüksek F, Yüksek M | VIP program |
| 🏆 Loyal | Düşük R, Orta F, Orta M | Sadakat puanları |
| ⚠️ At Risk | Yüksek R, Düşük F | Win-back kampanya |
| 🌱 New | Düşük R, F=1 | Onboarding |

In [5]:
# K-Means with K=4
kmeans = KMeans(n_clusters=4, random_state=42, n_init=10)
df['cluster'] = kmeans.fit_predict(X)

# Segment analizi
cluster_summary = df.groupby('cluster').agg({
    'recency': 'mean',
    'frequency': 'mean', 
    'monetary': 'mean',
    'customer_unique_id': 'count'
}).round(1)

# Segment isimlendirme (RFM değerlerine göre)
# Düşük R + Yüksek M = Champions, Yüksek R = At Risk, vb.
segment_names = {}
for cluster_id in range(4):
    r = cluster_summary.loc[cluster_id, 'recency']
    m = cluster_summary.loc[cluster_id, 'monetary']
    
    if r < 100 and m > 200:
        segment_names[cluster_id] = '💎 Champions'
    elif r < 150:
        segment_names[cluster_id] = '🏆 Loyal'
    elif r > 300:
        segment_names[cluster_id] = '⚠️ At Risk'
    else:
        segment_names[cluster_id] = '🌱 New/Potential'

df['segment'] = df['cluster'].map(segment_names)

# Özet tablo
summary = df.groupby('segment').agg({
    'recency': 'mean',
    'frequency': 'mean',
    'monetary': 'mean',
    'customer_unique_id': 'count'
}).round(1)
summary.columns = ['Ort. Recency', 'Ort. Frequency', 'Ort. Monetary', 'Müşteri Sayısı']

print("📊 Segment Özeti:")
display(summary)

📊 Segment Özeti:


Unnamed: 0_level_0,Ort. Recency,Ort. Frequency,Ort. Monetary,Müşteri Sayısı
segment,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
⚠️ At Risk,419.9,1.0,88.6,23465
🌱 New/Potential,184.3,1.0,109.4,41086
🏆 Loyal,136.4,1.0,161.2,18839


## Adım 5: Görselleştirme

Segmentleri 3D uzayda görselleştirerek grupların ayrışmasını kontrol ediyoruz.

In [6]:
# 3D Scatter plot
sample_df = df.sample(min(5000, len(df)), random_state=42)

fig = px.scatter_3d(sample_df, x='recency', y='frequency', z='monetary',
                    color='segment', opacity=0.6,
                    title='🎯 3D Müşteri Segmentleri (RFM Uzayı)',
                    labels={'recency': 'Recency (gün)', 
                           'frequency': 'Frequency', 
                           'monetary': 'Monetary (BRL)'})
fig.show()

# Segment dağılımı
fig = px.pie(df, names='segment', title='📊 Segment Dağılımı',
             color_discrete_sequence=px.colors.qualitative.Set2)
fig.show()

## Adım 6: Aksiyon Planı

Her segment için özel strateji:

In [7]:
actions = {
    '💎 Champions': {
        'strateji': 'VIP programı, özel indirimler, erken erişim',
        'kanal': 'Kişisel telefon, premium e-posta',
        'sıklık': 'Haftada 1'
    },
    '🏆 Loyal': {
        'strateji': 'Sadakat puanları, çapraz satış kampanyaları',
        'kanal': 'E-posta, app notification',
        'sıklık': 'Haftada 2'
    },
    '⚠️ At Risk': {
        'strateji': 'Win-back kampanyası, %20 indirim kuponu',
        'kanal': 'SMS, push notification',
        'sıklık': 'Hemen (urgent)'
    },
    '🌱 New/Potential': {
        'strateji': 'Onboarding e-posta serisi, ilk alışverişte %10 indirim',
        'kanal': 'Otomatik e-posta akışı',
        'sıklık': 'Günlük (7 gün)'
    }
}

print("🎯 SEGMENT BAZLI AKSİYON PLANI")
print("="*60)

for segment, info in actions.items():
    count = len(df[df['segment'] == segment])
    print(f"\n{segment} ({count:,} müşteri)")
    print(f"   📋 Strateji: {info['strateji']}")
    print(f"   📱 Kanal: {info['kanal']}")
    print(f"   ⏰ Sıklık: {info['sıklık']}")

🎯 SEGMENT BAZLI AKSİYON PLANI

💎 Champions (0 müşteri)
   📋 Strateji: VIP programı, özel indirimler, erken erişim
   📱 Kanal: Kişisel telefon, premium e-posta
   ⏰ Sıklık: Haftada 1

🏆 Loyal (18,839 müşteri)
   📋 Strateji: Sadakat puanları, çapraz satış kampanyaları
   📱 Kanal: E-posta, app notification
   ⏰ Sıklık: Haftada 2

⚠️ At Risk (23,465 müşteri)
   📋 Strateji: Win-back kampanyası, %20 indirim kuponu
   📱 Kanal: SMS, push notification
   ⏰ Sıklık: Hemen (urgent)

🌱 New/Potential (41,086 müşteri)
   📋 Strateji: Onboarding e-posta serisi, ilk alışverişte %10 indirim
   📱 Kanal: Otomatik e-posta akışı
   ⏰ Sıklık: Günlük (7 gün)


## Sonuç ve İş Değeri

### 📊 Segment Özeti
| Segment | Karakteristik | Öncelik |
|---------|--------------|----------|
| 💎 Champions | Yüksek değer, aktif | Koruma |
| 🏆 Loyal | Orta değer, aktif | Büyütme |
| ⚠️ At Risk | Yüksek recency | Acil müdahale |
| 🌱 New | Tek sipariş | 2. siparişe yönlendirme |

### 💰 Beklenen ROI
- **At Risk kurtarma:** %10 × 3,000 müşteri × 300 BRL = **90,000 BRL**
- **New dönüşüm:** %5 × 50,000 × 150 BRL = **375,000 BRL**
- **Toplam potansiyel:** ~465,000 BRL/yıl