# An√°lise de Segmenta√ß√£o de Clientes

## Objetivo

Este notebook demonstra uma an√°lise completa de segmenta√ß√£o de clientes utilizando a t√©cnica RFM (Recency, Frequency, Monetary).
A an√°lise RFM permite identificar diferentes grupos de clientes baseados em:
- **Recency (R)**: Qu√£o recentemente o cliente fez uma compra
- **Frequency (F)**: Com que frequ√™ncia o cliente compra
- **Monetary (M)**: Quanto dinheiro o cliente gasta

Com essa segmenta√ß√£o, podemos criar estrat√©gias de marketing direcionadas para cada grupo de clientes.

In [None]:
# Importa√ß√µes necess√°rias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

# Configura√ß√µes
plt.style.use('default')
sns.set_palette('husl')
plt.rcParams['figure.figsize'] = (10, 6)

In [None]:
# Leitura dos dados de clientes
df = pd.read_csv('../data/customer_data.csv')

# Visualizar as primeiras linhas
print('Dimens√µes dos dados:', df.shape)
print('\nPrimeiras 5 linhas:')
df.head()

In [None]:
# An√°lise RFM (Recency, Frequency, Monetary)

# Convertendo a coluna de data para datetime
df['purchase_date'] = pd.to_datetime(df['purchase_date'])

# Data de refer√™ncia (assumindo que √© a data mais recente nos dados)
reference_date = df['purchase_date'].max()

# Calculando m√©tricas RFM por cliente
rfm = df.groupby('customer_id').agg({
    'purchase_date': lambda x: (reference_date - x.max()).days,  # Recency
    'transaction_id': 'count',                                   # Frequency
    'purchase_amount': 'sum'                                     # Monetary
}).reset_index()

# Renomeando as colunas
rfm.columns = ['customer_id', 'recency', 'frequency', 'monetary']

# Criando scores RFM (1-5, onde 5 √© o melhor)
rfm['R_score'] = pd.qcut(rfm['recency'], 5, labels=[5,4,3,2,1])
rfm['F_score'] = pd.qcut(rfm['frequency'].rank(method='first'), 5, labels=[1,2,3,4,5])
rfm['M_score'] = pd.qcut(rfm['monetary'], 5, labels=[1,2,3,4,5])

# Score RFM combinado
rfm['RFM_score'] = rfm['R_score'].astype(str) + rfm['F_score'].astype(str) + rfm['M_score'].astype(str)

# Segmenta√ß√£o baseada nos scores
def segment_customers(df):
    if df['RFM_score'] in ['555', '554', '544', '545', '454', '455', '445']:
        return 'Champions'
    elif df['RFM_score'] in ['543', '444', '435', '355', '354', '345', '344', '335']:
        return 'Loyal Customers'
    elif df['RFM_score'] in ['512', '511', '422', '421', '412', '411', '311']:
        return 'Potential Loyalists'
    elif df['RFM_score'] in ['533', '532', '531', '523', '522', '521', '515', '514', '513', '425', '424', '413', '414', '415', '315', '314', '313']:
        return 'New Customers'
    elif df['RFM_score'] in ['155', '154', '144', '214', '215', '115', '114']:
        return 'At Risk'
    elif df['RFM_score'] in ['155', '154', '144', '214', '215', '115']:
        return "Can't Lose Them"
    else:
        return 'Others'

rfm['segment'] = rfm.apply(segment_customers, axis=1)

print('An√°lise RFM conclu√≠da!')
print('\nPrimeiras linhas da an√°lise RFM:')
rfm.head()

In [None]:
# Gr√°fico de barras dos segmentos de clientes

# Contagem de clientes por segmento
segment_counts = rfm['segment'].value_counts()

# Criando o gr√°fico
plt.figure(figsize=(12, 8))

# Gr√°fico de barras
bars = plt.bar(segment_counts.index, segment_counts.values, 
               color=['#FF6B6B', '#4ECDC4', '#45B7D1', '#96CEB4', '#FECA57', '#FF9FF3'])

# Personalizando o gr√°fico
plt.title('Distribui√ß√£o de Clientes por Segmento RFM', fontsize=16, fontweight='bold', pad=20)
plt.xlabel('Segmento de Clientes', fontsize=12)
plt.ylabel('N√∫mero de Clientes', fontsize=12)
plt.xticks(rotation=45, ha='right')

# Adicionando valores nas barras
for bar in bars:
    height = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2., height + 0.5,
             f'{int(height)}', ha='center', va='bottom', fontweight='bold')

# Ajustando layout
plt.tight_layout()
plt.grid(axis='y', alpha=0.3)
plt.show()

# Estat√≠sticas dos segmentos
print('\nEstat√≠sticas por Segmento:')
segment_stats = rfm.groupby('segment').agg({
    'recency': 'mean',
    'frequency': 'mean',
    'monetary': 'mean'
}).round(2)

segment_stats

## Interpreta√ß√£o dos Resultados

### An√°lise dos Segmentos de Clientes

Com base na an√°lise RFM realizada, podemos interpretar os diferentes segmentos de clientes:

#### 1. **Champions** üèÜ
- **Caracter√≠sticas**: Compraram recentemente, compram frequentemente e gastam mais
- **Estrat√©gia**: Recompensar, podem se tornar advogados da marca, oferecer produtos novos

#### 2. **Loyal Customers** üíé
- **Caracter√≠sticas**: Gastam bem e compram regularmente
- **Estrat√©gia**: Fidelizar ainda mais, programas de upselling, aumentar frequ√™ncia de compra

#### 3. **Potential Loyalists** üå±
- **Caracter√≠sticas**: Clientes recentes com potencial de crescimento
- **Estrat√©gia**: Oferecer membership/programas de fidelidade, engajar com conte√∫do

#### 4. **New Customers** üÜï
- **Caracter√≠sticas**: Compraram recentemente mas com baixa frequ√™ncia
- **Estrat√©gia**: Foco em onboarding, educa√ß√£o sobre produtos, oferecer suporte

#### 5. **At Risk** ‚ö†Ô∏è
- **Caracter√≠sticas**: Gastavam bem mas n√£o compram h√° um tempo
- **Estrat√©gia**: Campanhas de reativa√ß√£o, ofertas especiais, pesquisa de satisfa√ß√£o

#### 6. **Can't Lose Them** üö®
- **Caracter√≠sticas**: Eram bons clientes mas est√£o inativos
- **Estrat√©gia**: Campanhas agressivas de recupera√ß√£o, ofertas personalizadas

### Recomenda√ß√µes Estrat√©gicas

1. **Foco nos Champions**: Investir em programas VIP e referral
2. **Desenvolver Potential Loyalists**: Criar jornadas de engajamento
3. **Reativar clientes At Risk**: Campanhas de win-back personalizadas
4. **Monitoramento cont√≠nuo**: Reavaliar segmenta√ß√£o mensalmente

Esta an√°lise deve ser utilizada como base para defini√ß√£o de estrat√©gias de CRM e campanhas de marketing direcionadas.