# RFV

**RFV** significa recência, frequência, valor e é utilizado para segmentação de clientes baseado no comportamento de compras dos clientes e agrupa eles em clusters parecidos. Utilizando esse tipo de agrupamento podemos realizar ações de marketing e CRM melhores direcionadas, ajudando assim na personalização do conteúdo e até a retenção de clientes.

Para cada cliente é preciso calcular cada uma das componentes abaixo:

- Recência (R): Quantidade de dias desde a última compra.
- Frequência (F): Quantidade total de compras no período.
- Valor (V): Total de dinheiro gasto nas compras do período.

E é isso que iremos fazer abaixo.



In [27]:
!pip install pandas -U --user
!pip install streamlit -U
!pip install numpy -U
!pip install datetime -U
!pip install Pillow -U --user
!pip install Python-IO -U



In [19]:
import numpy as np
import pandas as pd
from datetime import datetime


### Criando os segmentos
def recencia_class(x, r, q_dict):
    """Classifica como melhor o menor quartil 
       x = valor da linha,
       r = recencia,
       q_dict = quartil dicionario   
    """
    if x <= q_dict[r][0.25]:
        return 'A'
    elif x <= q_dict[r][0.50]:
        return 'B'
    elif x <= q_dict[r][0.75]:
        return 'C'
    else:
        return 'D'


def freq_val_class(x, fv, q_dict):
    """Classifica como melhor o maior quartil 
       x = valor da linha,
       fv = frequencia ou valor,
       q_dict = quartil dicionario   
    """
    if x <= q_dict[fv][0.25]:
        return 'D'
    elif x <= q_dict[fv][0.50]:
        return 'C'
    elif x <= q_dict[fv][0.75]:
        return 'B'
    else:
        return 'A'


df_compras = pd.read_csv('./data/input/dados.csv',
                         parse_dates=['DiaCompra'])

## Recência

####**Quantos dias faz que o cliente fez a sua última compra?**

df_recencia = df_compras.groupby(by='ID_cliente',
                                 as_index=False)['DiaCompra'].max()
df_recencia.columns = ['ID_cliente', 'DiaUltimaCompra']
print(df_recencia.head())

## dia_atual

dia_atual = df_compras['DiaCompra'].max()
print(dia_atual)

df_recencia['Recencia'] = df_recencia['DiaUltimaCompra'].apply(
    lambda x: (dia_atual - x).days)

print(df_recencia.head())

df_recencia.drop('DiaUltimaCompra', axis=1, inplace=True)

## Frequência

####**Quantas vezes cada cliente comprou com a gente?**

df_frequencia = df_compras[['ID_cliente', 'CodigoCompra'
                            ]].groupby('ID_cliente').count().reset_index()
df_frequencia.columns = ['ID_cliente', 'Frequencia']
print(df_frequencia.head())

## Valor

#### Quanto que cada cliente gastou no periodo?

df_valor = df_compras[['ID_cliente', 'ValorTotal'
                       ]].groupby('ID_cliente').sum().reset_index()
df_valor.columns = ['ID_cliente', 'Valor']
print(df_valor.head())

## Criando a tabela RFV

df_RFV = df_recencia.merge(df_frequencia, on='ID_cliente')
print(df_RFV.head())

df_RFV = df_RFV.merge(df_valor, on='ID_cliente')
df_RFV.set_index('ID_cliente', inplace=True)
print(df_RFV.head())

## Segmentação de clientes utilizando o RFV

### Um jeito de segmentar os clientes é criando quartis para cada componente do RFV, sendo que o melhor quartil é chamado de 'A', o segundo melhor quartil de 'B', o terceiro melhor de 'C' e o pior de 'D'. O melhor e o pior depende da componente. Po exemplo, quanto menor a recência melhor é o cliente (pois ele comprou com a gente tem pouco tempo) logo o menor quartil seria classificado como 'A', já pra componente frêquencia a lógica se inverte, ou seja, quanto maior a frêquencia do cliente comprar com a gente, melhor ele/a é, logo, o maior quartil recebe a letra 'A'.
### Se a gente tiver interessado em mais ou menos classes, basta a gente aumentar ou diminuir o número de quantils pra cada componente.

### Quartis para o RFV

quartis = df_RFV.quantile(q=[0.25, 0.5, 0.75])
print(quartis)

df_RFV['R_quartil'] = df_RFV['Recencia'].apply(recencia_class,
                                                args=('Recencia', quartis))
df_RFV['F_quartil'] = df_RFV['Frequencia'].apply(freq_val_class,
                                                  args=('Frequencia', quartis))
df_RFV['V_quartil'] = df_RFV['Valor'].apply(freq_val_class,
                                             args=('Valor', quartis))

print(df_RFV.head())

df_RFV['RFV_Score'] = (df_RFV.R_quartil + df_RFV.F_quartil +
                       df_RFV.V_quartil)
print(df_RFV.head())

df_RFV['RFV_Score'].value_counts()

df_RFV[df_RFV['RFV_Score'] == 'AAA'].sort_values('Valor',
                                                 ascending=False).head(10)

### Ações de marketing/CRM

dict_acoes = {
    'AAA':
    'Enviar cupons de desconto, Pedir para indicar nosso produto pra algum amigo, Ao lançar um novo produto enviar amostras grátis pra esses.',
    'DDD':
    'Churn! clientes que gastaram bem pouco e fizeram poucas compras, fazer nada',
    'DAA':
    'Churn! clientes que gastaram bastante e fizeram muitas compras, enviar cupons de desconto para tentar recuperar',
    'CAA':
    'Churn! clientes que gastaram bastante e fizeram muitas compras, enviar cupons de desconto para tentar recuperar'
}

df_RFV['acoes de marketing/crm'] = df_RFV['RFV_Score'].map(dict_acoes)

print(df_RFV.head())

df_RFV.to_excel('./data/output/RFV_.xlsx')

   ID_cliente DiaUltimaCompra
0       12747      2021-12-07
1       12748      2021-12-09
2       12749      2021-12-06
3       12820      2021-12-06
4       12821      2021-05-09
2021-12-09 00:00:00
   ID_cliente DiaUltimaCompra  Recencia
0       12747      2021-12-07         2
1       12748      2021-12-09         0
2       12749      2021-12-06         3
3       12820      2021-12-06         3
4       12821      2021-05-09       214
   ID_cliente  Frequencia
0       12747          11
1       12748         178
2       12749           5
3       12820           4
4       12821           1
   ID_cliente     Valor
0       12747   4196.01
1       12748  31533.04
2       12749   4090.88
3       12820    942.34
4       12821     92.72
   ID_cliente  Recencia  Frequencia
0       12747         2          11
1       12748         0         178
2       12749         3           5
3       12820         3           4
4       12821       214           1
            Recencia  Frequencia     Valor
I

In [14]:
def to_excel(df):
    output = BytesIO()
    writer = pd.ExcelWriter(output, engine='xlsxwriter')
    df.to_excel(writer, index=True, sheet_name='Sheet1')
    writer.close()
    processed_data = output.getvalue()
    return processed_data

In [18]:
from io                  import BytesIO
df_xlsx = to_excel(df_RFV)