 ## Prevendo o valor do ciclo de vida do cliente (CLV)</p>

Usando o histórico de compras anteriores dos seus clientes para criar um modelo que possa prever o Valor do Ciclo de Vida do Cliente (CLV) para clientes novos

## Carregando e visualizando os dados

In [None]:
from pandas import Series, DataFrame
import pandas as pd
import numpy as np
import os
import matplotlib.pylab as plt
from sklearn.model_selection  import train_test_split
from sklearn.linear_model import LinearRegression
import sklearn.metrics

raw_data = pd.read_csv("04_05_history.csv")

raw_data.dtypes


CLIENTE_ID    int64
MES_1         int64
MES_2         int64
MES_3         int64
MES_4         int64
MES_5         int64
MES_6         int64
CLV           int64
dtype: object

O conjunto de dados consiste no ID do cliente, no valor que o cliente gastou em seu site nos primeiros meses de relacionamento com sua empresa e no valor final do ciclo de vida (digamos três anos)

In [None]:
raw_data.head()

Unnamed: 0,CLIENTE_ID;MES_1;MES_2;MES_3;MES_4;MES_5;MES_6;CLV
0,1001;150;75;200;100;175;75;13125
1,1002;25;50;150;200;175;200;9375
2,1003;75;150;0;25;75;25;5156
3,1004;200;200;25;100;75;150;11756
4,1005;200;200;125;75;175;200;15525


## Análise da correlação

In [None]:
cleaned_data = raw_data.drop("CLIENTE_ID",axis=1)
cleaned_data .corr()['CLV']

MES_1    0.734122
MES_2    0.250397
MES_3    0.371742
MES_4    0.297408
MES_5    0.376775
MES_6    0.327064
CLV      1.000000
Name: CLV, dtype: float64

Podemos ver que os meses apresentam sólida correlação com a variável alvo (CLV). Isso nos dá confiança de que podemos criar um modelo para prever o CLV

## Divisão de treinamento e teste

Agora dividimos os dados em dados de treinamento e testes na proporção 90:10.

In [None]:
predictors = cleaned_data.drop("CLV",axis=1)
targets = cleaned_data.CLV

pred_train, pred_test, tar_train, tar_test  =   train_test_split(predictors, targets, test_size=.1)
print( "Preditor - Treinamento : ", pred_train.shape, "Preditor - Teste : ", pred_test.shape )


Preditor - Treinamento :  (90, 6) Preditor - Teste :  (10, 6)


## Testar o modelo
Criamosuma equação de regressão linear para prever o CLV e, em seguida, verificamos a sua precisão ao prever em relação ao conjunto de dados de testes

In [None]:
#Criando o modelo com dados de treinamento
model = LinearRegression()
model.fit(pred_train,tar_train)
print("Coeficientes: \n", model.coef_)
print("Intersecção:", model.intercept_)

#Testando com os dados de teste
predictions = model.predict(pred_test)
predictions

sklearn.metrics.r2_score(tar_test, predictions)

Coeficientes: 
 [35.42222745 11.38939425 15.83618861 13.08739993  8.32705537  5.39506965]
Intersecção: -400.89486703586226


0.8205006892671558

Apresenta 90% de precisão. Este é um excelente modelo para prever o CLV

## Prevendo o CLV para uma novo cliente
Supondo que temos um novo cliente que nos primeiros três meses gastou 100,0,50 no seu site. Usarei o o modelo para prever o CLV dele.

In [None]:
new_data = np.array([100,0,50,0,0,0]).reshape(1, -1)
new_pred=model.predict(new_data)
print("O CLV para o novo cliente é : $",new_pred[0])

O CLV para o novo cliente é : $ 3933.1373089593435


