> **Importando a lib Pandas**

In [11]:
import pandas as pd

> **Criando um DataFrame à partir do arquivo .csv**

In [49]:
df = pd.read_csv('situacao_do_cliente.csv')

> **Criando DataFrames para características e resultados**

In [50]:
X_df = df[['recencia', 'frequencia', 'semanas_de_inscricao']]
Y_df = df['situacao']

> **Criando Dummies das variáveis não numéricas**

> Dummies são usados para transformar categorias *string* em várias categorias *binárias*.

In [51]:
Xdummies_df = pd.get_dummies(X_df)
Ydummies_df = Y_df

> **Criando listas à partir dos DataFrames**

In [52]:
X = Xdummies_df.values
Y = Ydummies_df.values

> **Criando dados de treino** *(80%)* **, dados de teste** *(10%)* **e dados de validação** *(10%)*

In [223]:
porcentagem_de_treino = int(0.6 * len(Y))
porcentagem_de_teste = int(0.2 * len(Y))
porcentagem_de_validacao = int(0.2 * len(Y))

#0-900
treino_dados = X[:porcentagem_de_treino]
treino_marcacoes = Y[:porcentagem_de_treino]

#800-899
teste_dados = X[porcentagem_de_treino:porcentagem_de_treino+porcentagem_de_teste]
teste_marcacoes = Y[porcentagem_de_treino:porcentagem_de_treino+porcentagem_de_teste]

#900-999
validacao_dados = X[-porcentagem_de_validacao:]
validacao_marcacoes = Y[-porcentagem_de_validacao:]

> **Importando algoritmo usado como multiclass**

In [224]:
from sklearn.svm import LinearSVC

> **Função para treinamento e predição de um modelo**

In [225]:
def fit_and_predict(nome, modelo, treino_dados, treino_marcacoes, teste_dados, teste_marcacoes):
    modelo.fit(treino_dados, treino_marcacoes)

    resultado = modelo.predict(teste_dados)

    acertos = resultado == teste_marcacoes

    total_de_acertos = sum(acertos)
    total_de_elementos = len(teste_dados)

    taxa_de_acerto = 100.0 * total_de_acertos / total_de_elementos

    print("Taxa de acerto do algoritmo {0}: {1}%".format(nome, round(taxa_de_acerto)))

    return float(taxa_de_acerto)

In [226]:
resultados = {}

In [227]:
from sklearn.naive_bayes import MultinomialNB # Para Naive Bayes
modelo_MultinomialNB = MultinomialNB()
resultado_MultinomialNB = fit_and_predict('MultinomialNB', modelo_MultinomialNB, treino_dados, treino_marcacoes, teste_dados, teste_marcacoes)
resultados['MultinomialNB'] = resultado_MultinomialNB

Taxa de acerto do algoritmo MultinomialNB: 89.0%


In [228]:
from sklearn.ensemble import AdaBoostClassifier # Para usar AdaBoost
modelo_AdaBoostClassifier = AdaBoostClassifier()
resultado_AdaBoostClassifier = fit_and_predict('AdaBoostClassifier', modelo_AdaBoostClassifier, treino_dados, treino_marcacoes, teste_dados, teste_marcacoes)
resultados['AdaBoostClassifier'] = resultado_AdaBoostClassifier

Taxa de acerto do algoritmo AdaBoostClassifier: 80.0%


In [229]:
from sklearn.multiclass import OneVsRestClassifier 
modelo_OneVsRestClassifier = OneVsRestClassifier(LinearSVC(random_state=0))
resultado_OneVsRestClassifier = fit_and_predict('OneVsRestClassifier', modelo_OneVsRestClassifier, treino_dados, treino_marcacoes, teste_dados, teste_marcacoes)
resultados['OneVsRestClassifier'] = resultado_OneVsRestClassifier

Taxa de acerto do algoritmo OneVsRestClassifier: 93.0%


In [230]:
from sklearn.multiclass import OneVsOneClassifier 
modelo_OneVsOneClassifier = OneVsOneClassifier(LinearSVC(random_state=0))
resultado_OneVsOneClassifier = fit_and_predict('OneVsOneClassifier', modelo_OneVsOneClassifier, treino_dados, treino_marcacoes, teste_dados, teste_marcacoes)
resultados['OneVsOneClassifier'] = resultado_OneVsOneClassifier

Taxa de acerto do algoritmo OneVsOneClassifier: 100.0%


In [231]:
print('Algoritmo burro: {0}%'.format(round(max([len(teste_marcacoes[teste_marcacoes==0]), len(teste_marcacoes[teste_marcacoes==1]),len(teste_marcacoes[teste_marcacoes==2])])/len(teste_marcacoes)*100)))

Algoritmo burro: 80%


In [232]:
maximo = max(resultados)
vencedor = resultados[maximo]
print('Vencedor: {0}'.format(maximo))

Vencedor: OneVsRestClassifier


> Testando os algoritmos no mundo real:

In [233]:
print(modelo_OneVsOneClassifier.predict(validacao_dados) - validacao_marcacoes)

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0]


In [234]:
print(modelo_OneVsRestClassifier.predict(validacao_dados) - validacao_marcacoes)

[0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0
 0 0 0 0 0 0 0 1]


In [235]:
print(modelo_MultinomialNB.predict(validacao_dados) - validacao_marcacoes)

[-1  1  0  0  0  0  0  0  0  0  0  0  0  1  0  0  0  0  1  0  0  0  0  0  0
  0  0  0  0  1  0  1  0  0  0  0  0  0  0  0  0  0  0  0  1]


In [236]:
print(modelo_AdaBoostClassifier.predict(validacao_dados) - validacao_marcacoes)

[-1  1  0  0  0  0  0  0 -1  0 -1  0  0  1  0  0  0  0  1  0 -1  0  0  0  0
 -1  0  0  0  1  0  1  0  0  0  0  0  0  0  0  0  0  0  0  1]
