In [8]:
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import cohen_kappa_score
from sklearn.metrics import f1_score


falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]


treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = DecisionTreeClassifier(max_depth=5)
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O kappa %.2f%%" % k)

A acuidade foi 75.18%
A precisão foi 81.21%
A recall foi 65.30%
O AUC foi 75.15%
O f-measure foi 72.39%
O kappa 50.32%


In [9]:
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import cohen_kappa_score


falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]


treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

scaler = StandardScaler()
scaler.fit(treino_x)
treino_x = scaler.transform(treino_x)
teste_x = scaler.transform(teste_x)

modelo = SVC()
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 74.55%
A precisão foi 80.43%
A recall foi 64.67%
O AUC foi 74.52%
O f-measure foi 71.70%
O  kappa 49.07%


In [10]:
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import BernoulliNB
from sklearn.metrics import cohen_kappa_score


falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]


treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = BernoulliNB()
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 74.35%
A precisão foi 76.48%
A recall foi 70.10%
O AUC foi 74.34%
O f-measure foi 73.15%
O  kappa 48.69%


In [11]:
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import cohen_kappa_score

falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]


treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = MLPClassifier()
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 49.88%
A precisão foi 49.86%
A recall foi 99.92%
O AUC foi 50.04%
O f-measure foi 66.53%
O  kappa 0.08%




In [12]:
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import cohen_kappa_score


falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

#x = falso[["ncodpers","ind_empleado","pais_residencia","sexo","age","AgeStatus","ind_nuevo","antiguedad","indrel","indrel_1mes","tiprel_1mes","indresi","indext","indfall","tipodom","cod_prov","ind_actividad_cliente","renta","segmento","ind_ahor_fin_ult1","ind_aval_fin_ult1","ind_cder_fin_ult1","ind_cno_fin_ult1","ind_ctju_fin_ult1","ind_ctma_fin_ult1","ind_ctop_fin_ult1","ind_ctpp_fin_ult1","ind_deco_fin_ult1","ind_deme_fin_ult1","ind_dela_fin_ult1","ind_ecue_fin_ult1","ind_fond_fin_ult1","ind_hip_fin_ult1","ind_plan_fin_ult1","ind_pres_fin_ult1","ind_reca_fin_ult1","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_viv_fin_ult1","ind_nomina_ult1","ind_nom_pens_ult1","ind_recibo_ult1"]]
x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]


treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = RandomForestClassifier(max_depth=5)
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 74.86%
A precisão foi 80.35%
A recall foi 65.62%
O AUC foi 74.83%
O f-measure foi 72.24%
O  kappa 49.70%




In [15]:
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.metrics import cohen_kappa_score


falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]

treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = GradientBoostingClassifier(max_depth=5)
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 74.51%
A precisão foi 79.60%
A recall foi 65.70%
O AUC foi 74.48%
O f-measure foi 71.98%
O  kappa 48.99%


In [18]:
import pandas
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.tree import ExtraTreeClassifier
from sklearn.metrics import cohen_kappa_score

falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]

treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = ExtraTreeClassifier()
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 65.80%
A precisão foi 65.77%
A recall foi 65.46%
O AUC foi 65.80%
O f-measure foi 65.62%
O  kappa 31.61%


In [20]:
import pandas
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import recall_score
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import cohen_kappa_score

falso = pd.read_csv("falso.csv")
er = pd.read_csv("er.csv")

x = falso[["ind_nom_pens_ult1","ind_actividad_cliente","ind_nomina_ult1","ind_ctop_fin_ult1","tiprel_1mes","ind_tjcr_fin_ult1","ind_valo_fin_ult1","ind_fond_fin_ult1","ncodpers"]]
y = falso["ind_cco_fin_ult1"]

treino_x, teste_x, treino_y, teste_y = train_test_split(x, y, test_size = 0.3,
                                                         stratify = y)

modelo = LogisticRegression()
modelo.fit(treino_x, treino_y)
previsoes = modelo.predict(teste_x)

acuidade = accuracy_score(teste_y, previsoes) * 100
print("A acuidade foi %.2f%%" % acuidade)

precision = precision_score(teste_y, previsoes) * 100
print("A precisão foi %.2f%%" % precision)

recall = recall_score(teste_y, previsoes) * 100
print("A recall foi %.2f%%" % recall)

curva = roc_auc_score(teste_y, previsoes) * 100
print("O AUC foi %.2f%%" % curva)

F1 = 2 * (precision * recall) / (precision + recall)
print("O f-measure foi %.2f%%" % F1)

k = cohen_kappa_score(teste_y, previsoes) * 100
print("O  kappa %.2f%%" % k)

A acuidade foi 75.25%
A precisão foi 82.39%
A recall foi 64.04%
O AUC foi 75.22%
O f-measure foi 72.07%
O  kappa 50.47%


