In [None]:
import pandas as pd

In [None]:
# Através da análise das variáveis e do dicionário, algums informações relevantes:


# Variáveis categóricas:
# Personal Loan (Empréstimo Pessoal) - Este cliente aceitou o empréstimo pessoal oferecido na última campanha? Esta é a nossa variável alvo
# Securities Account (Conta de títulos) - O cliente possui conta de títulos no banco?
# CD Account (Conta de CD) - O cliente tem uma conta de certificado de depósito (CD) no banco?
# Online - O cliente usa serviços de banco pela Internet?
# Credit Card - (Cartão de crédito) - O cliente usa um cartão de crédito emitido pelo UniversalBank?

# Variáveis contínuas:

# Age (Idade) Idade do cliente
# Experience (Experiência) - anos de experiência
# Income (Renda) - Renda anual em dólares
# CCAvg (CCAvg) - gasto médio com cartão de crédito
# Mortage (Hipoteca) - Valor da hipoteca da casa

# Variáveis ​​categóricas ordinais:
# Family (Família) - tamanho da família do cliente
# Education (Educação) - nível de educação do cliente


# A variável ID não adiciona nenhuma informação interessante.
# Não há associação entre o ID de cliente de uma pessoa e o empréstimo, também não fornece nenhuma conclusão geral para futuros clientes de empréstimo em potencial.
# Podemos desconsiderar essas informações para o modelo.
# Zip code também pode ser desconsiderada, uma vez que a informação de distnância entre zip code pode não ser realidade

In [None]:
df = pd.read_excel('/content/Bank_Personal_Loan_Modelling.xlsx')
df.head()

Unnamed: 0,ID,Age,Experience,Income,Family,CCAvg,Education,Mortgage,Personal_Loan,Securities_Account,CD_Account,Online,CreditCard
0,1,25,1,49,4,1.6,1,0,0,1,0,0,0
1,2,45,19,34,3,1.5,1,0,0,1,0,0,0
2,3,39,15,11,1,1.0,1,0,0,0,0,0,0
3,4,35,9,100,1,2.7,2,0,0,0,0,0,0
4,5,35,8,45,4,1.0,2,0,0,0,0,0,1


In [None]:
#Excluindo variáveis não úteis

df = df.drop(columns=["ID"])

In [None]:
# Estatística básica das variáveis

df.describe().transpose()

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
Age,5000.0,45.3384,11.463166,23.0,35.0,45.0,55.0,67.0
Experience,5000.0,20.1046,11.467954,-3.0,10.0,20.0,30.0,43.0
Income,5000.0,73.7742,46.033729,8.0,39.0,64.0,98.0,224.0
Family,5000.0,2.3964,1.147663,1.0,1.0,2.0,3.0,4.0
CCAvg,5000.0,1.937913,1.747666,0.0,0.7,1.5,2.5,10.0
Education,5000.0,1.881,0.839869,1.0,1.0,2.0,3.0,3.0
Mortgage,5000.0,56.4988,101.713802,0.0,0.0,0.0,101.0,635.0
Personal_Loan,5000.0,0.096,0.294621,0.0,0.0,0.0,0.0,1.0
Securities_Account,5000.0,0.1044,0.305809,0.0,0.0,0.0,0.0,1.0
CD_Account,5000.0,0.0604,0.23825,0.0,0.0,0.0,0.0,1.0


In [None]:
# Distruibuição da variáveis target
df["Personal_Loan"].value_counts()

Personal_Loan
0    4520
1     480
Name: count, dtype: int64

In [None]:
# Dividindo preditores (X) e variável target (Y)

x = df.drop(columns=["Personal_Loan"])
y = df["Personal_Loan"]

In [None]:
# Dividindo a base em treino e teste

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=7)

print(f"Shape X_train: {x_train.shape}")
print(f"Shape y_train: {y_train.shape}")
print(f"Shape X_test: {x_test.shape}")
print(f"Shape y_test: {y_test.shape}")

Shape X_train: (4000, 11)
Shape y_train: (4000,)
Shape X_test: (1000, 11)
Shape y_test: (1000,)


In [None]:
# Normalização das variáveis

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
scaler.fit(x_train)

x_train_scaled = scaler.transform(x_train)
x_test_scaled = scaler.transform(x_test)

# Transformanda para dataframe para visualização
x_train = pd.DataFrame(x_train_scaled,columns = x_train.columns)
x_test = pd.DataFrame(x_test_scaled,columns = x_test.columns)

In [None]:
# Classificador Multi Layer Perceptron

from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import f1_score

clf = MLPClassifier( hidden_layer_sizes=(100, 50, 20),activation='logistic')
clf.fit(x_train,y_train)



In [None]:
y_pred = clf.predict(x_test)
print(f'Acurácia: {accuracy_score(y_test, y_pred)*100}%')

Acurácia: 98.1%


In [None]:
print(f'F1 Score: {f1_score(y_test, y_pred)*100}%')

F1 Score: 89.83957219251337%
