In [1]:
# Importando as bibliotecas

import numpy as np
import tensorflow as tf
import pandas as pd

In [2]:
# Importando o dataset

dataset = pd.read_csv('Churn_Modelling.csv')
X = dataset.iloc[:,3:-1].values# AS 3 primeiras colunas são irrelevantes
y = dataset.iloc[:,-1]

dataset.head()

Unnamed: 0,RowNumber,CustomerId,Surname,CreditScore,Geography,Gender,Age,Tenure,Balance,NumOfProducts,HasCrCard,IsActiveMember,EstimatedSalary,Exited
0,1,15634602,Hargrave,619,France,Female,42,2,0.0,1,1,1,101348.88,1
1,2,15647311,Hill,608,Spain,Female,41,1,83807.86,1,0,1,112542.58,0
2,3,15619304,Onio,502,France,Female,42,8,159660.8,3,1,0,113931.57,1
3,4,15701354,Boni,699,France,Female,39,1,0.0,2,0,0,93826.63,0
4,5,15737888,Mitchell,850,Spain,Female,43,2,125510.82,1,1,1,79084.1,0


In [3]:
# Processamento de dados da columa "Gender"

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()

X[:, 2] = le.fit_transform(X[:, 2])
# o nº 2 serve para falar qual coluna iremos modificar

'''
Importante: LabelEncoder adiciona um grau de ordem entre as features, porém como
são 2 categorias, poderia ser usado LabelEncoder ou OneHotEncoder. 
Aqui, LabelEncoder é melhor, pois OneHotEncoder adicionaria uma outra coluna.
Com LabelEncoder usamos apenas uma coluna e diferenciamos male de female com 
apenas 1 e 0
'''

'\nImportante: LabelEncoder adiciona um grau de ordem entre as features, porém como\nsão 2 categorias, poderia ser usado LabelEncoder ou OneHotEncoder. \nAqui, LabelEncoder é melhor, pois OneHotEncoder adicionaria uma outra coluna.\nCom LabelEncoder usamos apenas uma coluna e diferenciamos male de female com \napenas 1 e 0\n'

In [4]:
# Processamento de dados da coluna "Geography"

from sklearn.compose import ColumnTransformer
from sklearn.preprocessing import OneHotEncoder

ct = ColumnTransformer(transformers = [('encoder', OneHotEncoder(), [1])], remainder = 'passthrough')
# o nº 1 está indicando qual coluna sera modificada para introduzir as dummy variables

X = np.array(ct.fit_transform(X))

'''
Aqui se faz necessário utilizar o OneHotEncoder pois há 3 categorias de países:
França, Espanha e Alemanha. 
Caso usemos LabelEncoder teríamos 1 única coluna com valores de 1 a 3
isso faz com que a rede neural entenda que há uma ordem de grandeza entre as 
features, o que não é verdade.
Por isso, OneHotEncoder é melhor aplicado, criando assim 3 colunas de valores binários.
'''

#Vale lembrar que OneHotEncoder coloca as dummys variables no início da matriz

print(X)

[[1.0 0.0 0.0 ... 1 1 101348.88]
 [0.0 0.0 1.0 ... 0 1 112542.58]
 [1.0 0.0 0.0 ... 1 0 113931.57]
 ...
 [1.0 0.0 0.0 ... 0 1 42085.58]
 [0.0 1.0 0.0 ... 1 0 92888.52]
 [1.0 0.0 0.0 ... 1 0 38190.78]]


In [5]:
# Dividindo os dados entre treino e teste

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 1)

In [6]:
# Efetuando o feature scaling

# Código para efetuar a normalização dos dados antes de treinar a rede neural:
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

In [7]:
# Cosntruindo a Rede Neural

# Iniciando a rede neural
ann = tf.keras.models.Sequential()

# Adicionando a camada de entrada e a primeira camada escondida

ann.add(tf.keras.layers.Dense(units = 10, activation = 'relu'))

# Adicionando a segunda camada de neurônios escondida

ann.add(tf.keras.layers.Dense(units = 10, activation = 'relu'))

# Adicionando a camada de saída

ann.add(tf.keras.layers.Dense(units = 1, activation = 'sigmoid'))

# Compilando a rede neural

ann.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

'''
binary_crossentropy é usada quando se tem apenas 2 categorias
para 3 ou mais categorias usa-se category_crossentropy
'''

'\nbinary_crossentropy é usada quando se tem apenas 2 categorias\npara 3 ou mais categorias usa-se category_crossentropy\n'

In [8]:
# Treinando a rede neural

ann.fit(X_train, y_train, batch_size = 32, epochs = 250)

Epoch 1/250
Epoch 2/250
Epoch 3/250
Epoch 4/250
Epoch 5/250
Epoch 6/250
Epoch 7/250
Epoch 8/250
Epoch 9/250
Epoch 10/250
Epoch 11/250
Epoch 12/250
Epoch 13/250
Epoch 14/250
Epoch 15/250
Epoch 16/250
Epoch 17/250
Epoch 18/250
Epoch 19/250
Epoch 20/250
Epoch 21/250
Epoch 22/250
Epoch 23/250
Epoch 24/250
Epoch 25/250
Epoch 26/250
Epoch 27/250
Epoch 28/250
Epoch 29/250
Epoch 30/250
Epoch 31/250
Epoch 32/250
Epoch 33/250
Epoch 34/250
Epoch 35/250
Epoch 36/250
Epoch 37/250
Epoch 38/250
Epoch 39/250
Epoch 40/250
Epoch 41/250
Epoch 42/250
Epoch 43/250
Epoch 44/250
Epoch 45/250
Epoch 46/250
Epoch 47/250
Epoch 48/250
Epoch 49/250
Epoch 50/250
Epoch 51/250
Epoch 52/250
Epoch 53/250
Epoch 54/250
Epoch 55/250
Epoch 56/250
Epoch 57/250
Epoch 58/250
Epoch 59/250
Epoch 60/250
Epoch 61/250
Epoch 62/250
Epoch 63/250
Epoch 64/250
Epoch 65/250
Epoch 66/250
Epoch 67/250
Epoch 68/250
Epoch 69/250
Epoch 70/250
Epoch 71/250
Epoch 72/250
Epoch 73/250
Epoch 74/250
Epoch 75/250
Epoch 76/250
Epoch 77/250
Epoch 78

Epoch 82/250
Epoch 83/250
Epoch 84/250
Epoch 85/250
Epoch 86/250
Epoch 87/250
Epoch 88/250
Epoch 89/250
Epoch 90/250
Epoch 91/250
Epoch 92/250
Epoch 93/250
Epoch 94/250
Epoch 95/250
Epoch 96/250
Epoch 97/250
Epoch 98/250
Epoch 99/250
Epoch 100/250
Epoch 101/250
Epoch 102/250
Epoch 103/250
Epoch 104/250
Epoch 105/250
Epoch 106/250
Epoch 107/250
Epoch 108/250
Epoch 109/250
Epoch 110/250
Epoch 111/250
Epoch 112/250
Epoch 113/250
Epoch 114/250
Epoch 115/250
Epoch 116/250
Epoch 117/250
Epoch 118/250
Epoch 119/250
Epoch 120/250
Epoch 121/250
Epoch 122/250
Epoch 123/250
Epoch 124/250
Epoch 125/250
Epoch 126/250
Epoch 127/250
Epoch 128/250
Epoch 129/250
Epoch 130/250
Epoch 131/250
Epoch 132/250
Epoch 133/250
Epoch 134/250
Epoch 135/250
Epoch 136/250
Epoch 137/250
Epoch 138/250
Epoch 139/250
Epoch 140/250
Epoch 141/250
Epoch 142/250
Epoch 143/250
Epoch 144/250
Epoch 145/250
Epoch 146/250
Epoch 147/250
Epoch 148/250
Epoch 149/250
Epoch 150/250
Epoch 151/250
Epoch 152/250
Epoch 153/250
Epoch 154/

Epoch 161/250
Epoch 162/250
Epoch 163/250
Epoch 164/250
Epoch 165/250
Epoch 166/250
Epoch 167/250
Epoch 168/250
Epoch 169/250
Epoch 170/250
Epoch 171/250
Epoch 172/250
Epoch 173/250
Epoch 174/250
Epoch 175/250
Epoch 176/250
Epoch 177/250
Epoch 178/250
Epoch 179/250
Epoch 180/250
Epoch 181/250
Epoch 182/250
Epoch 183/250
Epoch 184/250
Epoch 185/250
Epoch 186/250
Epoch 187/250
Epoch 188/250
Epoch 189/250
Epoch 190/250
Epoch 191/250
Epoch 192/250
Epoch 193/250
Epoch 194/250
Epoch 195/250
Epoch 196/250
Epoch 197/250
Epoch 198/250
Epoch 199/250
Epoch 200/250
Epoch 201/250
Epoch 202/250
Epoch 203/250
Epoch 204/250
Epoch 205/250
Epoch 206/250
Epoch 207/250
Epoch 208/250
Epoch 209/250
Epoch 210/250
Epoch 211/250
Epoch 212/250
Epoch 213/250
Epoch 214/250
Epoch 215/250
Epoch 216/250
Epoch 217/250
Epoch 218/250
Epoch 219/250
Epoch 220/250
Epoch 221/250
Epoch 222/250
Epoch 223/250
Epoch 224/250
Epoch 225/250
Epoch 226/250
Epoch 227/250
Epoch 228/250
Epoch 229/250
Epoch 230/250
Epoch 231/250
Epoch 

Epoch 239/250
Epoch 240/250
Epoch 241/250
Epoch 242/250
Epoch 243/250
Epoch 244/250
Epoch 245/250
Epoch 246/250
Epoch 247/250
Epoch 248/250
Epoch 249/250
Epoch 250/250


<tensorflow.python.keras.callbacks.History at 0x204d388b550>

In [9]:
# Prevendo os resultados de teste

y_pred = ann.predict(X_test)
y_pred = (y_pred > 0.5)

In [10]:
# Criando a matriz de confusão

from sklearn.metrics import confusion_matrix,accuracy_score
cm = confusion_matrix(y_test, y_pred)
print(cm)
accuracy_score(y_test, y_pred)

[[1518   67]
 [ 210  205]]


0.8615