# Redes Neurais Artificiais

### Descriçao

---
1. O objetivo deste notebook é a construir sua primeira rede neural.
2. Utilizaremos o conjunto de dados proposto no [gist](https://gist.githubusercontent.com/batestin1/e09def5cbd3732e345029f5c88155182/raw/a14ff6964c3fbeeca3b7f17ec32102f0ade14828/gistfile1.txt)

3. O problema consiste em prever e classificar a perda de clientes que a empresa esta sofrendo. Investigar os motivos para isso.
---

### Dicionário


Fields	                                                  | Type  	  |    Description                              |
----------------------------------------------------------|:---------:|:-------------------------------------------:|
RowNumber 	  										  	  |int     | número da linha |
CustomerId														  |int    | número do id                         |
Surname		     										  |string     | sobrenome da pessoa 	               |
CreditScore | int | avaliação de crédito (igual serasa)
Geography | string | Região em que existe
Gender | string | Genero
Age | int | idade do cliente
 Tenure  | int | Quantidade de Posses (bens) que ele(a) possuí
  Balance  | float64 | Balanço da conta
    NumOfProducts  | int | Número de produtos comprados
      HasCrCard  | int | Se ele possui ou não cartão de crédito (0 para sim, 1 para não)
        IsActiveMember  | int | É um cliente ativo (0 para sim, 1 para não)
                EstimatedSalary  | float | Salário base (anualmente)
                Exited  | int | Se o cliente saiu ou não da empresa (0 para sim, 1 para não)

  

# Instalação dos pacotes

In [None]:
!pip install pandas numpy scikit-learn keras

### Documentação

1. ** Pandas ** -> [Link](https://pandas.pydata.org/docs/)
2. ** Numpy ** -> [Link](https://numpy.org/doc/)
4. ** Scikit Learn ** -> [Link](https://scikit-learn.org/stable/)
5. ** Keras ** -> [Link](https://keras.io/api/)
6. ** Tensor Flow ** -> [Tensor Flow](https://www.tensorflow.org/api_docs/python/tf/keras)
7. ** JobLib ** -> [JobLib](https://joblib.readthedocs.io/en/stable/)


# Importando as Bibliotecas

In [None]:
import os #para manipular pastas e diretórios
import pandas as pd #para manipulacao de dados
import numpy as np # para criação de matrizes

from sklearn.preprocessing import LabelEncoder, OneHotEncoder, StandardScaler # para pre processamento de ml
from sklearn.compose import make_column_transformer #para efetivar a mudanca de oneHotEncoder
from sklearn.model_selection import train_test_split #para separar treino e teste
from sklearn.metrics import confusion_matrix #para avaliar nosso modelo

import tensorflow as tf # para construir um perceptron (não que vamos usar, mas apenas para entender)
from keras.models import Sequential # O sequential é para inicializar a rede neural
from keras.layers import Dense # DENSE cria as camadas da redes neural (camadas densas sao aquelas que camadas interconectadas)

from keras.models import load_model #para carregar modelos



# Obtendo o dataset

In [None]:
df = pd.read_csv('https://gist.githubusercontent.com/batestin1/e09def5cbd3732e345029f5c88155182/raw/a14ff6964c3fbeeca3b7f17ec32102f0ade14828/gistfile1.txt')

df.head()

### Conhecendo o dataset

In [None]:
df.info()

##### Pre Processamento dos dados

In [None]:
#separando os dados em X e y


X = df.iloc[:, 3:13].values # pega da terceira coluna (a partir da 0) até a 13 (na verdade, ele vai pegar a 12)
y = df.iloc[:, 13].values #pega somente a 13


In [None]:
X

In [None]:
y

In [None]:
X[:, 2]

In [None]:
# Transformação de Dados Categóricos
labelencoder_X_1 = LabelEncoder()
X[:, 1] = labelencoder_X_1.fit_transform(X[:, 1]) #transforma a coluna paises!

labelencoder_X_2 = LabelEncoder()
X[:, 2] = labelencoder_X_2.fit_transform(X[:, 2]) #transforma o genero

ohe= make_column_transformer((OneHotEncoder(categories='auto', sparse = False), [1]), remainder="passthrough") #realizo o processo de One Hot Encode para gerar colunas 0 e 1 dos paises e dos generos

X=ohe.fit_transform(X)

X = X[:,1:]

#### Dividir dados em treino e teste

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)

#### padronizando os dados

In [None]:

sc = StandardScaler() #metodo que vai padronizar a escala dos dados, entre 0 e 1
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

#### Perceptron (opcional)

In [None]:
#criando uma copia dos dados de treino e teste
X_train_p = X_train
X_Test_p = X_test
y_train_p = y_train
y_test_p = y_test

#nosso perceptron
model = tf.keras.Sequential([
    tf.keras.layers.Dense(1, activation='sigmoid', input_shape=([11]))
])

# Compilando o modelo
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Treinando o modelo
model.fit(X_train_p, y_train_p, epochs=10, verbose=1)

# Avaliando o modelo
loss, accuracy = model.evaluate(X_Test_p, y_test_p)
print(f'Acurácia do modelo: {round(accuracy, 2) * 100}%')

# Criando nossa RNA

In [None]:
classifier = Sequential()
#adicionando Camadas
classifier.add(Dense(units = 6, kernel_initializer = 'uniform', activation = 'relu', input_dim = X_train.shape[1])) #units é qut de neuronios que ela vai ter. kernel_initializer é qual metodo ele vai inicializar a rede.
classifier.add(Dense(units = 6, kernel_initializer = 'uniform', activation = 'relu')) #A funcão de ativação é  especialmente em camadas intermediárias. Essa função retorna 0 se a entrada for menor ou igual a 0 e retorna a entrada diretamente se ela for maior que 0.
classifier.add(Dense(units = 1, kernel_initializer = 'uniform', activation = 'sigmoid')) # a função de ativação é suave. Ela transforma a saída linear de um neurônio em um valor entre 0 e 1, interpretável como a probabilidade de pertencer à classe positiva
#Compilando
#o compile é a função que vai realizar o processo de inteligencia da nossa rede neural
classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy']) #'adam' é um otimizador que realiza a funcao gradient descent (metodo que encontra melhores pesos dentro da rede) para encontrar. Loss é a função de perda que vai calculando a perda entre sinapses e ajustando de acordo com o backpropagation
#Treinando
classifier.fit(X_train, y_train, batch_size = 10, epochs = 100) #metodo que treina, passamos aqui o tamanho de batchs a serem processados de acordo com os epochs.

#### Prevendo dados de teste

In [None]:
y_pred = classifier.predict(X_test) #realizando a previsão (ela vem em termos percentuais)
y_pred = (y_pred > 0.5)


# visualizando em porcentagem
z_pred = np.array([f"{value[0] * 100:.2f}%" for value in y_pred])
print(z_pred)

#### Avaliando o modelo

In [None]:
cm = confusion_matrix(y_test, y_pred)
cm

In [None]:
cm = pd.DataFrame(cm)
cm

In [None]:
# calculando o que significa elas (usando formula simples)

tamanho_do_teste = y_test.shape[0]
verdadeiros_positivos = cm.values[0][0]
falsos_positivos = cm.values[1][1]

acuracia = (verdadeiros_positivos + falsos_positivos) / tamanho_do_teste

print(f"Acuracia da RNA foi de {round(acuracia, 2) * 100}%")

# Salvando o modelo

In [None]:
folder = 'rna/'

# Verifica se o diretório existe e, se não existir, cria o diretório
if not os.path.exists(folder):
    os.makedirs(folder)

# Salva o modelo no diretório especificado
classifier.save(os.path.join(folder, 'rede_neural_one.h5'))

# Importando o modelo para uso

In [None]:
model = load_model(os.path.join(folder, 'rede_neural_one.h5'))
y_pred = model.predict(X_test)
y_pred = (y_pred > 0.7)

In [None]:
y_pred
cm = confusion_matrix(y_test, y_pred)
cm