# Importando dependências

In [1]:
# Carrega data set
from sklearn import datasets

# Carrega funções para pré-processamento
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import OneHotEncoder

# Carrega função para auxiliar no treinamento
from sklearn.model_selection import train_test_split

# Carrega função para calcular presição da rede
from sklearn.metrics import accuracy_score

# Carrega TensorFlow e Numpy
import tensorflow as tf
import numpy as np

# Criar Enconder de saidas desejadas
onehot = OneHotEncoder(categorical_features = [0])

### Preparando dados para o treinamento

In [2]:
iris = datasets.load_iris()

# Carrega dados de entrada para rede
X = iris.data

# Normaliza valores
scaler_x = StandardScaler()
X = scaler_x.fit_transform(X)

# Carrega resulta esperado
y = iris.target

# Reestrutura valores para de (150,) para (150,1)
y = y.reshape(-1, 1)

# Cria lista de saídas desejadas
y = onehot.fit_transform(y).toarray()

# Divide Data set para treinamento de testes de validação
X_treinamento, X_teste, y_treinamento, y_teste = train_test_split(X, y, test_size = 0.3)

In case you used a LabelEncoder before this OneHotEncoder to convert the categories to integers, then you can now use the OneHotEncoder directly.


### Definindo Topologia da Rede

![alt text](img/topologia.png)

In [3]:
# Define quantidade de neurônios na camada de entrada (4)
neuronios_entrada = X.shape[1]

# Define quantidade de neurônios na camada oculta (4)
neuronios_oculta = int(np.ceil((X.shape[1] + y.shape[1]) / 2))

# Define quantidade de neurônios na cada de saida (3)
neuronios_saida = y.shape[1]

### Definindo pesos
Como valor de inicialização para os pesos foi utilizado distribuição normal.

In [4]:
W = {'oculta': tf.Variable(tf.random_normal([neuronios_entrada, neuronios_oculta])),
     'saida': tf.Variable(tf.random_normal([neuronios_oculta, neuronios_saida]))}

Instructions for updating:
Colocations handled automatically by placer.


### Definindo Bias
Valores inciados igualmente os pessos, utilizando a função de distribuição normal.

In [5]:
b = {'oculta': tf.Variable(tf.random_normal([neuronios_oculta])),
     'saida': tf.Variable(tf.random_normal([neuronios_saida]))}

### Criando placeholder
Para inicialização dos placeholder é necessário passar o tipo e "shape" dos dados.

In [6]:
xph = tf.placeholder('float', [None, neuronios_entrada])
yph = tf.placeholder('float', [None, neuronios_saida])

### Criando Modelo

In [7]:
def multilayer_perceptron(x, W, bias):
    camada_oculta = tf.add(tf.matmul(x, W['oculta']), bias['oculta'])
    camada_oculta_ativacao = tf.nn.relu(camada_oculta)
    camada_saida = tf.add(tf.matmul(camada_oculta_ativacao, W['saida']), b['saida'])
    return camada_saida

In [8]:
modelo = multilayer_perceptron(xph, W, b)

### Calculando erro e ajustando pesos

In [9]:
erro = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits = modelo, labels = yph))
otimizador = tf.train.AdamOptimizer(learning_rate = 0.0001).minimize(erro)

### Criando Pacotes de treinamento

In [10]:
batch_size = 8
batch_total = int(len(X_treinamento) / batch_size)
X_batches = np.array_split(X_treinamento, batch_total)

### Efetuando treinamento

In [11]:
with tf.Session() as sess:
    # Inicializa valores das variaveis
    sess.run(tf.global_variables_initializer())
    for epoca in range(3000):
        erro_medio = 0.0
        
        # Cria pacotes de treinamento
        batch_total = int(len(X_treinamento) / batch_size)
        X_batches = np.array_split(X_treinamento, batch_total)
        y_batches = np.array_split(y_treinamento, batch_total)
        
        # Para cada pacote de treinamento
        for i in range(batch_total):
            
            # Pega dados do pacote atual
            X_batch, y_batch = X_batches[i], y_batches[i]
            
            # Joga dados para rede aprender
            _, custo = sess.run([otimizador, erro], feed_dict = {xph: X_batch, yph: y_batch})
            
            # Computa erro médio
            erro_medio += custo / batch_total
            
        # Para cada 100 epocas exibe progresso de aprendizado
        if epoca % 100 == 0:
            print('Época: ' + str((epoca)) + ' erro: ' + str(erro_medio))
            
    # Coleta valores dos pesos e bias da rede
    W_final, b_final = sess.run([W, b])

Época: 0 erro: 2.3251169644869294
Época: 100 erro: 1.2902218103408813
Época: 200 erro: 0.8350172982766079
Época: 300 erro: 0.6420658207856691
Época: 400 erro: 0.5285458175035624
Época: 500 erro: 0.44584519358781666
Época: 600 erro: 0.37868732328598315
Época: 700 erro: 0.3237523539708211
Época: 800 erro: 0.2790547712491109
Época: 900 erro: 0.24176890804217413
Época: 1000 erro: 0.2106014919968752
Época: 1100 erro: 0.1846508320707541
Época: 1200 erro: 0.15823534016425794
Época: 1300 erro: 0.13790731246654808
Época: 1400 erro: 0.12197066556948884
Época: 1500 erro: 0.10934968321369241
Época: 1600 erro: 0.09940474279797994
Época: 1700 erro: 0.09143831580877305
Época: 1800 erro: 0.08492738839525442
Época: 1900 erro: 0.07952436331946117
Época: 2000 erro: 0.07498925064618772
Época: 2100 erro: 0.07114486940778218
Época: 2200 erro: 0.06785663303274374
Época: 2300 erro: 0.06502926535904408
Época: 2400 erro: 0.06257026656888999
Época: 2500 erro: 0.060428374232007906
Época: 2600 erro: 0.058546343961

### Realizando previsões
Devemos utilizar a mesma arquitetura e topologia para realizar as previsões, só que desta vez passando os valores do pesos e bias, ajustados pelo treinamento.

In [12]:
previsoes_teste = multilayer_perceptron(xph, W_final, b_final)

Agora vamos executar somente o processo de feedforward.

In [13]:
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    camada_oculta = sess.run(previsoes_teste, feed_dict = {xph: X_teste})
    camada_saida = sess.run(tf.nn.softmax(camada_oculta))
    resultado_indices = sess.run(tf.argmax(camada_saida, 1))
resultado_indices

array([1, 2, 2, 1, 0, 2, 1, 0, 2, 0, 2, 0, 2, 1, 2, 0, 0, 2, 2, 0, 0, 0,
       2, 1, 0, 0, 2, 0, 2, 0, 0, 2, 2, 0, 1, 2, 1, 2, 0, 1, 0, 2, 2, 0,
       2], dtype=int64)

In [14]:
y_teste2 = np.argmax(y_teste, 1)
y_teste2

array([1, 2, 2, 1, 0, 2, 1, 0, 2, 0, 2, 0, 2, 1, 1, 0, 0, 1, 2, 0, 0, 0,
       2, 1, 0, 0, 2, 0, 2, 0, 0, 1, 2, 0, 1, 2, 1, 1, 0, 1, 0, 2, 2, 0,
       0], dtype=int64)

In [15]:
taxa_acerto = accuracy_score(y_teste2, resultado_indices)
taxa_acerto

0.8888888888888888