<h3>Importante!</h3>

Para executar este exemplo é necessário o tensorflow 1.3.0 ou superior. Para instalá-lo use o seguinte comando no prompt de comando/terminal <br>
conda install -c conda-forge tensorflow==1.3.0 

In [18]:
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

In [19]:
import numpy as np
import tensorflow as tf

In [49]:
tf.__version__

'1.3.0'

O tensorflow possui uma classe do tipo Estimator, que nos permite criar um modelo em alto nível com os métodos de treinamento e predição. Desta forma, ao o usarmos temos um nível de abstração semelhante ao do exemplo empregado com o Scikit Lean

Vamos criar nosso Estimator. Para isso o definimos como uma classe "cnn_model_fn"

In [20]:
tf.logging.set_verbosity(tf.logging.INFO)

In [21]:
def cnn_model_fn(features, labels, mode):
    
    #camada de entrada, reshape adiciona uma dimensao para aplicarmos os filtros
    input_layer = tf.reshape(features['x'], [-1, 28, 28, 1])
    
    #primeira convolução
    conv1 = tf.layers.conv2d(
        inputs=input_layer,
        filters=32,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu
    )
    #camada de pooling
    pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2,2], strides=2)    
    conv2 = tf.layers.conv2d(
        inputs=pool1,
        filters=64,
        kernel_size=[5, 5],
        padding="same",
        activation=tf.nn.relu)
    #camada densa
    pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[2, 2], strides=2)
    pool2_flat = tf.reshape(pool2, [-1, 7*7*64])
    dense = tf.layers.dense(inputs=pool2_flat, units=1024, activation=tf.nn.relu)
    dropout = tf.layers.dropout(inputs=dense, rate=0.4, training=mode == tf.estimator.ModeKeys.TRAIN)
    logits = tf.layers.dense(inputs=dropout, units=10)

    predictions = {
        "classes": tf.argmax(input=logits, axis=1),
        "probabilities": tf.nn.softmax(logits, name="softmax_tensor")
    }

    #Executa somente no modo de predição
    if mode == tf.estimator.ModeKeys.PREDICT:
        return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)
    else:
        loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)
        
        #realiza o processo de otimizacao apenas no modo de treino
        #Executa somente no modo de treino
        if mode == tf.estimator.ModeKeys.TRAIN:
            optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.001)
            train_op = optimizer.minimize(
                loss=loss,
                global_step=tf.train.get_global_step())
            return tf.estimator.EstimatorSpec(mode=mode, loss=loss, train_op=train_op)
        else:
            #define metricas de avaliacao
            #Executa somente no modo de validação
            eval_metric_ops = {
                "accuracy": tf.metrics.accuracy(
                    labels=labels, predictions=predictions["classes"])}
            return tf.estimator.EstimatorSpec(mode=mode, loss=loss, eval_metric_ops=eval_metric_ops)

Neste ponto temos toda a estrutura do nosso modelo criada e emcapsulada na classe "cnn_model_fn"

Vamos carregar o dataset

In [None]:
mnist = tf.contrib.learn.datasets.load_dataset("mnist")

Separar os dados de treinamento e validação

In [22]:
train_data = mnist.train.images # Returns np.array
train_labels = np.asarray(mnist.train.labels, dtype=np.int32)
eval_data = mnist.test.images # Returns np.array
eval_labels = np.asarray(mnist.test.labels, dtype=np.int32)

Extracting MNIST-data/train-images-idx3-ubyte.gz
Extracting MNIST-data/train-labels-idx1-ubyte.gz
Extracting MNIST-data/t10k-images-idx3-ubyte.gz
Extracting MNIST-data/t10k-labels-idx1-ubyte.gz


Criamos o objeto do nosso modelo, instanciando a classe Estimator e atribuindo o nome de mnist_classifier. Este será nosso classificador

In [23]:
mnist_classifier = tf.estimator.Estimator(model_fn=cnn_model_fn, model_dir="/tmp/mnist_convnet_model")

INFO:tensorflow:Using default config.
INFO:tensorflow:Using config: {'_model_dir': '/tmp/mnist_convnet_model', '_tf_random_seed': 1, '_save_summary_steps': 100, '_save_checkpoints_secs': 600, '_save_checkpoints_steps': None, '_session_config': None, '_keep_checkpoint_max': 5, '_keep_checkpoint_every_n_hours': 10000, '_log_step_count_steps': 100}


Um estimator recebe como entrada uma input_function, para isso vamos defini-la. O número de épocas de treinamento vamos definir ao chamarmos o treinamento

In [24]:
train_input_fn = tf.estimator.inputs.numpy_input_fn(
    x={"x": train_data},
    y=train_labels,
    batch_size=100,
    num_epochs=None,
    shuffle=True)

INFO:tensorflow:Create CheckpointSaverHook.
INFO:tensorflow:Restoring parameters from /tmp/mnist_convnet_model/model.ckpt-20002
INFO:tensorflow:Saving checkpoints for 20003 into /tmp/mnist_convnet_model/model.ckpt.
INFO:tensorflow:loss = 0.121851, step = 20003
INFO:tensorflow:Saving checkpoints for 20004 into /tmp/mnist_convnet_model/model.ckpt.
INFO:tensorflow:Loss for final step: 0.124598.


<tensorflow.python.estimator.estimator.Estimator at 0x12f775518>

Vamos treinar o modelo com 20000 épocas. Note como como a partir daqui conseguimos um alto nível de abstração. Ou seja, ao adicionarmos este modelo em produção teremos um pacote similar ao fornecido pelo Scikit

In [None]:
mnist_classifier.train(input_fn=train_input_fn, steps=20000)

Agora que temos o modelo treinado, vamos prever alguns valores. Podemos passar apenas 1 exemplo quanto vários. Temos que passar nossa função de input, como não é treinamento não precisamos de mais de uma época

In [37]:
predict_input_fn = tf.estimator.inputs.numpy_input_fn(
    x={"x": eval_data},
    num_epochs=1,
    shuffle=False)

In [38]:
predictions = list(mnist_classifier.predict(input_fn=predict_input_fn))
predicted_classes = [p["classes"] for p in predictions]

INFO:tensorflow:Restoring parameters from /tmp/mnist_convnet_model/model.ckpt-20004


In [39]:
print(predicted_classes)

[7, 2, 1, 0, 4, 1, 4, 9, 5, 9, 0, 6, 9, 0, 1, 5, 9, 7, 3, 4, 9, 6, 6, 5, 4, 0, 7, 4, 0, 1, 3, 1, 3, 6, 7, 2, 7, 1, 2, 1, 1, 7, 4, 2, 3, 5, 1, 2, 4, 4, 6, 3, 5, 5, 6, 0, 4, 1, 9, 5, 7, 8, 9, 3, 7, 4, 6, 4, 3, 0, 7, 0, 2, 9, 1, 7, 3, 2, 9, 7, 7, 6, 2, 7, 8, 4, 7, 3, 6, 1, 3, 6, 9, 3, 1, 4, 1, 7, 6, 9, 6, 0, 5, 4, 9, 9, 2, 1, 9, 4, 8, 7, 3, 9, 7, 4, 4, 4, 9, 2, 5, 4, 7, 6, 7, 9, 0, 5, 8, 5, 6, 6, 5, 7, 8, 1, 0, 1, 6, 4, 6, 7, 3, 1, 7, 1, 8, 2, 0, 2, 9, 9, 5, 5, 1, 5, 6, 0, 3, 4, 4, 6, 5, 4, 6, 5, 4, 5, 1, 4, 4, 7, 2, 3, 2, 7, 1, 8, 1, 8, 1, 8, 5, 0, 8, 9, 2, 5, 0, 1, 1, 1, 0, 9, 0, 3, 1, 6, 4, 2, 3, 6, 1, 1, 1, 3, 9, 5, 2, 9, 4, 5, 9, 3, 9, 0, 3, 5, 5, 5, 7, 2, 2, 7, 1, 2, 8, 4, 1, 7, 3, 3, 8, 7, 7, 9, 2, 2, 4, 1, 5, 9, 8, 7, 2, 3, 0, 2, 4, 2, 4, 1, 9, 5, 7, 7, 2, 8, 2, 0, 8, 5, 7, 7, 9, 1, 8, 1, 8, 0, 3, 0, 1, 9, 9, 4, 1, 8, 2, 1, 2, 9, 7, 5, 9, 2, 6, 4, 1, 5, 4, 2, 9, 2, 0, 4, 0, 0, 2, 8, 4, 7, 1, 2, 4, 0, 2, 7, 4, 3, 3, 0, 0, 3, 1, 9, 6, 5, 2, 5, 7, 7, 9, 3, 0, 4, 2, 0, 7, 1, 1, 2, 1, 

Para prevermos apenas um exemplo temos que adicioner uma dimensão no nosso exemplo, pois o estimator espera um vetor de exemplos para ser treinadao (n exemplos de formato 28x28), o reshape -1 adiciona essa dimensao que precisamos e teremos um vetor com 1 exemplo de 28x28

In [45]:
predict_input_fn = tf.estimator.inputs.numpy_input_fn(
    x={"x": eval_data[0].reshape([-1, 28, 28])},
    num_epochs=1,
    shuffle=False)

In [46]:
predictions = list(mnist_classifier.predict(input_fn=predict_input_fn))
predicted_classes = [p["classes"] for p in predictions]

INFO:tensorflow:Restoring parameters from /tmp/mnist_convnet_model/model.ckpt-20004


In [47]:
predicted_classes

[7]