In [1]:
import tensorflow as tf
import numpy as np


In [2]:
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

In [3]:
tf.logging.set_verbosity(tf.logging.INFO)


In [4]:
def cnn_model_fn(features, labels, mode):
  """Model function for CNN."""
  # Input Layer
    # [batch_size, image_width, image_height, channels]
    # because the images are black, we only have one channel
    # -1 for batch_size means that the dimension should be calculated dynamically based on the number of input values in features["x"]
  input_layer = tf.reshape(features["x"], [-1, 28, 28, 1])

  # Convolutional Layer #1
    # the activation map / tensor produced by this convolutional layer is [batch_size,28,28,32]
  conv1 = tf.layers.conv2d(
      inputs=input_layer, # input tensor with the shape [batch_size, image_width, image_height, channels]
      filters=32, # number of filters to apply
      kernel_size=[5, 5], # dimensions of the filter
      padding="same", # keeps the activation map the same widht and height as the input, adding 0 values as padding, without padding it will be 24x24
      activation=tf.nn.relu)

  # Pooling Layer #1
    # the input will be conv1 with a shape of [batch_size,28,28,32] 
    # the pooling filter is 2x2 and the stride is 2 so that the regions do not overlap
    # the output of the pooling layer will be [batch_size, 14, 14, 32]
  pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2, 2], strides=2)

  # Convolutional Layer #2 
    # a second convolutional layer with double the nr of filters
    # the input has a shape of [batch_size, 14, 14, 32]
    # and the output has a shape of [batch_size, 14, 14, 64]
  conv2 = tf.layers.conv2d(
      inputs=pool1,
      filters=64,
      kernel_size=[5, 5],
      padding="same",
      activation=tf.nn.relu)

  # Pooling Layer #2
    # the output of pool2 is [batch_size, 7, 7, 64]
  pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[2, 2], strides=2)

  # Dense Layer / fully connected
    # here we flatten our feature map to [batch_size, features] so that we have only 2 dimentsions
    # the output tensor will have a shape of [batch_size, 3136] . 3136 from  7 * 7 * 64 
  pool2_flat = tf.reshape(pool2, [-1, 7 * 7 * 64]) 
    
    # the input specifies our input tensor 
    # the units are the number of our neurons the dense layer
  dense = tf.layers.dense(inputs=pool2_flat, units=1024, activation=tf.nn.relu)
    
    # dropout regularization -> good to prevent overfitting 
    # 0.4 rate means that 40% of the elements will be randomly dropped out during training
    # the network will become smaller and it will be easier to train
    # the output here will have a shape of [batch_size, 1024]
  dropout = tf.layers.dropout(
      inputs=dense, rate=0.4, training=mode == tf.estimator.ModeKeys.TRAIN)

  # Logits Layer
    # it outputs the values that are going to be the input of the softmax function
    # this is the final layer that will return the raw values for our predictions
    # it has 10 neurons, one for each target class
    # it uses linear activation which is the default
    # the output has a shape [batch_size, 10]
  logits = tf.layers.dense(inputs=dropout, units=10)

  # we put our predictions in a dictionary
  predictions = {
      # Generate predictions (for PREDICT and EVAL (evaluation) mode)
      # for example, is it a 1, a 3 etc. from 0 to 9
      # we use argmax to extract the highest raw value from the logits tensor
      "classes": tf.argmax(input=logits, axis=1),
      # Add `softmax_tensor` to the graph. It is used for PREDICT and by the
      # `logging_hook`.
      # the probabilities that it is a 1,3, 5 etc.
      "probabilities": tf.nn.softmax(logits, name="softmax_tensor")
  }
  
  # and return an EstimatorSpec object from our dict
  if mode == tf.estimator.ModeKeys.PREDICT:
    return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)

  # Calculate Loss (for both TRAIN and EVAL mode
  # see how closely the model's predictions match the target classes
  loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)

  # Configure the Training Op (for TRAIN mode)
  # optimize the loss during training with stochastic descent
  if mode == tf.estimator.ModeKeys.TRAIN:
    optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.001)
    train_op = optimizer.minimize(
        loss=loss,
        global_step=tf.train.get_global_step())
    return tf.estimator.EstimatorSpec(mode=mode, loss=loss, train_op=train_op)

  # Add evaluation metrics (for EVAL mode), like accuracy
  eval_metric_ops = {
      "accuracy": tf.metrics.accuracy(
          labels=labels, predictions=predictions["classes"])}
  return tf.estimator.EstimatorSpec(
      mode=mode, loss=loss, eval_metric_ops=eval_metric_ops)

In [9]:
# train and test data
def main(unused_argv):
    # Load training and eval data
    mnist = tf.contrib.learn.datasets.load_dataset("mnist")
    train_data = mnist.train.images # Returns np.array
    train_labels = np.asarray(mnist.train.labels, dtype=np.int32)
    eval_data = mnist.test.images # Returns np.array
    eval_labels = np.asarray(mnist.test.labels, dtype=np.int32)
    
    # Create the Estimator, which is the main thing that trains and evaluates
    # we chose the model cnn_model_fn that we created above
    mnist_classifier = tf.estimator.Estimator(
        model_fn=cnn_model_fn, model_dir="/tmp/mnist_convnet_model")

    # Set up logging for predictions
    tensors_to_log = {"probabilities": "softmax_tensor"}
    logging_hook = tf.train.LoggingTensorHook(
      tensors=tensors_to_log, every_n_iter=50)

    # Train the model
    train_input_fn = tf.estimator.inputs.numpy_input_fn(
        x={"x": train_data},
        y=train_labels,
        batch_size=100,
        num_epochs=None,
        shuffle=True)
    mnist_classifier.train(
        input_fn=train_input_fn,
        steps=600,
        hooks=[logging_hook])

    # Evaluate the model and print results
    eval_input_fn = tf.estimator.inputs.numpy_input_fn(
        x={"x": eval_data},
        y=eval_labels,
        num_epochs=1,
        shuffle=False)
    eval_results = mnist_classifier.evaluate(input_fn=eval_input_fn)
    print(eval_results)



In [10]:
unused_argv = {} # no arguments for now
main(unused_argv)

Extracting MNIST-data/train-images-idx3-ubyte.gz


Extracting MNIST-data/train-labels-idx1-ubyte.gz
Extracting MNIST-data/t10k-images-idx3-ubyte.gz
Extracting MNIST-data/t10k-labels-idx1-ubyte.gz


INFO:tensorflow:Using default config.


INFO:tensorflow:Using config: {'_model_dir': './logs/model', '_tf_random_seed': None, '_save_summary_steps': 100, '_save_checkpoints_steps': None, '_save_checkpoints_secs': 600, '_session_config': None, '_keep_checkpoint_max': 5, '_keep_checkpoint_every_n_hours': 10000, '_log_step_count_steps': 100, '_service': None, '_cluster_spec': <tensorflow.python.training.server_lib.ClusterSpec object at 0x110b5d7b8>, '_task_type': 'worker', '_task_id': 0, '_master': '', '_is_chief': True, '_num_ps_replicas': 0, '_num_worker_replicas': 1}


INFO:tensorflow:Create CheckpointSaverHook.


INFO:tensorflow:Saving checkpoints for 1 into ./logs/model/model.ckpt.


INFO:tensorflow:probabilities = [[ 0.09386866  0.10020785  0.10799722  0.10164531  0.10421458  0.09976099
   0.09986246  0.09673665  0.09697974  0.09872651]
 [ 0.08791501  0.09718952  0.10614897  0.10266588  0.09589843  0.10213365
   0.10192207  0.10461821  0.10327264  0.09823553]
 [ 0.09817167  0.08821969  0.1191124   0.10954744  0.0826124   0.10494737
   0.08767379  0.09813005  0.10415315  0.10743207]
 [ 0.09515859  0.10044593  0.09933776  0.09980513  0.10531331  0.10750398
   0.10535887  0.10066018  0.09669182  0.08972444]
 [ 0.09257834  0.09154241  0.10801873  0.11357621  0.08836579  0.10609218
   0.10311369  0.10061488  0.10039892  0.09569895]
 [ 0.09391358  0.0936808   0.10552988  0.10384461  0.09808095  0.11442602
   0.09998614  0.09549248  0.09701466  0.09803088]
 [ 0.09269571  0.09385654  0.11121346  0.10038802  0.09628692  0.10427695
   0.10740999  0.0992427   0.0963233   0.0983064 ]
 [ 0.0968628   0.09216785  0.10750818  0.11502329  0.08857295  0.11256681
   0.10684699  0.09

INFO:tensorflow:loss = 2.29733, step = 1


INFO:tensorflow:probabilities = [[ 0.09595516  0.09470559  0.10999798  0.10554983  0.09224129  0.10897294
   0.10371313  0.09617057  0.09245185  0.10024168]
 [ 0.10470031  0.1002721   0.10507689  0.11112913  0.08624145  0.10930876
   0.09811343  0.1007333   0.09486055  0.08956409]
 [ 0.0983583   0.09637757  0.1107982   0.11233587  0.09286921  0.10890453
   0.09495897  0.10063981  0.09367035  0.09108727]
 [ 0.09870634  0.0952324   0.10737729  0.11654337  0.08756107  0.10825756
   0.10113663  0.08479799  0.10177731  0.09861002]
 [ 0.08614603  0.1044739   0.10582796  0.10891817  0.10394135  0.10413671
   0.10249645  0.09698463  0.08554263  0.10153221]
 [ 0.09506682  0.10113981  0.10710322  0.10838562  0.10177023  0.11034547
   0.11059911  0.08811337  0.08747299  0.09000339]
 [ 0.09564083  0.09831967  0.10880584  0.10877201  0.09371231  0.09737015
   0.10611743  0.10054044  0.09759896  0.09312236]
 [ 0.09639165  0.09701515  0.10700887  0.10474616  0.09852679  0.11270037
   0.0945542   0.10

INFO:tensorflow:global_step/sec: 6.09727


INFO:tensorflow:probabilities = [[ 0.10055084  0.09582195  0.09994747  0.10539358  0.09607639  0.1100228
   0.10433058  0.10002245  0.08220467  0.10562928]
 [ 0.09303491  0.09403045  0.1066917   0.11039885  0.09455686  0.11606705
   0.09857693  0.10133073  0.09902631  0.08628622]
 [ 0.08893165  0.09373048  0.10504178  0.11547894  0.08863109  0.10486192
   0.10959582  0.09973805  0.1010975   0.09289277]
 [ 0.09362466  0.09606589  0.10180281  0.0964048   0.09375436  0.11508502
   0.1100212   0.09466139  0.09889212  0.09968778]
 [ 0.09335768  0.09442628  0.11322806  0.10375494  0.09429622  0.10521778
   0.10504843  0.09230655  0.09818611  0.10017796]
 [ 0.09373868  0.10108754  0.10980698  0.10265525  0.10541142  0.09486777
   0.10760348  0.09616264  0.08610384  0.10256243]
 [ 0.09313878  0.09148455  0.111201    0.11380661  0.10464997  0.102185
   0.09786985  0.09905367  0.09777568  0.08883493]
 [ 0.09555826  0.09774256  0.10854167  0.1022329   0.09580163  0.10821439
   0.10410901  0.09593

INFO:tensorflow:loss = 2.2872, step = 101 (16.405 sec)


INFO:tensorflow:probabilities = [[ 0.09072778  0.0958732   0.1022152   0.10579537  0.10336895  0.09814876
   0.10561717  0.1040791   0.09958315  0.09459129]
 [ 0.09073159  0.10212113  0.09883709  0.09806983  0.10633291  0.10202592
   0.10583791  0.10330519  0.09531484  0.09742354]
 [ 0.10039973  0.10105898  0.10722245  0.10781068  0.10947429  0.0916054
   0.09784388  0.10252706  0.08808188  0.09397563]
 [ 0.09563042  0.0955618   0.10729846  0.11275366  0.10232554  0.09477044
   0.09608207  0.09994229  0.1012949   0.09434038]
 [ 0.09396733  0.09688915  0.09573719  0.11195283  0.09971275  0.10622877
   0.10383184  0.11087548  0.09037015  0.09043462]
 [ 0.10365801  0.09147648  0.1035909   0.10745431  0.10252293  0.10523562
   0.10096285  0.09318245  0.09294257  0.0989739 ]
 [ 0.0839388   0.09523597  0.10490089  0.09874494  0.09968723  0.11330143
   0.11263752  0.09695715  0.0990821   0.09551396]
 [ 0.08814467  0.0982407   0.10384996  0.10746877  0.09927092  0.10411717
   0.11012036  0.088

INFO:tensorflow:global_step/sec: 6.66389


INFO:tensorflow:probabilities = [[ 0.10569058  0.10121938  0.10946505  0.10075974  0.09091175  0.10245624
   0.09648559  0.09987505  0.09542406  0.09771259]
 [ 0.09657233  0.10212979  0.0990619   0.09832029  0.09973351  0.09853704
   0.11134195  0.09347535  0.10346057  0.09736728]
 [ 0.09174273  0.09312578  0.10684668  0.10932293  0.08685449  0.11243155
   0.1006371   0.10154429  0.09717842  0.10031599]
 [ 0.10251055  0.09454205  0.10554582  0.10849477  0.09275973  0.10242487
   0.10124729  0.09560083  0.09666038  0.10021366]
 [ 0.1001657   0.09726297  0.10952397  0.10149845  0.09560269  0.10605336
   0.08843137  0.10103899  0.09580032  0.10462214]
 [ 0.09468321  0.09851032  0.10077347  0.1054735   0.09047548  0.1095965
   0.1026591   0.10483666  0.09762568  0.09536608]
 [ 0.09472861  0.08995725  0.09562043  0.10283775  0.10718169  0.09848318
   0.11258837  0.10781223  0.09141691  0.09937365]
 [ 0.09771289  0.09546357  0.11286388  0.10201328  0.09296662  0.11283261
   0.09942297  0.094

INFO:tensorflow:loss = 2.27775, step = 201 (15.006 sec)


INFO:tensorflow:probabilities = [[ 0.088893    0.09897841  0.10731563  0.11145641  0.09872811  0.1068818
   0.09255869  0.0946596   0.09802128  0.10250703]
 [ 0.09838427  0.09654368  0.10377125  0.11178086  0.09844501  0.10655701
   0.09719986  0.09404521  0.09639139  0.09688149]
 [ 0.11615672  0.09517993  0.10226659  0.11474323  0.08689467  0.107411
   0.09355995  0.10433163  0.09399319  0.08546313]
 [ 0.09105334  0.10049862  0.1004912   0.11462047  0.10117907  0.09696157
   0.09843634  0.10052853  0.10188064  0.09435026]
 [ 0.0907898   0.09678301  0.10740399  0.11610129  0.09285153  0.11597735
   0.1018973   0.09316187  0.0939298   0.09110402]
 [ 0.08632795  0.10227221  0.10185938  0.0971022   0.10409433  0.1008728
   0.10484656  0.09980486  0.09911412  0.10370561]
 [ 0.09495189  0.084323    0.10773916  0.12804502  0.09393924  0.10216197
   0.10710517  0.08701501  0.08997527  0.10474435]
 [ 0.0888572   0.1023549   0.10044548  0.11721821  0.10228251  0.10789502
   0.10876473  0.096497

INFO:tensorflow:global_step/sec: 6.57683


INFO:tensorflow:probabilities = [[ 0.10195508  0.09767902  0.09112136  0.10275004  0.09623426  0.10356066
   0.09849875  0.11220819  0.09907743  0.09691514]
 [ 0.09982277  0.10121561  0.10300482  0.09392724  0.09422023  0.09645887
   0.10218418  0.09918067  0.10273328  0.10725235]
 [ 0.09643325  0.11152101  0.10009896  0.10353882  0.09937467  0.09692694
   0.1087461   0.09672491  0.09373274  0.09290265]
 [ 0.10608325  0.10155147  0.10344215  0.09976367  0.10453042  0.10035228
   0.11437084  0.08976483  0.09582552  0.08431555]
 [ 0.09813703  0.09482379  0.09654567  0.10762437  0.0952652   0.10690705
   0.10119598  0.10427879  0.09113945  0.10408267]
 [ 0.10331153  0.09908161  0.10691347  0.10974595  0.08272118  0.09783323
   0.09806432  0.11011322  0.09711081  0.0951047 ]
 [ 0.0976315   0.10499001  0.09720539  0.10720884  0.1012306   0.0993737
   0.09675325  0.10590759  0.0887419   0.10095722]
 [ 0.09681215  0.08803764  0.12256684  0.11479004  0.09874125  0.10242759
   0.09642862  0.090

INFO:tensorflow:loss = 2.27147, step = 301 (15.206 sec)


INFO:tensorflow:probabilities = [[ 0.09794717  0.09518662  0.1042271   0.10445593  0.09603579  0.10054759
   0.09522631  0.10083143  0.10646617  0.09907588]
 [ 0.09262484  0.08906318  0.10282489  0.10677449  0.0957578   0.10413122
   0.10089268  0.10354739  0.0977937   0.10658982]
 [ 0.10383639  0.09270721  0.10455672  0.11706118  0.09697353  0.10230175
   0.09472426  0.09337057  0.08866043  0.10580792]
 [ 0.09336734  0.10752439  0.09720057  0.10108693  0.10420056  0.09939575
   0.0986354   0.10387326  0.09918298  0.09553277]
 [ 0.10076007  0.09536164  0.10402225  0.1143394   0.09353887  0.10566914
   0.10301702  0.10085376  0.08899716  0.09344077]
 [ 0.10374281  0.09049768  0.10544116  0.10067347  0.09393968  0.10897066
   0.09692105  0.10777843  0.0916793   0.10035574]
 [ 0.10088915  0.0899641   0.09876654  0.10985363  0.100454    0.10140238
   0.09718829  0.10422323  0.09273952  0.10451908]
 [ 0.09815217  0.09293488  0.0946921   0.11408578  0.09981187  0.09564178
   0.09981818  0.10

INFO:tensorflow:global_step/sec: 7.05774


INFO:tensorflow:probabilities = [[ 0.09310143  0.10209924  0.09898864  0.11709131  0.10216913  0.09265641
   0.10798941  0.09775204  0.09692864  0.09122374]
 [ 0.11125322  0.08894158  0.10810407  0.126573    0.08250949  0.09633265
   0.10425499  0.09791873  0.08536751  0.09874474]
 [ 0.09153079  0.09804997  0.10457295  0.11198803  0.09384166  0.11293226
   0.10597331  0.09286966  0.10069997  0.08754131]
 [ 0.09940183  0.10841279  0.09998966  0.10599177  0.09998027  0.09876542
   0.08984905  0.10135735  0.09483059  0.10142127]
 [ 0.0893147   0.11113819  0.1041799   0.1018875   0.09456395  0.09543217
   0.10434891  0.1008653   0.1001108   0.09815853]
 [ 0.08859104  0.09911324  0.09659711  0.10104771  0.10840299  0.10891585
   0.09814124  0.09490504  0.1011944   0.10309137]
 [ 0.09625302  0.10377418  0.10161609  0.11076315  0.10041352  0.09841713
   0.09997858  0.09966659  0.10086337  0.08825438]
 [ 0.10017034  0.09053518  0.10766481  0.10084711  0.09563137  0.08998127
   0.10149059  0.10

INFO:tensorflow:loss = 2.26949, step = 401 (14.169 sec)


INFO:tensorflow:probabilities = [[ 0.10355424  0.08518258  0.1040621   0.1033183   0.09433186  0.09565442
   0.10098559  0.1090697   0.10601702  0.09782416]
 [ 0.10722578  0.09077719  0.10207957  0.11095499  0.0911062   0.09773699
   0.10662664  0.09909354  0.0999843   0.09441474]
 [ 0.10633192  0.08350026  0.12810554  0.09964638  0.09519669  0.10306314
   0.09858064  0.09543705  0.09946203  0.09067637]
 [ 0.09657907  0.09627697  0.09899566  0.1104983   0.08876799  0.11159151
   0.09312551  0.10801801  0.10223219  0.09391475]
 [ 0.0891478   0.09951448  0.09885741  0.10428175  0.09625661  0.10217819
   0.10798078  0.10414696  0.10148101  0.09615499]
 [ 0.10551972  0.08657101  0.1125176   0.11617284  0.09401904  0.09340958
   0.09543206  0.09315254  0.10291426  0.1002914 ]
 [ 0.09799132  0.08694066  0.10726802  0.10758927  0.09670724  0.10227882
   0.10035871  0.10301532  0.10706274  0.09078779]
 [ 0.09958919  0.08615782  0.10963028  0.11123228  0.10152194  0.09254666
   0.09847282  0.09

INFO:tensorflow:global_step/sec: 6.94095


INFO:tensorflow:probabilities = [[ 0.09516702  0.11794058  0.10085055  0.10895836  0.09909124  0.09487969
   0.09993157  0.10257562  0.08926029  0.09134506]
 [ 0.09256434  0.09153295  0.11049991  0.09649805  0.0930806   0.09626037
   0.09389931  0.10995891  0.11001705  0.10568848]
 [ 0.10057393  0.08810236  0.10610604  0.09858219  0.09505254  0.10159863
   0.1013791   0.10366073  0.10610257  0.09884185]
 [ 0.09603279  0.10400517  0.10073622  0.10668198  0.10596517  0.10057566
   0.09862144  0.09807787  0.10096242  0.08834132]
 [ 0.09109763  0.09468175  0.09801946  0.10960862  0.10426573  0.10514332
   0.09764294  0.09574328  0.11408221  0.08971508]
 [ 0.10013772  0.08628957  0.10732919  0.1011378   0.10758182  0.09470653
   0.09559637  0.11022897  0.09180287  0.10518919]
 [ 0.11161163  0.08401956  0.10519148  0.09765641  0.10276561  0.09879576
   0.11591053  0.09062277  0.10331518  0.09011103]
 [ 0.08478881  0.10944495  0.09657244  0.09915232  0.09676246  0.10328712
   0.11108639  0.10

INFO:tensorflow:loss = 2.26122, step = 501 (14.407 sec)


INFO:tensorflow:probabilities = [[ 0.1005257   0.08837734  0.09873018  0.10359475  0.108349    0.09521128
   0.10145985  0.09852027  0.10095436  0.10427725]
 [ 0.09716353  0.11002475  0.09411423  0.10458212  0.10840266  0.09708016
   0.10490559  0.09508069  0.09747456  0.09117172]
 [ 0.11400476  0.0858268   0.12233984  0.10334456  0.09968342  0.10647061
   0.08666708  0.09803977  0.09391911  0.08970393]
 [ 0.09270658  0.11049972  0.09900307  0.10923141  0.09933682  0.09587552
   0.1089908   0.09923051  0.09529415  0.08983141]
 [ 0.08592031  0.10121141  0.10662472  0.09909749  0.09022819  0.10828301
   0.11159601  0.09934033  0.08622174  0.11147676]
 [ 0.10698637  0.07905919  0.11494389  0.10936856  0.09854624  0.09800101
   0.10853867  0.08664964  0.1064283   0.09147813]
 [ 0.09216826  0.09216308  0.10462198  0.10843908  0.09514776  0.09360559
   0.08762722  0.11935344  0.10529131  0.10158224]
 [ 0.1129937   0.08186278  0.10813244  0.11729226  0.09042637  0.10045605
   0.1099842   0.09

INFO:tensorflow:Saving checkpoints for 600 into ./logs/model/model.ckpt.


INFO:tensorflow:Loss for final step: 2.2182.


INFO:tensorflow:Starting evaluation at 2018-08-15-14:27:56


INFO:tensorflow:Restoring parameters from ./logs/model/model.ckpt-600


INFO:tensorflow:Finished evaluation at 2018-08-15-14:28:01


INFO:tensorflow:Saving dict for global step 600: accuracy = 0.4353, global_step = 600, loss = 2.22162


{'accuracy': 0.43529999, 'loss': 2.2216158, 'global_step': 600}
