In [1]:
import tensorflow as tf
import numpy as np
import csv
import functools
import pandas as pd

In [2]:
test_data_path = "testdata_20.csv"
train_data_path = "traindata_80.csv"

In [3]:
LABEL_COLUMN = 'move'
LABELS = [0, 1, 2, 3]

In [4]:
def get_dataset(file_path, **kwargs):
    dataset = tf.data.experimental.make_csv_dataset(
        file_path,
        batch_size = 5,
        label_name = LABEL_COLUMN,
        num_epochs = 1,
        ignore_errors = True,
        **kwargs)
    return dataset

In [10]:
raw_train_data = get_dataset(train_data_path)
raw_test_data = get_dataset(test_data_path)

In [12]:
tf.get_tensors()

AttributeError: module 'tensorflow' has no attribute 'get_tensors'

In [6]:
def show_batch(dataset):
    for batch, label in dataset.take(1):
        for key, value in batch.items():
            print("{:20s}: {}".format(key, value.numpy()))

In [14]:
show_batch(raw_test_data)

1                   : [0.06666667 0.06666667 0.06666667 0.8666667  0.33333334]
2                   : [0.13333334 0.46666667 1.         0.93333334 0.46666667]
3                   : [0.2        0.73333335 0.4        0.33333334 0.53333336]
4                   : [0.26666668 0.2        0.93333334 0.         0.73333335]
5                   : [0.33333334 1.         0.46666667 0.73333335 0.6       ]
6                   : [0.4        0.         0.53333336 0.8        0.2       ]
7                   : [0.46666667 0.8666667  0.         0.26666668 0.26666668]
8                   : [0.53333336 0.6        0.8        0.13333334 0.6666667 ]
9                   : [0.6       0.6666667 0.2       0.4       0.4      ]
10                  : [0.6666667  0.8        0.33333334 1.         0.13333334]
11                  : [0.73333335 0.4        0.8666667  0.06666667 0.        ]
12                  : [0.8        0.33333334 0.13333334 0.53333336 0.06666667]
13                  : [0.8666667  0.93333334 0.6        0

In [18]:
CSV_COLUMNS=['1','2','3','4','5','6','7','8','9','10','11','12','13','14','15','0','move']
temp_dataset = get_dataset(train_data_path, column_names=CSV_COLUMNS)
show_batch(temp_dataset)

1                   : [0.33333334 0.26666668 0.33333334 0.6666667  0.06666667]
2                   : [0.06666667 0.6666667  0.06666667 0.26666668 0.2       ]
3                   : [0.2        0.46666667 0.13333334 0.53333336 0.26666668]
4                   : [0.26666668 0.4        0.2        0.33333334 0.53333336]
5                   : [0.6        0.06666667 0.6        0.13333334 0.33333334]
6                   : [0.13333334 0.8        0.46666667 0.2        0.46666667]
7                   : [0.46666667 0.8666667  0.26666668 0.93333334 0.8       ]
8                   : [0.53333336 0.13333334 0.8        0.06666667 1.        ]
9                   : [0.4        0.33333334 0.4        0.         0.6       ]
10                  : [0.6666667  0.6        0.73333335 0.4        0.13333334]
11                  : [0.         1.         0.53333336 0.73333335 0.73333335]
12                  : [0.73333335 0.53333336 0.         0.8        0.        ]
13                  : [0.8666667  0.93333334 0.86666

In [19]:
example_batch, labels_batch = next(iter(temp_dataset))

In [20]:
def pack(features, label):
    return tf.stack(list(features.values()), axis=-1), label

In [21]:
packed_dataset = temp_dataset.map(pack)
for features, labels in packed_dataset.take(1):
    print(features.numpy())
    print()
    print(labels.numpy())

[[0.06666667 0.2        0.26666668 0.46666667 0.8666667  0.33333334
  0.13333334 0.53333336 0.6666667  0.         0.4        1.
  0.73333335 0.6        0.93333334 0.8       ]
 [0.06666667 0.13333334 0.2        0.26666668 0.4        0.
  0.46666667 0.53333336 0.33333334 0.6        0.6666667  0.73333335
  0.8666667  0.93333334 1.         0.8       ]
 [0.73333335 0.         0.8        0.26666668 0.4        0.06666667
  0.6666667  0.6        0.93333334 0.53333336 0.8666667  0.33333334
  0.2        0.46666667 1.         0.13333334]
 [0.13333334 0.73333335 0.33333334 0.46666667 0.06666667 0.8
  0.26666668 0.53333336 0.         0.2        0.4        1.
  0.6        0.8666667  0.6666667  0.93333334]
 [0.6        0.33333334 0.8        0.73333335 0.4        0.53333336
  0.26666668 0.         0.46666667 0.13333334 0.2        0.93333334
  1.         0.06666667 0.6666667  0.8666667 ]]

[1 1 0 0 2]


In [23]:
class PackNumericFeatures(object):
  def __init__(self, names):
    self.names = names

  def __call__(self, features, labels):
    numeric_freatures = [features.pop(name) for name in self.names]
    numeric_features = [tf.cast(feat, tf.float32) for feat in numeric_freatures]
    numeric_features = tf.stack(numeric_features, axis=-1)
    features['numeric'] = numeric_features

    return features, labels

In [24]:
NUMERIC_FEATURES = ['1','2','3','4','5','6','7','8','9','10','11','12','13','14','15','0']

packed_train_data = raw_train_data.map(PackNumericFeatures(NUMERIC_FEATURES))
packed_test_data = raw_test_data.map(PackNumericFeatures(NUMERIC_FEATURES))

In [25]:
show_batch(packed_train_data)

numeric             : [[0.33333334 0.6666667  0.06666667 0.6        0.73333335 0.
  0.93333334 0.13333334 0.46666667 0.4        0.53333336 0.8
  1.         0.2        0.26666668 0.8666667 ]
 [0.06666667 0.13333334 0.2        0.26666668 0.33333334 0.
  0.4        0.46666667 0.6        0.6666667  0.73333335 0.53333336
  0.8666667  0.93333334 1.         0.8       ]
 [0.46666667 0.2        0.06666667 0.33333334 0.13333334 0.53333336
  0.6666667  0.         0.6        0.4        0.8        0.26666668
  0.8666667  0.93333334 0.73333335 1.        ]
 [0.4        0.13333334 0.26666668 0.73333335 0.06666667 0.33333334
  0.6666667  0.2        0.6        1.         0.8666667  0.46666667
  0.93333334 0.         0.53333336 0.8       ]
 [0.06666667 0.4        0.53333336 0.13333334 0.         0.2
  0.46666667 0.26666668 0.33333334 0.93333334 0.6666667  0.8
  0.6        0.8666667  0.73333335 1.        ]]


In [26]:
example_batch, labels_batch = next(iter(packed_train_data))

In [27]:
desc = pd.read_csv(train_data_path)[NUMERIC_FEATURES].describe()
desc

Unnamed: 0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,0
count,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0,14996.0
mean,0.285116,0.320597,0.353121,0.374126,0.406388,0.423464,0.432982,0.470481,0.52879,0.532213,0.54411,0.57029,0.684125,0.658673,0.681648,0.733876
std,0.268076,0.265926,0.256098,0.231942,0.276902,0.283155,0.277411,0.254121,0.273233,0.302539,0.301554,0.281705,0.261505,0.29772,0.299037,0.276821
min,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
25%,0.066667,0.133333,0.2,0.266667,0.2,0.2,0.2,0.266667,0.333333,0.333333,0.333333,0.4,0.6,0.466667,0.466667,0.6
50%,0.133333,0.2,0.266667,0.266667,0.333333,0.4,0.466667,0.533333,0.6,0.6,0.6,0.6,0.866667,0.733333,0.733333,0.8
75%,0.466667,0.466667,0.533333,0.533333,0.6,0.666667,0.6,0.6,0.666667,0.733333,0.733333,0.8,0.866667,0.933333,0.933333,1.0
max,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0


In [28]:
numeric_column = tf.feature_column.numeric_column('numeric', shape=[len(NUMERIC_FEATURES)])
numeric_columns = [numeric_column]
numeric_column

NumericColumn(key='numeric', shape=(16,), default_value=None, dtype=tf.float32, normalizer_fn=None)

In [29]:
example_batch['numeric']

<tf.Tensor: id=1189, shape=(5, 16), dtype=float32, numpy=
array([[0.        , 0.26666668, 0.53333336, 1.        , 0.2       ,
        0.06666667, 0.46666667, 0.8666667 , 0.4       , 0.13333334,
        0.33333334, 0.93333334, 0.8       , 0.6666667 , 0.6       ,
        0.73333335],
       [0.06666667, 0.13333334, 0.2       , 0.26666668, 0.6       ,
        0.33333334, 0.46666667, 0.53333336, 0.4       , 0.93333334,
        0.        , 0.8       , 0.8666667 , 1.        , 0.73333335,
        0.6666667 ],
       [0.33333334, 0.06666667, 0.13333334, 0.26666668, 0.6       ,
        0.2       , 0.46666667, 0.53333336, 0.        , 0.8666667 ,
        1.        , 0.73333335, 0.93333334, 0.4       , 0.6666667 ,
        0.8       ],
       [0.4       , 0.8666667 , 0.06666667, 0.6       , 0.93333334,
        0.53333336, 0.46666667, 0.73333335, 0.33333334, 0.2       ,
        0.8       , 0.13333334, 0.6666667 , 0.        , 1.        ,
        0.26666668],
       [0.53333336, 0.4       , 0.26666668

In [30]:
numeric_layer = tf.keras.layers.DenseFeatures(numeric_columns)
numeric_layer(example_batch).numpy()

array([[0.        , 0.26666668, 0.53333336, 1.        , 0.2       ,
        0.06666667, 0.46666667, 0.8666667 , 0.4       , 0.13333334,
        0.33333334, 0.93333334, 0.8       , 0.6666667 , 0.6       ,
        0.73333335],
       [0.06666667, 0.13333334, 0.2       , 0.26666668, 0.6       ,
        0.33333334, 0.46666667, 0.53333336, 0.4       , 0.93333334,
        0.        , 0.8       , 0.8666667 , 1.        , 0.73333335,
        0.6666667 ],
       [0.33333334, 0.06666667, 0.13333334, 0.26666668, 0.6       ,
        0.2       , 0.46666667, 0.53333336, 0.        , 0.8666667 ,
        1.        , 0.73333335, 0.93333334, 0.4       , 0.6666667 ,
        0.8       ],
       [0.4       , 0.8666667 , 0.06666667, 0.6       , 0.93333334,
        0.53333336, 0.46666667, 0.73333335, 0.33333334, 0.2       ,
        0.8       , 0.13333334, 0.6666667 , 0.        , 1.        ,
        0.26666668],
       [0.53333336, 0.4       , 0.26666668, 0.2       , 0.        ,
        0.06666667, 0.6666667 , 

In [70]:
model = tf.keras.Sequential([
    numeric_layer,
    tf.keras.layers.Dense(256, activation='relu'),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(4, activation='softmax')
])

model.compile(
loss = 'sparse_categorical_crossentropy',
optimizer='adam',
metrics=['accuracy'])

In [32]:
train_data = packed_train_data.shuffle(500)
test_data = packed_test_data

In [71]:
model.fit(train_data, epochs=100)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


<tensorflow.python.keras.callbacks.History at 0x22350bf16c8>

In [72]:
test_loss, test_accuracy = model.evaluate(test_data)

print('\n\nTest Loss {}, Test Accuracy {}'.format(test_loss, test_accuracy))



Test Loss 2.8608861773647076, Test Accuracy 0.6964097023010254


array([9.9470747e-01, 1.2764896e-07, 5.1976931e-03, 9.4714720e-05],
      dtype=float32)