fix

formath · formath · commit ecb1f3f7acbd · 2018-04-24T17:09:57.000+08:00
diff --git a/python/deep_model.py b/python/deep_model.py
@@ -22,9 +22,10 @@ def concat(self, fields, sparse_ids, sparse_vals):
             mapping_ints = tf.constant([0])
             table = tf.contrib.lookup.index_table_from_tensor(mapping=mapping_ints, num_oov_buckets=100000, dtype=tf.int64)
             sparse_id_in_this_field = table.lookup(sparse_ids[i])
-            embedding_variable = tf.Variable(tf.truncated_normal([100002, self.embedding_size], stddev=0.1))
-            embedding = tf.nn.embedding_lookup_sparse(embedding_variable, sparse_id_in_this_field, sparse_vals[i], "mod", combiner="sum")
-            emb.append(embedding)
+            with tf.variable_scope("emb_"+str(field_id)):
+                embedding_variable = tf.Variable(tf.truncated_normal([100002, self.embedding_size], stddev=0.1))
+                embedding = tf.nn.embedding_lookup_sparse(embedding_variable, sparse_id_in_this_field, sparse_vals[i], "mod", combiner="sum")
+                emb.append(embedding)
             self.embedding.append(embedding_variable)
 
         return tf.concat(emb, 1, name='concat_embedding')
@@ -34,7 +35,7 @@ def forward(self, sparse_id, sparse_val):
         forward graph
         '''
 
-        with tf.variable_scope("forward", reuse=tf.AUTO_REUSE):
+        with tf.variable_scope("forward"):
             self.embedding = []
             self.hiddenW = []
             self.hiddenB = []
diff --git a/python/train.py b/python/train.py
@@ -38,8 +38,7 @@
 if not os.path.exists(FLAGS.tensorboard_dir):
     os.makedirs(FLAGS.tensorboard_dir)
 
-# train loop
-with tf.Graph().as_default():
+with tf.device('/cpu:0'):
     # data iter
     data = Data(FLAGS.sparse_fields)
     train_label, train_sparse_id, train_sparse_val = data.ReadBatch(FLAGS.train_file,
@@ -82,55 +81,52 @@
         print("Error: unknown optimizer: {}".format(FLAGS.optimizer))
         exit(1)
 
-    with tf.device("/cpu:0"):
-        global_step = tf.Variable(0, name='global_step', trainable=False)
+    global_step = tf.Variable(0, name='global_step', trainable=False)
     train_op = optimizer.minimize(cost, global_step=global_step)
 
-    # eval
+    # to eval
     tf.get_variable_scope().reuse_variables()
 
-    # valid cross entropy loss
-    #valid_logits, _ = model.forward(valid_sparse_id, valid_sparse_val)
-    #valid_label = tf.to_int64(valid_label)
-    #valid_cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=valid_logits, labels=valid_label)
-    #valid_loss_op = tf.reduce_mean(valid_cross_entropy)
-
-    # valid auc
-    #valid_auc, _ = tf.metrics.auc(predictions=valid_logits, labels=valid_label)
+    # valid metric
+    valid_logits, _ = model.forward(valid_sparse_id, valid_sparse_val)
+    valid_label = tf.to_int64(valid_label)
+    valid_cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=valid_logits, labels=valid_label)
+    valid_loss = tf.reduce_mean(valid_cross_entropy)
+    valid_auc, _ = tf.metrics.auc(predictions=valid_logits, labels=valid_label)
 
     # saver
     checkpoint_file = FLAGS.checkpoint_dir + "/model.checkpoint"
     saver = tf.train.Saver()
 
-    with tf.Session() as sess:
-        sess.run(tf.initialize_all_variables())
-        sess.run(tf.initialize_local_variables())
-        sess.run(tf.tables_initializer())
-
-        if FLAGS.train_from_checkpoint:
-            checkpoint_state = tf.train.get_checkpoint_state(FLAGS.checkpoint_dir)
-            if checkpoint_state and checkpoint_state.model_checkpoint_path:
-                print("Continue training from checkpoint {}".format(checkpoint_state.model_checkpoint_path))
-                saver.restore(sess, checkpoint_state.model_checkpoint_path)
-
-        coord = tf.train.Coordinator()
-        threads = tf.train.start_queue_runners(coord=coord, sess=sess)
-        try:
-            while not coord.should_stop():
-                _, step, train_loss_val, train_auc_val = sess.run([train_op, global_step, loss, auc])
-                #if step % FLAGS.steps_to_validate == 0:
-                    #valid_loss_val, valid_auc_val = sess.run([valid_loss_op, valid_auc])
-                    #print("Step: {}, train loss: {}, train auc: {}, valid loss: {}, valid auc: {}".format(
-                    #        step, train_loss_val, train_auc_val, valid_loss_val, valid_auc_val))
-        except tf.errors.OutOfRangeError:
-            print("training done")
-        finally:
-            coord.request_stop()
-
-        saver.save(sess, checkpoint_file)
-        tf.train.write_graph(sess.graph.as_graph_def(), FLAGS.model_dir, 'graph.pb', as_text=False)
-        tf.train.write_graph(sess.graph.as_graph_def(), FLAGS.model_dir, 'graph.txt', as_text=True)
-
-        # wait for threads to exit
-        coord.join(threads)
-        sess.close()
+with tf.Session() as sess:
+    sess.run(tf.global_variables_initializer())
+    sess.run(tf.local_variables_initializer())
+    sess.run(tf.tables_initializer())
+
+    if FLAGS.train_from_checkpoint:
+        checkpoint_state = tf.train.get_checkpoint_state(FLAGS.checkpoint_dir)
+        if checkpoint_state and checkpoint_state.model_checkpoint_path:
+            print("Continue training from checkpoint {}".format(checkpoint_state.model_checkpoint_path))
+            saver.restore(sess, checkpoint_state.model_checkpoint_path)
+
+    coord = tf.train.Coordinator()
+    threads = tf.train.start_queue_runners(coord=coord, sess=sess)
+    try:
+        while not coord.should_stop():
+            _, step, train_loss_val, train_auc_val = sess.run([train_op, global_step, loss, auc])
+            if step % FLAGS.steps_to_validate == 0:
+                valid_loss_val, valid_auc_val = sess.run([valid_loss, valid_auc])
+                print("Step: {}, train loss: {}, train auc: {}, valid loss: {}, valid auc: {}".format(
+                            step, train_loss_val, train_auc_val, valid_loss_val, valid_auc_val))
+    except tf.errors.OutOfRangeError:
+        print("training done")
+    finally:
+        coord.request_stop()
+
+    saver.save(sess, checkpoint_file)
+    tf.train.write_graph(sess.graph.as_graph_def(), FLAGS.model_dir, 'graph.pb', as_text=False)
+    tf.train.write_graph(sess.graph.as_graph_def(), FLAGS.model_dir, 'graph.txt', as_text=True)
+
+    # wait for threads to exit
+    coord.join(threads)
+    sess.close()