# Nội dung chính:
1. Xây dựng mô hình Word2Vec với Tensorflow <br/>
    1.1 Load dữ liệu <br/>
    1.2 Định nghĩa weights <br/>
    1.3 Định nghĩa loss function <br/>
    1.4 Định nghĩa optimizer <br/>
    1.5 Thực thi <br/>
2. Làm thế nào để xây dựng một mô hình Tensorflow <br/>
3. Variable sharing <br/>
    3.1 Name scope <br/>
    3.2 Variable scope <br/>
    3.3 Graph collections <br/>
4. Kinh nghiệm quản lý mô hình với Tensorflow<br/>
    4.1 tf.train.Saver <br/>
    4.2 tf.summary <br/>
    4.3 Kiểm soát ngẫu nhiên

# 1. Xây dựng mô hình Word2Vec với Tensorflow

Ở bài trước, chúng ta đã cùng tìm hiểu về các mô hình word embbeding phổ biến. Chúng ta quan tâm tới Word2Vec vì mô hình này không quá phức tạp nhưng độ hiệu quả cao. Trong phần này, chúng ta sẽ cùng nhau xây dựng mô hình Word2Vec bằng Tensorflow.

**Dataset:**

text8 là dataset khoảng 100MB text sạch được lấy từ Wikipedia Tiếng Anh và Mar, 3. 2016. Chúng ta sử dụng bộ data này để pre-processed bởi vì nó mục tiêu của chúng là là tập trung vào xử lý bằng Tensorflow chứ không phải là đi cleaned data nữa, clean data là một bước mất rất nhiều thời gian.

Dataset tải tại: http://mattmahoney.net/dc/text8.zip

100MB là không đủ để train một mô hình word embedding thực sự tốt, nhưng đủ để chúng ta xem được các mối quan hệ thú vị giữa các từ với nhau. Có 17 005 207 token nếu bạn đếm token bằng cách split text bởi khoảng trắng. 

Chúng ta xây dựng mô hình skip-gram word2vec với hàm loss là NCE.


## 1.1 Load dữ liệu

Input là từ trung tâm, output là từ hàng xóm. Để feeding các từ vào model của chúng ta, chúng ta tạo một dictionary của các từ phổ biến nhất và sẽ feed các từ này. Ví dụ là từ trung tâm là từ thứ 1000th, nếu windown_size là 2 chúng ta có thể có từ hàng xóm là 998, 999, 1001, 1002.

Mỗi mẫu input là một scalar, vì vậy BATCH_SIZE của các mẫu input có số chiều là [BATCH_SIZE]. Cũng giống như vậy, BATCH_SIZE của các mẫu output có chiều là [BATCH_SIZE, 1].

Đầu tiên chúng ta đọc file nén và extract các từ trong file này ra thành 1 list, chúng ta gọi list đó là `words`.

In [1]:
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()
import numpy as np
import zipfile

def read_words(pathFileZip):
    with zipfile.ZipFile(pathFileZip) as f:
        words = tf.compat.as_str(f.read(f.namelist()[0])).split()
    return words
words = read_words('./text8.zip')

Instructions for updating:
non-resource variables are not supported in the long term


Lúc này `words` sẽ là list danh sách các từ, `len(words) = 17005207`.

Tiếp theo, chúng ta xây dựng dictionary, `dictionary` sẽ có key là các từ, value là các id chúng ta đánh số, `index_dictionary` sẽ ngược lại. Chúng ta lấy bộ từ vựng là 50000 từ phổ biến nhất, các từ mà không được đưa vào bộ từ vựng chúng ta sẽ gọi là các từ `UNK` và đánh id là `-1`.

In [2]:
from collections import Counter
vocab_size = 50000 # kích cỡ từ điển
def convert_to_dict(words):
    dictionary = dict()
    count = [('UNK', -1)]
    index = 0
    count.extend(Counter(words).most_common(vocab_size - 1))
    for word, _ in count:
        dictionary[word] = index
        index += 1
    index_dictionary = dict(zip(dictionary.values(), dictionary.keys()))
    return dictionary, index_dictionary

dictionary, index_dictionary = convert_to_dict(words)

In [3]:
len(dictionary)

50000

Tiếp theo, chúng ta đánh chỉ số cho các từ, những từ có trong dictionary sẽ đánh số theo id chúng được gán, ngược lại đánh số 0 cho các từ còn lại.

In [4]:
index_words = [dictionary[word] if word in dictionary else 0 for word in words]

In [5]:
len(index_words)

17005207

Thiết lập hàm sinh mẫu

In [6]:
import random
skip_window = 1
def generate_sample(index_words, context_window_size):
    """ Form training pairs according to the skip-gram model. """
    for index, center in enumerate(index_words):
        context = random.randint(1, context_window_size)
        # Lấy ngẫu nhiên 1 từ mục tiêu trước từ trung tâm
        for target in index_words[max(0, index - context): index]:
            yield center, target
        # Lấy ngẫu nhiên 1 từ mục tiêu sau từ trung tâm
        for target in index_words[index + 1: index + context + 1]:
            yield center, target
            
single_gen = generate_sample(index_words, skip_window)

Lúc này `single_gen` sẽ là một generator, chứa các cặp (id1, id2) với id1 là từ trung tâm, id2 là từ hàng xóm ngẫu nhiên trong phạm vi skip_window.

Tiếp theo chúng ta sẽ xây dựng hàm để tạo ra các batch cho việc train. Trả về center_batch là một array numpy chứa danh sách các từ trung tâm, và target_batch là một ndarray tương ứng với nhãn, tức là một từ hàng xóm ứng với từ trung tâm đó.

In [7]:
def batch_gen(batch_size):
    while True:
        center_batch= np.zeros(batch_size, dtype=np.int32)
        target_batch = np.zeros([batch_size, 1])
        for index in range(batch_size):
            center_batch[index], target_batch[index] = next(single_gen)
        yield center_batch, target_batch

In [8]:
batch_size = 128
def gen():
    yield from batch_gen(batch_size)

In [9]:
dataset = tf.data.Dataset.from_generator(gen, (tf.int32, tf.int32), (tf.TensorShape([batch_size]), tf.TensorShape([batch_size, 1])))

Lúc này dataset của chúng ta sẽ là một đối tượng tf.data, thay vì phải feed data và placeholder, thì chúng ta sẽ dùng tf.data để thay thế nhằm tăng tốc độ mô hình.

Chúng ta tạo iterator cho data:

In [10]:
iterator = dataset.make_initializable_iterator()
center_words, target_words = iterator.get_next()

Instructions for updating:
Use `for ... in dataset:` to iterate over a dataset. If using `tf.estimator`, return the `Dataset` object directly from your input function. As a last resort, you can use `tf.compat.v1.data.make_initializable_iterator(dataset)`.


## 1.2 Định nghĩa weights

Mỗi hàng cỉa `embed_matrix` tương ứng với vector biểu diễn một từ (V). Nếu một được biểu diễn với một vector kích thước `embed_size` (N), thì matrix embedding sẽ có số chiều là [V, N] (hay vocab_size, embed_size). Chúng ta sẽ khởi tạo ma trận nhúng cho giá trị là một phân phối ngẫu nhiên. Trong đây, chúng ta chọn phân phối đều.

In [11]:
embed_size = 128
embed_matrix = tf.get_variable('embed_matrix',
                                 shape=[vocab_size, embed_size],
                                 initializer = tf.random_uniform_initializer())

Mục tiêu của chúng ta là biểu diễn các vector từ trong dictionary của chúng ta. Nhớ rằng embed_matrix có số chiều là vocab_size X embed_size, với mỗi hàng của embedding matrix biểu diễn vector cho từ tại tương ứng index đó. vì vậy, để lấy biểu diễn của tất cả các từ trung tâm trong batch, chúng ta get slice của tất cả các hàng trong ma trận embedding, Tensorflow hỗ trợ một phương thức là embedding_lookup. Phương thức này hữu ích khi nó nhân với một one-hot vector. Hoạt đâu của nó như hình:

<img src="./images/matrix_mult_w_one_hot.png"/>

Hay tóm lại, đây tương ứng là W' theo lý thuyết của chúng ta.

In [12]:
embed = tf.nn.embedding_lookup(embed_matrix, center_words, name='embedding')

## 1.3 Định nghĩa loss function

Chúng ta sử dụng hàm `nce loss`, tensorflow có hỗ trợ phương thức này:

`
tf.nn.nce_loss(
    weights,
    biases,
    labels,
    inputs,
    num_sampled,
    num_classes,
    num_true=1,
    sampled_values=None,
    remove_accidental_hits=False,
    partition_strategy='mod',
    name='nce_loss'
)
`

Lưu ý rằng để hàm thực thi trong trường hợp của chúng ta thì đối số thứ 3 thực sự là inputs, còn thứ 4 là labels. Sự nhập nhằng này có vẻ khá phiền, nhưng tf1 còn khá mới và chưa hoàn thiện.

Với nce loss, chúng ta cần weights và biases cho các layer ẩn để tính toán NCE loss. Chúng ta sẽ updated trong lúc training.

In [13]:
num_sampled = 64
nce_weight = tf.get_variable('nce_weight', shape=[vocab_size, embed_size],
                        initializer=tf.truncated_normal_initializer(stddev=1.0 / (embed_size ** 0.5)))
nce_bias = tf.get_variable('nce_bias', initializer=tf.zeros([vocab_size]))

# define loss function to be NCE loss function
loss = tf.reduce_mean(tf.nn.nce_loss(weights=nce_weight, 
                                            biases=nce_bias, 
                                            labels=target_words, 
                                            inputs=embed, 
                                            num_sampled=num_sampled, 
                                            num_classes=vocab_size), name='loss')


## 1.4 Định nghĩa optimizer

In [14]:
learning_rate = 1.0
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

## 1.5 Thực thi

In [16]:
num_train_steps = 100000
skip_step = 5000
with tf.Session() as sess:
    sess.run(iterator.initializer)
    sess.run(tf.global_variables_initializer())
    
    total_loss = 0
    for index in range(num_train_steps):
        try:
            loss_batch, _ = sess.run([loss, optimizer])
            total_loss += loss_batch
            if (index+1) % skip_step == 0:
                print('Average loss at step {}: {:5.1f}'.format(index, total_loss/skip_step))
                total_loss = 0
        except tf.errors.OutOfRangeError:
            sess.run(iterator.initializer)

Average loss at step 4999:  65.3
Average loss at step 9999:  18.4
Average loss at step 14999:   9.5
Average loss at step 19999:   6.7
Average loss at step 24999:   5.7
Average loss at step 29999:   5.3
Average loss at step 34999:   5.0
Average loss at step 39999:   4.9
Average loss at step 44999:   4.8
Average loss at step 49999:   4.8
Average loss at step 54999:   4.8
Average loss at step 59999:   4.7
Average loss at step 64999:   4.7
Average loss at step 69999:   4.7
Average loss at step 74999:   4.7
Average loss at step 79999:   4.7
Average loss at step 84999:   4.7
Average loss at step 89999:   4.6
Average loss at step 94999:   4.6
Average loss at step 99999:   4.6


# 2. Làm thế nào để xây dựng một mô hình Tensorflow

Tất cả các mô hình chúng ta xây dựng đến nay đều có cấu trúc giống nhau:

**Phần 1: Xây dựng đồ thị**
1. Import data (với tf.data hoặc placeholder)
2. Định nghĩa weights
3. Định nghĩa inference model
4. Định nghĩa loss function
5. Đinh nghĩa optimizer

**Phần 2: Thực thi tính toán**
1. Khởi tạo tất cả các biến
2. Khởi tạo interator (tf.data) hoặc feed data (placeholder)
3. Thực thi train model
4. Tính toán cost
5. Điều chỉnh tham số để cực tiểu/cực đại cost

<img src="./images/model.png"/>

Chúng ta đã mất khá ngắn các dòng mã để xây dựng mô hình word2vec, nhưng xa hơn, chúng ta cần tái sử dụng. Vậy làm thế nào để chúng ta thực hiện tái sử dụng, thì cách giải quyết đó là chúng ta xây dựng model như một class.

Model của chúng ta nên được thiết lập như dưới, chúng ta gộp bước 3 và bước 4 bởi vì muốn đặt chúng vào name scope "NCE loss"

In [17]:

class SkipGramModel:
    """ Build the graph for word2vec model """
    def __init__(self, params):
        pass

    def _import_data(self):
        """ Step 1: import data """
        pass

    def _create_embedding(self):
        """ Step 2: in word2vec, it's actually the weights that we care about """
        pass

    def _create_loss(self):
        """ Step 3 + 4: define the inference + the loss function """
        pass

    def _create_optimizer(self):
        """ Step 5: define optimizer """
        pass

Các bạn hãy tự hoàn thành class trên.

# 3. Variable sharing

## 3.1 Name scope

Nếu như chúng ta đã từng xuất graph Tensorflow, chúng ta sẽ thấy các nút được phân tán khắp nơi trên đồ thị, từ đó rất khó đọc. Chúng ta có thể nhóm các nút lại với nhau thành từng nhóm dựa vào name scope, điều này có thể giúp giảm khó khăn khi chúng ta thực hiện với hàng trăm operator.

`
with tf.name_scope(name_of_that_scope):
    # do something
`
Ví dụ đồ thị của chúng ta có thể có 4 name scope: "data", "embed", "loss", "optimizer".

In [None]:
with tf.name_scope('data'):
    iterator = dataset.make_initializable_iterator()
    center_words, target_words = iterator.get_next()

with tf.name_scope('embed'):
    embed_matrix = tf.get_variable('embed_matrix', 
                                    shape=[vocab_size, embed_size],
                                    initializer=tf.random_uniform_initializer())
    embed = tf.nn.embedding_lookup(embed_matrix, center_words, name='embedding')

with tf.name_scope('loss'):
    nce_weight = tf.get_variable('nce_weight', shape=[vocab_size, embed_size],
                                initializer=tf.truncated_normal_initializer())
    nce_bias = tf.get_variable('nce_bias', initializer=tf.zeros([VOCAB_SIZE]))
    loss = tf.reduce_mean(tf.nn.nce_loss(weights=nce_weight, 
                                        biases=nce_bias, 
                                        labels=target_words, 
                                        inputs=embed, 
                                        num_sampled=num_sampled, 
                                        num_classes=vocab_size), name='loss')

with tf.name_scope('optimizer'):
    optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

Khi hiển thị trên TensorBoard, kết quả như sau:

<img src="./images/namescope.png"/>

Bạn có thể ấn dấu cộng trên đầu mỗi khối để xem tất cả các operator của khối đó.

## 3.2 Variable scope

Một trong những câu hỏi tuyển dụng phổ biến có thể là namescope khác gì so với variable socpe. Cả 2 đều tạo namespace, vấn đề chính là variable_scope để chia sẻ biến. Hãy cùng khám phá lý do tại sao chúng ta cần chia sẻ biến.

Giả sử rằng chúng ta muốn tạo một mạng neural với 2 layer ẩn. chúng ta gọi 2 layer ẩn với 2 input x1 và x2.

In [21]:
x1 = tf.truncated_normal([200, 100], name='x1')
x2 = tf.truncated_normal([200, 100], name='x2')

def two_hidden_layers(x):
    assert x.shape.as_list() == [200, 100]
    w1 = tf.Variable(tf.random_normal([100, 50]), name="h1_weights")
    b1 = tf.Variable(tf.zeros([50]), name="h1_biases")
    h1 = tf.matmul(x, w1) + b1
    assert h1.shape.as_list() == [200, 50]  
    w2 = tf.Variable(tf.random_normal([50, 10]), name="h2_weights")
    b2 = tf.Variable(tf.zeros([10]), name="h2_biases")
    logits = tf.matmul(h1, w2) + b2
    return logits

logits1 = two_hidden_layers(x1)
logits2 = two_hidden_layers(x2)

Nếu hiển thị trên TensorBoard sẽ được kết quả như sau:

<img src="./images/2layer.png"/>

Mỗi lần bạn gọi 2 mạng, Tensorflow tạo một tập các variable khác nhau, trong khi đó, bạn muốn mạng dùng chung biến cho tất cả input. Để làm điều này thì chúng ta cần sử dụng `tf.get_variable()`. Khi chúng ta tạo một variable với `tf.get_variable()`, thì đầu tiên hàm này sẽ check xem variable tồn tại hay không. Nếu không thì tạo nó, nếu có rồi thì dùng lại. Chúng ta thay thế hàm trên lại như sau:

In [22]:
def two_hidden_layers_2(x):
    assert x.shape.as_list() == [200, 100]
    w1 = tf.get_variable("h1_weights", [100, 50], initializer=tf.random_normal_initializer())
    b1 = tf.get_variable("h1_biases", [50], initializer=tf.constant_initializer(0.0))
    h1 = tf.matmul(x, w1) + b1
    assert h1.shape.as_list() == [200, 50]  
    w2 = tf.get_variable("h2_weights", [50, 10], initializer=tf.random_normal_initializer())
    b2 = tf.get_variable("h2_biases", [10], initializer=tf.constant_initializer(0.0))
    logits = tf.matmul(h1, w2) + b2
    return logits

Nếu chạy thì sẽ báo lỗi: `ValueError: Variable h1_weights already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope?`

Để tránh điều này, chúng ta cần đặt tất cả các biến chúng ta muốn tạo sử dụng trong varscope để thiết lập tái sử dụng:

In [23]:
def fully_connected(x, output_dim, scope):
    with tf.variable_scope(scope) as scope:
        w = tf.get_variable("weights", [x.shape[1], output_dim], initializer=tf.random_normal_initializer())
        b = tf.get_variable("biases", [output_dim], initializer=tf.constant_initializer(0.0))
        return tf.matmul(x, w) + b

def two_hidden_layers(x):
    h1 = fully_connected(x, 50, 'h1')
    h2 = fully_connected(h1, 10, 'h2')

with tf.variable_scope('two_layers') as scope:
    logits1 = two_hidden_layers(x1)
    scope.reuse_variables()
    logits2 = two_hidden_layers(x2)


Kết quả trên Tensorboard:

<img src="./images/varscope.png"/>

## 3.3 Graph collections

Khi bạn tạo một mô hình, bạn phải đặt các biến của bạn vào các phần của đồ thị. Đôi khi, bạn muốn dễ dàng truy cập chúng. `tf.get_collection` cho phép bạn truy cập vào một tập xác định các biến, với key là tên của collection, scope là scope của các biến.

`
tf.get_collection(
    key,
    scope=None
)
`

Mặc định, tất cả các biến ở trong `tf.GraphKeys.GLOBAL_VARIABLES`. Để get tất cả các biến trong scope "my_scope". Ta làm như sau:

`
tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='my_scope')
`


In [24]:
tf.get_collection(tf.GraphKeys.GLOBAL_VARIABLES, scope='two_layers')

[<tf.Variable 'two_layers/h1/weights:0' shape=(100, 50) dtype=float32_ref>,
 <tf.Variable 'two_layers/h1/biases:0' shape=(50,) dtype=float32_ref>,
 <tf.Variable 'two_layers/h2/weights:0' shape=(50, 10) dtype=float32_ref>,
 <tf.Variable 'two_layers/h2/biases:0' shape=(10,) dtype=float32_ref>]

# 4. Kinh nghiệm quản lý mô hình với Tensorflow
## 4.1 tf.train.Saver()

Thực tiễn chúng ta cần kiểm định lại các tham số của mô hình sau khi qua một số epochs. Vì vậy, chúng ta có thể restore/retrain mô hình của chúng ta từ bước nào đó nếu cần thiết. Class `tf.train.Saver()` cho phép chúng ta lưu lại các variable của đồ thị trong file nhị phân.

`
tf.train.Saver.save(
    sess,
    save_path,
    global_step=None,
    latest_filename=None,
    meta_graph_suffix='meta',
    write_meta_graph=True,
    write_state=True
)
`

Ví dụ, nếu chúng ta muốn lưu các biến của đồ thị sau mỗi 1000 bước training, chúng ta làm như sau:

In [None]:
# define model

# create a saver object
saver = tf.train.Saver()

# launch a session to execute the computation
with tf.Session() as sess:
    # actual training loop
    for step in range(training_steps): 
        sess.run([optimizer])
        if (step + 1) % 1000 == 0:
            saver.save(sess, 'checkpoint_directory/model_name', global_step=global_step)

Trong thuật ngữ Tensorflow, các bước mà bạn lưu các biến của grahp được gọi là một checkpoint. Từ đó, chúng ta sẽ tạo nhiều checkpoint, nó rất hữu ích, chúng ta thêm số bước train của mô hình vào một biến gọi là `global_step`

In [None]:
global_step = tf.Variable(0, dtype=tf.int32, trainable=False, name='global_step')

Chúng ta cần cho global_step như một tham số tối ưu:

In [None]:
optimizer = tf.train.GradientDescentOptimizer(lr).minimize(loss,global_step=global_step)

Để lưu giá trị hiện tại của các biến trong thư mục checkpoints, chúng ta làm như sau:

In [None]:
saver.save(sess, 'checkpoints/model-name', global_step=global_step)

Để khôi phục lại các biến, chúng ta sử dụng `tf.train.Saver.restore(sess, save_path)`

In [None]:
saver.restore(sess, 'checkpoints/skip-gram-10000')

Nhưng tất nhiên, chúng ta chỉ có thể load các biến đã lưu nếu checkpoint hợp lệ. Những gì bạn có thể làm là nếu tồn tại checkpoint, khôi phục (restore) nó. Nó không tồn tại, train từ đầu. Tensorflow cho phép bạn get checkpoint từ một thư mục với `tf.train.get_checkpoint_state('directory-name')`. 

In [None]:
ckpt = tf.train.get_checkpoint_state(os.path.dirname('checkpoints/checkpoint'))
if ckpt and ckpt.model_checkpoint_path:
     saver.restore(sess, ckpt.model_checkpoint_path)

Checkpoint tự động theo dõi checkpoint mới nhất trong thư mục.

Mặc định, `saver.save()` lưu tất cả các biến của đồ thị, và điều này được khuyến nghị. Tuy nhiên, bạn có thể chỉ chọn một số biến để lưu trữ chúng.

In [None]:
v1 = tf.Variable(..., name='v1') 
v2 = tf.Variable(..., name='v2') 

# pass the variables as a dict: 
saver = tf.train.Saver({'v1': v1, 'v2': v2}) 

# pass them as a list
saver = tf.train.Saver([v1, v2]) 

# passing a list is equivalent to passing a dict with the variable op names # as keys
saver = tf.train.Saver({v.op.name: v for v in [v1, v2]})


## 4.2 tf.summary

Chúng ta có thể sử dụng matplotlib để mô phỏng loss và độ chính xác, tuy nhiên TensorBoard hỗ trợ công cụ để chúng ta thống kê mô phòng loss, average loss, accuracy tuyệt vời hơn, Bạn có thể mô phỏng dưới dạng scalar plot, histogram, hoặc even images.

In [None]:
def _create_summaries(self):
     with tf.name_scope("summaries"):
            tf.summary.scalar("loss", self.loss)
            tf.summary.scalar("accuracy", self.accuracy)            
            tf.summary.histogram("histogram loss", self.loss)
            # because you have several summaries, we should merge them all
            # into one op to make it easier to manage
            self.summary_op = tf.summary.merge_all()

In [None]:
loss_batch, _, summary = sess.run([model.loss, model.optimizer, model.summary_op], 
                                  feed_dict=feed_dict)

Bây giờ bạn đã nhận được summary, bạn cần ghi summary vào file giống như FileWrite mà chúng ta đã sử dụng để tạo đồ thị, chúng ta lưu summary như sau:

In [None]:
writer.add_summary(summary, global_step=step)

Chạy Tensorboard, trong page Scalars, bạn sẽ thấy các đồ thị summary.

<img src="./images/sum1.png"/>

<img src="./images/sum2.png"/>

Nếu bạn lưu summary khác nhau, bạn có thể so sánh chúng, ví dụ lần đầu chạy với learning rate là 1.0, lưu vào `improved_graph/lr1.0`, lần 2 learning rate là 0.5 lưu vào `improved_graph/lr0.5` .chúng ta có thể so sánh 2 lần lần.

<img src="./images/sum3.png"/>

Bạn có thể mô phỏng các thống kê như ảnh sử dụng: `tf.summary.image`



## 4.3 Kiểm soát ngẫu nhiên

Cách 1: Sử dụng seed cho ngẫu nhiên mức operator

In [None]:
c = tf.random_uniform([], -10, 10, seed=2)

with tf.Session() as sess:
    print(sess.run(c)) # >> 3.57493
    print(sess.run(c)) # >> -5.97319

In [None]:
c = tf.random_uniform([], -10, 10, seed=2)

with tf.Session() as sess:
    print(sess.run(c)) # >> 3.57493

with tf.Session() as sess:
    print(sess.run(c)) # >> 3.57493

In [None]:
c = tf.random_uniform([], -10, 10, seed=2)
d = tf.random_uniform([], -10, 10, seed=2)

with tf.Session() as sess:
    print sess.run(c) # >> 3.57493
    print sess.run(d) # >> 3.57493

Cách 2: Sử dụng `tf.set_random_seed(sees)` để ngẫu nhiên mức đồ thị.

Nếu bạn không quan tâm đến ngẫu nhiên cho mỗi toán tử trong đồ thị, nhưng bạn muốn kết quả lặp lại trên đồ thị khác, bạn có thể sử dụng `tf.set_random_seed`.

Ví dụ chúng ta có 2 mô hình `a.py` và `b.py` có mã giống hệt nhau:

In [None]:
import tensorflow as tf

tf.set_random_seed(2)
c = tf.random_uniform([], -10, 10)
d = tf.random_uniform([], -10, 10)

with tf.Session() as sess:
    print(sess.run(c))
    print(sess.run(d))

Nếu không có seed level graph thì chạy a và b sẽ ra kết quả khác nhau, nhưng với tf.set_random_seed, ta có 2 kêt quả hoàn toàn giống hệt nhau:


python a.py <br/>
> -4.00752 <br/>
> -2.98339<br/>

python b.py <br/>
> -4.00752<br/>
> -2.98339<br/>


**Tham khảo thêm:**
1. <a href="https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks/4_Utils/save_restore_model.ipynb">Save and Store a model</a><br/>
2. <a href="https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks/4_Utils/tensorboard_basic.ipynb">Tensorboard - Graph and loss visualization</a><br/>
3. <a href="https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks/4_Utils/tensorboard_advanced.ipynb">Tensorboard - Advanced visualization</a><br/>
4. <a href="https://github.com/chiphuyen/stanford-tensorflow-tutorials/blob/master/examples/04_word2vec_visualize.py">Source code Word2Vec hoàn chỉnh</a><br/>