# Giới thiệu Tensorflow

References: 

* https://www.tensorflow.org/
* https://www.datacamp.com/community/tutorials/tensorflow-tutorial

TensorFlow is a general-purpose system for graph-based computation.

TensorFlow gets its name from tensors, which are arrays of arbitrary dimensionality. A vector is a 1-d array and is known as a 1st-order tensor. A matrix is a 2-d array and a 2nd-order tensor. The "flow" part of the name refers to computation flowing through a graph. Training and inference in a neural network, for example, involves the propagation of matrix computations through many nodes in a computational graph.

When you think of doing things in TensorFlow, you might want to think of creating tensors (like matrices), adding operations (that output other tensors), and then executing the computation (running the computational graph). In particular, it's important to realize that when you add an operation on tensors, **it doesn't execute immediately**. Rather, TensorFlow waits for you to define all the operations you want to perform. Then, TensorFlow optimizes the computation graph, deciding how to execute the computation, before generating the data. Because of this, a tensor in TensorFlow isn't so much holding the data as a placeholder for holding the data, waiting for the data to arrive when a computation is executed."

In [1]:
from __future__ import print_function

import numpy as np
import tensorflow as tf

Add two vectors

In [7]:
with tf.Session():
    input1 = tf.constant([1.0, 1.0, 1.0, 1.0])
    input2 = tf.constant([2.0, 2.0, 2.0, 2.0])
    output = tf.add(input1, input2)
    print('output:', output)
    result = output.eval()
    print("result: ", result)

output: Tensor("Add_1:0", shape=(4,), dtype=float32)
result:  [ 3.  3.  3.  3.]


In [6]:
print([x + y for x, y in zip([1.0] * 4, [2.0] * 4)])

[3.0, 3.0, 3.0, 3.0]


In [8]:
x, y = np.full(4, 1.0), np.full(4, 2.0)
print("{} + {} = {}".format(x, y, x + y))

[ 1.  1.  1.  1.] + [ 2.  2.  2.  2.] = [ 3.  3.  3.  3.]


Broadcast multiply

In [13]:
x1 = tf.constant([1,2,3,4])
x2 = tf.constant([5,6,7,8])

# Multiply
result = tf.multiply(x1, x2)
print(result)

# TODO student add code to see result value
sess = tf.Session()
print(sess.run(result))

Tensor("Mul_3:0", shape=(4,), dtype=int32)
[ 5 12 21 32]


Many operators

In [11]:
with tf.Session():
    input1 = tf.constant(1.0, shape=[4])
    input2 = tf.constant(2.0, shape=[4])
    input3 = tf.constant(3.0, shape=[4])
    output = tf.add(tf.add(input1, input2), input3)
    result = output.eval()
    print(result)

[ 6.  6.  6.  6.]


Override operator

In [12]:
with tf.Session():
    input1 = tf.constant(1.0, shape=[4])
    input2 = tf.constant(2.0, shape=[4])
    output = input1 + input2
    print(output.eval())

[ 3.  3.  3.  3.]


Ngoài eval(), chúng ta thường dùng session.run() để thực hiện việc tính toán các giá trị của tensor, với tensor *output* ở trên chúng ta có thể tính giá trị như dưới.

In [None]:
with tf.Session() as sess:
    result = sess.run(output)
    print(result)

In [14]:
with tf.Session():
    input_features = tf.constant(np.reshape([1, 0, 0, 1], (1, 4)).astype(np.float32))
    weights = tf.constant(np.random.randn(4, 2).astype(np.float32))
    output = tf.matmul(input_features, weights)
    print("Input:")
    print(input_features.eval())
    print("Weights:")
    print(weights.eval())
    print("Output:")
    print(output.eval())

Input:
[[ 1.  0.  0.  1.]]
Weights:
[[ 0.07208446 -1.99625182]
 [ 1.73228979  0.27750307]
 [ 0.06807552 -0.47452855]
 [-0.30847621 -2.07487583]]
Output:
[[-0.23639175 -4.07112789]]


**Làm quen với khái niệm**:

Sinh viên đọc và chú ý phân biệt ý nghĩa sử dụng của chúng:

* https://www.tensorflow.org/api_docs/python/tf/placeholder

* https://www.tensorflow.org/api_docs/python/tf/Variable

Placeholder example

In [16]:
x = tf.placeholder(tf.float32, shape=(1024, 1024))
y = tf.matmul(x, x)

with tf.Session() as sess:
  #print(sess.run(y))  # ERROR: will fail because x was not fed.

  rand_array = np.random.rand(1024, 1024)
  print(sess.run(y, feed_dict={x: rand_array}))  # Will succeed.

[[ 256.78262329  257.14483643  262.97634888 ...,  249.25056458  264.0927124
   260.77716064]
 [ 247.35192871  247.98680115  249.16773987 ...,  238.05419922
   254.13899231  249.99472046]
 [ 255.63529968  258.44558716  260.39883423 ...,  245.1995697   257.9576416
   258.99157715]
 ..., 
 [ 262.0163269   248.27992249  258.4670105  ...,  251.17614746
   261.51138306  257.1958313 ]
 [ 254.76728821  260.31860352  264.45419312 ...,  247.18814087
   267.58258057  259.33312988]
 [ 253.54466248  245.2971344   257.22503662 ...,  236.17977905
   257.87197876  255.12208557]]


Variables: https://www.tensorflow.org/programmers_guide/variables

In [None]:
# run this 2 times may cause error: Variable v already exists
with tf.Session() as sess:
    v = tf.get_variable("v", shape=(), initializer=tf.zeros_initializer())
    assignment = v.assign_add(1)
    tf.global_variables_initializer().run()
    print(assignment.eval())

In [None]:
#@test {"output": "ignore"}
import tensorflow as tf
import numpy as np

with tf.Session() as sess:
    # Set up two variables, total and weights, that we'll change repeatedly.
    total = tf.Variable(tf.zeros([1, 2]))
    weights = tf.Variable(tf.random_uniform([1,2]))

    # Initialize the variables we defined above.
    tf.global_variables_initializer().run()

    # This only adds the operators to the graph right now. The assignment
    # and addition operations are not performed yet.
    update_weights = tf.assign(weights, tf.random_uniform([1, 2], -1.0, 1.0))
    update_total = tf.assign(total, tf.add(total, weights))
  
    for _ in range(5):
        # Actually run the operation graph, so randomly generate weights and then
        # add them into the total. Order does matter here. We need to update
        # the weights before updating the total.
        sess.run(update_weights)
        sess.run(update_total)
    
        print(weights.eval(), total.eval())

Linear Regression Example from: [aymericdamien](https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks/2_BasicModels/linear_regression.ipynb)

In [None]:
import tensorflow as tf
import numpy
import matplotlib.pyplot as plt
rng = numpy.random

In [None]:
# Parameters
learning_rate = 0.01
training_epochs = 1000
display_step = 50

In [None]:
# Training Data
train_X = numpy.asarray([3.3,4.4,5.5,6.71,6.93,4.168,9.779,6.182,7.59,2.167,
                         7.042,10.791,5.313,7.997,5.654,9.27,3.1])
train_Y = numpy.asarray([1.7,2.76,2.09,3.19,1.694,1.573,3.366,2.596,2.53,1.221,
                         2.827,3.465,1.65,2.904,2.42,2.94,1.3])
n_samples = train_X.shape[0]

In [None]:
# tf Graph Input
X = tf.placeholder("float")
Y = tf.placeholder("float")

# Set model weights
W = tf.Variable(rng.randn(), name="weight")
b = tf.Variable(rng.randn(), name="bias")

In [None]:
# Construct a linear model
pred = tf.add(tf.multiply(X, W), b)

In [None]:
# Mean squared error
cost = tf.reduce_sum(tf.pow(pred-Y, 2))/(2*n_samples)
# Gradient descent
optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

In [None]:
# Initialize the variables (i.e. assign their default value)
init = tf.global_variables_initializer()

In [None]:
# Start training
with tf.Session() as sess:
    sess.run(init)

    # Fit all training data
    for epoch in range(training_epochs):
        for (x, y) in zip(train_X, train_Y):
            sess.run(optimizer, feed_dict={X: x, Y: y})

        #Display logs per epoch step
        if (epoch+1) % display_step == 0:
            c = sess.run(cost, feed_dict={X: train_X, Y:train_Y})
            print ("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(c), 
                "W=", sess.run(W), "b=", sess.run(b))

    print ("Optimization Finished!")
    training_cost = sess.run(cost, feed_dict={X: train_X, Y: train_Y})
    print ("Training cost=", training_cost, "W=", sess.run(W), "b=", sess.run(b), '\n')

    #Graphic display
    plt.plot(train_X, train_Y, 'ro', label='Original data')
    plt.plot(train_X, sess.run(W) * train_X + sess.run(b), label='Fitted line')
    plt.legend()
    plt.show()

**Tensorflow arithmetic operators**

https://www.tensorflow.org/api_guides/python/math_ops#Arithmetic_Operators

## Bài tập

Bài nộp của sinh viên là chính là **file này** sau khi được đổi tên thành **MSSV.E9_introduction_numpy.ipynb** và đừng quên ghi thông tin sinh viên vào các ô ở dưới.

Địa chỉ nộp bài: https://www.dropbox.com/request/h084jC1ZUTkUm5gosR6l

Deadline nộp bài: **10:00 thứ 2 tuần tiếp theo**

*Điểm bài này sẽ được tổng hợp với điểm chấm trên lớp (nếu có) để ra điểm cuối cùng*

Thông tin sinh viên:

In [None]:
sid = 'MSSV'
name = 'Tên Bạn'

import tensorflow as tf
import numpy as np

# sinh viên import các thư viện cần thiết ở đây

### Bài 1
Trong bài này, sinh viên sẽ tập làm quen với các thao tác cơ bản trên numpy, tensorflow, so sánh, đánh giá đơn giản về tốc độ tính toán

a) Sinh viên viết hàm matrix_gen(m, n) để sinh ra ma trận các số thực trong khoảng [0, 1] ngẫu nhiên, output là python array biểu diễn cho ma trận. Sử dụng hàm để sinh ra hai ma trận và lưu vào hai biến tương ứng đã cho để sử dụng cho các câu tiếp theo.

In [18]:
# code sinh viên cho câu a
def matrix_gen(m, n):
        return np.random.randint(2, size=(m, n))

m, n, k=50, 40, 60
matrix_mn = matrix_gen(m, n)
matrix_nk = matrix_gen(n, k)
print(matrix_mn)
print(matrix_nk)

[[1 0 0 ..., 1 1 1]
 [0 0 1 ..., 0 1 1]
 [1 1 1 ..., 0 1 1]
 ..., 
 [0 1 1 ..., 0 1 1]
 [0 1 1 ..., 0 1 0]
 [1 0 0 ..., 1 0 1]]
[[1 1 1 ..., 1 0 0]
 [1 1 0 ..., 1 1 0]
 [0 1 0 ..., 0 1 0]
 ..., 
 [1 1 0 ..., 0 1 1]
 [0 1 1 ..., 0 0 0]
 [0 0 0 ..., 1 0 1]]


b) Hãy viết một hàm py_matrix_mul(matrix_1, matrix_2) để nhân hai ma trận được truyền vào trong đó không sử dụng numpy, tensorflow hay các thư viện khác. (giả sử input đã đúng không cần kiểm tra

In [None]:
# code câu b của sinh viên
def py_matrix_mul(matrix_1, matrix_2):
    pass

mt_mul_py = py_matrix_mul(matrix_mn, matrix_nk)

c) Sử dụng numpy để hiện thực cho bài toán nhân hai ma trận với hai ma trân *matrix_mn* và *matrix_nk*, lưu kết quả cuối cùng vào mt_mul_numpy

In [None]:
# code câu c của sinh viên


mt_mul_numpy = None

d) Sử dụng tensorflow để hiện thực cho câu c thay vì dùng numpy

In [None]:
# code câu d của sinh viên

mt_mul_tensorflow = None

e) Với các câu b, c, d, hãy chèn đoạn code để tính thời gian thực thi của mỗi phương pháp và so sánh, đánh giá về mặt thời gian thực thi của các thao tác.

Nhận xét của sinh viên: ...............

### Bài 2

Cho đoạn code sinh dữ liệu cho hàm f() như bên dưới.
Sinh viên hãy chỉnh sửa đoạn code Linear Regression, 
chọn các tham số phù hợp để ra được kết quả tốt nhất có thể.

In [None]:
def f(x):
    return x * 5 + 3

llen = 50
x = np.random.rand(llen)
y = f(x) + np.random.normal(0, 0.1, llen)

print('x', x)
print('y', y)

train_X = x
train_Y = y
n_samples = train_X.shape[0]

*Code sinh viên ở dưới*

In [None]:
# TODO

*Những nhận xét đánh giá của sinh viên*:

...............................................................................

...............................................................................