# 第3章 TensorFlow入门

## 3.1 TensorFlow 计算模型——计算图

### 3.1.2 计算图的使用

In [1]:
import tensorflow as tf

a = tf.constant([1.0, 2.0], name='a')
b = tf.constant([2.0, 3.0], name='b')
result = a + b
# 直接新建的常量和变量会在默认图中
print(a.graph is tf.get_default_graph())

True


In [10]:
# 可以新建计算图
g1 = tf.Graph()
with g1.as_default():
    v = tf.get_variable("v", shape=[1], initializer=tf.zeros_initializer())
    
g2 = tf.Graph()
with g2.as_default():
    v = tf.get_variable("v", shape=[1], initializer=tf.ones_initializer())

# 计算图之间的张量和计算是隔离开的
with tf.Session(graph=g1) as sess:
    tf.global_variables_initializer().run()
    with tf.variable_scope("", reuse=True):
        print(sess.run(tf.get_variable("v")))
        
with tf.Session(graph=g2) as sess:
    tf.global_variables_initializer().run()
    with tf.variable_scope("", reuse=True):
        print(sess.run(tf.get_variable("v")))

[0.]
[1.]


## 3.2 TensorFLow数据模型——张量

In [1]:
# 在tensorflow中张量只是对计算结果的引用，在张量中没有真正保存数字，而是保存的如何得到这些数字的计算过程
# 如一下代码中，向量加法不会得到结果，而会得到结果的一个引用

import tensorflow as tf

a = tf.constant([1.0, 2.0], name='a')
b = tf.constant([2.0, 3.0], name='b')
result = tf.add(a, b, name='add')
print(result)

Tensor("add:0", shape=(2,), dtype=float32)


Tensor("add:0", shape=(2,), dtype=float32)  
张量有三个属性:name, shape, type  
**name**: 是张量的唯一标识符，如果张量是计算节点输出的结果，张量的命名方式就为node:src_ouput的形式。其中node为节点名称，src_souput表示当前张量是来自节点的第几个输出，上面的“add:0”就说明了result这个张量是节点add的第一个输出结果(编号从0开始)  
**shape**: 是用来描述张量的维度信息，同numpy  
**type**: 是张量的数据类型，没一个张量会有一个唯一的类型。TensorFlow会对所有参与运算的张量进行类型检查  

## 3.3 TensorFlow运行模型——会话

In [1]:
# 会话是用来管理TensorFlow程序运行时所有资源，计算完成后需要关闭会话来帮组系统回收资源
# 使用会话的两种方式
# 第一种方式需要手动释放资源
import tensorflow as tf

a = tf.constant([1.0, 2.0], name='a', dtype='float32')
b = tf.constant([2.0, 3.0], name='b', dtype='float32')
result = tf.add(a, b, name='add')
sess = tf.Session()
sess.run(result)
sess.close()

In [2]:
# 第二种方式是使用python的上下文管理器
# 上下文管理器会自动释放资源
# 上下文管理器内的代码才能使用上下文管理器提供的变量
with tf.Session() as sess:
    sess.run(result)

In [3]:
# 通过默认会话计算张量的取值
sess = tf.Session()
with sess.as_default():
    print(result.eval())

[3. 5.]


In [4]:
# 以下代码也可以完成张量取值的功能
with tf.Session() as sess:
    sess.run(result)
    print(result.eval())

[3. 5.]


In [1]:
# TensorFlow提供了一种在交互环境下直接构建默认绘画的函数，tf.InteractiveSession，使用这个函数会自动将生成的会话注册到默认会话下
import tensorflow as tf
a = tf.constant([1.0, 2.0], name='a', dtype='float32')
b = tf.constant([2.0, 3.0], name='b', dtype='float32')
result = tf.add(a, b, name='add')
sess = tf.InteractiveSession()
print(result.eval())
sess.close()

[3. 5.]


## 3.4 TensorFlow实现神经网络

In [2]:
# 一个简单的前向传播的例子
import tensorflow as tf

w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1)) # 似乎可以用元组和列表的形式来表达向量的形状
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))

x = tf.constant([[0.7, 0.9]])

a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

sess = tf.Session()
sess.run(w1.initializer)
sess.run(w2.initializer)

print(sess.run(y))
sess.close()

[[3.957578]]


In [2]:
# TensorFlow提供了placeholder来方便数据输入网络，而不用产生大量的常量
import tensorflow as tf

w1 = tf.Variable(tf.random_normal((2, 3), stddev=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1))

# 定义placeholder作为存放数据的地方，类型是必须要定义的，维度可以不定义，但是维度确定可以减少出错的概率
x = tf.placeholder(tf.float32, shape=(1, 2), name='input')
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

sess = tf.Session()
init_op = tf.global_variables_initializer()
sess.run(init_op)

print(sess.run(y, feed_dict={x: [[0.7, 0.9]]}))
sess.close()

[[0.8544476]]


In [1]:
# placeholder对batch的数据也能很好的支持
import tensorflow as tf

w1 = tf.Variable(tf.random_normal((2, 3), stddev=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1))

# 定义placeholder作为存放数据的地方，类型是必须要定义的，维度可以不定义，但是维度确定可以减少出错的概率
# 为了方便batch计算，批量的维度可以定义为None，让其自适应
x = tf.placeholder(tf.float32, shape=(None, 2), name='input')
a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

sess = tf.Session()
init_op = tf.global_variables_initializer()
sess.run(init_op)

print(sess.run(y, feed_dict={x: [[0.7, 0.9], [0.1, 0.4], [0.5, 0.8], [0.4, 0.3]]}))
sess.close()

[[1.4373758 ]
 [0.14375882]
 [0.9910452 ]
 [0.86997384]]


In [5]:
# TensorFlow反向传播

y = tf.sigmoid(y)
cross_entropy = -tf.reduce_mean(y * tf.log(tf.clip_by_value(y, 1e-10, 1.0))
                                + (1 - y) * tf.log(tf.clip_by_value((1 - y), 1e-10, 1.0)))
learning_rate = 0.001
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy) # 反向传播优化方法

In [2]:
import tensorflow as tf
import numpy as np

batch_size = 8

w1 = tf.Variable(tf.random_normal((2, 3), stddev=1, seed=1))
w2 = tf.Variable(tf.random_normal((3, 1), stddev=1, seed=1))

x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')

a = tf.matmul(x, w1)
y = tf.matmul(a, w2)

y = tf.sigmoid(y)
cross_entropy = -tf.reduce_mean(y_ * tf.log(tf.clip_by_value(y, 1e-10, 1.0)) +
                               (1 - y_) * tf.log(tf.clip_by_value(1 - y, 1e-10, 1.0)))
train_step = tf.train.AdamOptimizer(0.001).minimize(cross_entropy)

rdm = np.random.RandomState(1)
datasets_size = 128
X = rdm.rand(datasets_size, 2)
Y = [[int(x1 + x2 < 1)] for (x1, x2) in X]

with tf.Session() as sess:
    init_op = tf.global_variables_initializer()
    sess.run(init_op)
    print(sess.run(w1))
    print(sess.run(w2))
    
    STEPS = 5000
    for i in range(STEPS):
        start = (i * batch_size) % datasets_size
        end = min(start+batch_size, datasets_size)
        
        sess.run(train_step, feed_dict={x: X[start: end], y_: Y[start: end]})
        
        if i % 1000 == 0:
            total_cross_entropy = sess.run(cross_entropy, feed_dict={x: X, y: Y})
            print('After {} training step(2), cross entropy on all data is {}'.format(i, total_cross_entropy))
            
    print(sess.run(w1))
    print(sess.run(w2))

TypeError: placeholder() got multiple values for argument 'dtype'