# 神经网络与tensorflow



## tensorflow介绍

TensorFlow 是一个用于人工智能的开源神器。

TensorFlow是一个采用数据流图（data flow graphs），用于数值计算的开源软件库。

它灵活的架构让你可以在多种平台上展开计算，例如台式计算机中的一个或多个CPU（或GPU），服务器，移动设备等等。

TensorFlow 最初由Google大脑小组的研究员和工程师们开发出来，用于机器学习和深度神经网络方面的研究，但这个系统的通用性使其也可广泛用于其他计算领域。


使用 TensorFlow, 你必须明白 TensorFlow:

- 使用图 (graph) 来表示计算任务；
- 图中的节点被称为op（operation）；
- 在被称之为 会话 (Session) 的上下文 (context) 中执行图；
- 使用 tensor (也叫张量、数组)表示数据；
- 每个tensor是一个类型化的多维数组；
  + 例如, 你可以将一小组图像集表示为一个四维浮点数数组, 这四个维度分别是[batch, height, width, channels].
  
- 一个节点可以获得0个或多个tensor（数据）进行计算，产生0或多个tensor;
- 通过变量 (Variable) 维护状态.
- 使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据.



一个 TensorFlow 图描述了计算的过程. 为了进行计算, 图必须在会话里被启动。

会话将图的 op 分发到诸如 CPU 或 GPU 之类的设备上, 同时提供执行 op 的方法. 这些方法执行后, 将产生的 tensor 返回。

在 Python 语言中, 返回的 tensor 是 numpy ndarray 对象。

让我们先看一段使用 Python API 撰写的 TensorFlow 示例代码, 对将要学习的内容有初步的印象.


## 使用 tensorflow 实现神经网络学习器的过程

1. 准备数据;
2. 定义节点准备接收数据;
3. 定义隐藏层和输出层；
4. 定义损失函数；
5. 选定优化器，设定训练方法（使损失最小化）；
6. 对所有变量进行初始化，在会话中运行优化器，迭代1000次进行反馈学习。


### 定义神经网络层的构建方法

用tf.Variable定义变量。

In [18]:
import tensorflow as tf
import numpy as np

# 先写一个添加层的函数（可以一会儿再理解它）
def add_layer(inputs, in_size, out_size, activation_function=None):
    # 增加一个以上的层，并返回该层的输出。
    # 下面定义了神经元相关的权重、阈值、激活函数 
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))# 初始化连接权重
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)# 初始化阈值
    Wx_plus_b = tf.matmul(inputs, Weights) + biases #matmul指矩阵乘法,这里实际上定义了前向传播过程
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs

### 准备数据

In [19]:
x_data = np.linspace(-1,1,300)[:, np.newaxis]# 生成300个数据，并将其变成2维数组
noise = np.random.normal(0, 0.05, x_data.shape)
y_data = np.square(x_data) - 0.5 + noise

### 定义节点准备接收数据

在 TensorFlow 中用placeholder 来描述等待输入的节点，需要指定类型。

在执行节点的时候用一个字典“喂”这些节点。相当于先把变量 hold 住，然后每次从外部传入data，注意 placeholder 和 feed_dict 是绑定用的。

In [20]:
# define placeholder for inputs to network  
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])

### 定义隐藏层和预测层

In [21]:
# add hidden layer 输入值是 xs，在隐藏层有 10 个神经元   
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)
# add output layer 输入值是隐藏层 l1，在预测层输出 1 个结果
prediction = add_layer(l1, 10, 1, activation_function=None)


### 定义损失函数

In [22]:
# the error between prediciton and real data    
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction),
                     reduction_indices=[1]))

### 选择 optimizer 使 loss 达到最小    

这里选择梯度下降（ Gradient Descent）这个最基本的优化器（ Optimizer）。

神经网络的核心思想是让损失达到最小，所以训练步骤被直接定义为利用优化器使误差最小。

In [23]:
# 这一行定义了用什么方式去减少 loss，学习率是 0.1       
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)

### 对所有变量进行初始化、调整

经过前面的定义，下面在运行模型前要初始化所有变量。

In [24]:
init = tf.initialize_all_variables()
sess = tf.Session()
# 上面定义的都没有运算，直到 sess.run 才会开始运算
sess.run(init)

# 迭代 1000 次学习，sess.run optimizer
for i in range(1000):
    # training train_step 和 loss 都是由 placeholder 定义的运算，所以这里要用 feed 传入参数
    sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
    if i % 50 == 0:
        # 每50步打印输出一次，查看优化结果：损失函数的大小
        print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))

0.90379447
0.023425106
0.008540405
0.005533939
0.0047564385
0.004226727
0.0039068772
0.0037330973
0.003620305
0.0035491674
0.0034944979
0.0034243346
0.0033819024
0.0033533971
0.0033129738
0.0032618728
0.0032105844
0.0031465753
0.0030816204
0.0030348361
