# Tensorflow介绍
   TensorFlow 2.0 网站将该项目描述为“端到端开源机器学习平台”。实际上 TensorFlow 已进化成为一个更全面的“工具、库和社区资源生态系统”，可帮助研究人员构建和部署人工智能助力的应用。
TensorFlow 2.0 有四大组成部分：
- TensorFlow 核心，一个用于开发和训练机器学习模型的开源库；
- TensorFlow.js，一个用于在浏览器和 Node.js 上训练和部署模型的 JavaScript 库；
- TensorFlow Lite，一个轻量级库，用于在移动和嵌入式设备上部署模型；
- TensorFlow Extended，一个在大型生产环境中准备数据、训练、验证和部署模型的平台。

TensorFlow 2.0 生态系统包括对 Python、JavaScript 和 Swift 的支持，以及对云、浏览器和边缘设备的部署支持。TensorBoard（可视化）和 TensorFlow Hub（模型库）都是很有用的工具。TensorFlow Extended（TFX）则支持端到端生产流水线。[参考](http://baijiahao.baidu.com/sid=1640756159447567798&wfr=spider&for=pc)
# 为什么会有这个？
   Tensorflow2.0现在已经发布，相比1.x版本有很多显著的改善，作为深度学习新手。tensorflow2.0更加简单上手，本教程[参考](https://github.com/czy36mengfei/tensorflow2_tutorials_chinese)里面的代码对我来说较难理解我对里面的代码进行复现和进一步的讲解，对新手更加友好，如果自己水平有所提升可以参考原教程。


# 更简洁——Keras
   keras原本是独立于Tensorflow的高级API可以实现跨平台的模型部署，其后端可以是tensorflow。谷歌将Keras收购后，作为其官方的API并入到Tensorflow2.0中，tf.keras与keras并不完全相同（import keras ≠ from tensorflow import keras）独立的keras在以后将逐渐淡出人们的视野。
   
## tf.keras 可以运行任何与 Keras 兼容的代码，但请注意：
最新版 TensorFlow 中的 tf.keras 版本可能与 PyPI 中的最新 keras 版本不同。请查看 tf.keras.version。
保存模型的权重时，tf.keras 默认采用检查点格式。请传递 save_format='h5' 以使用 HDF5。[官方介绍](https://tensorflow.google.cn/guide/keras)

# 导入keras

In [2]:
import tensorflow as tf
from tensorflow import keras
print(tf.__version__)
print(keras.__version__)

2.0.0-rc1
2.2.4-tf


# 更方便
   如果接触过pytorch，相比pytorch，发现tensorflow 1.x版本过于复杂，比如计算图的定义，会话的定义。在tensorflow 2.0版本中更加方便的应用。

In [3]:
variable1 = tf.constant(3)
variable2 = tf.constant(2)

result = tf.add(variable1, variable2)
print(result)

tf.Tensor(5, shape=(), dtype=int32)


# 1一般网络的配置
   tensorflow 2.0使用keras可以堆叠式的建立模型。一般分为四个步骤：
- 1.网络的定义
- 2.模型的编译
- 3.喂入数据
- 4.定义其他操作（模型的保存，模型参数的可视化）

 ## 1.1生成数据
 在建立模型之前，一般会对所要训练的数据进行整理。

In [3]:
import numpy as np

train_x = np.random.random((1000, 72))
train_y = np.random.random((1000, 10))

val_x = np.random.random((200, 72))
val_y = np.random.random((200, 10))

## 1.2设置训练流程
在 Keras 中，您可以通过组合层来构建模型。模型（通常）是由层构成的图。最常见的模型类型是层的堆叠：tf.keras.Sequential 模型。

In [45]:
# 1 定义网络
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(32, activation='relu'))
model.add(tf.keras.layers.Dense(32, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# 2.模型编译——使用compile
model.compile(optimizer=tf.keras.optimizers.Adam(0.001),
             loss=tf.keras.losses.categorical_crossentropy,
             metrics=[tf.keras.metrics.categorical_accuracy])

# # 3.喂入数据
model.fit(train_x, train_y, epochs=10, batch_size=100,
          validation_data=(val_x, val_y))

# 4.其他操作——可视化模型结构
model.summary()

Train on 1000 samples, validate on 200 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Model: "sequential_35"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_105 (Dense)            multiple                  2336      
_________________________________________________________________
dense_106 (Dense)            multiple                  1056      
_________________________________________________________________
dense_107 (Dense)            multiple                  330       
Total params: 3,722
Trainable params: 3,722
Non-trainable params: 0
_________________________________________________________________


## 1.3API介绍
### tf.keras.Sequential():初始化模型，可以传入参数，也可以不传入，传入的参数是一个包含layer的列表。
### tf.keras.layers.Dense():定义全连接层，运算逻辑：Y = W·X+b，  
- **activation**：要使用的激活函数。如果您未指定任何内容，则不会应用任何激活（即“线性”激活：）a(x) = x，
- **use_bias**：布尔值，层是否使用偏差矢量。即是否在进行W·X后加上偏置b。
- **kernel_initializer**：权重矩阵的初始化程序。
- **bias_initializer**：偏置向量的初始化程序。
- **kernel_regularizer**：正则化函数应用于kernel权重矩阵，L1或者L2正则化。。
- **bias_regularizer**：正则化函数应用于偏差向量，L1或者L2正则化。

### tf.keras.Model.compile() ：编译模型，tf.keras.Model一般是你定义的模型名字。
- **optimizer**：此对象会指定训练过程。从 tf.keras.optimizers 模块向其传递优化器实例，例如 tf.keras.optimizers.Adam、tf.keras.optimizers.SGD,
- **loss**：要在优化期间最小化的函数。常见选择包括均方误差 (mean_squared_error：mse)、categorical_crossentropy 和 binary_crossentropy。损失函数由名称或通过从 tf.keras.losses 模块传递可调用对象来指定。比如：tf.keras.losses.categorical_crossentropy（交叉熵准确率）。
- **metrics**：用于监控训练。它们是 tf.keras.metrics 模块中的字符串名称或可调用对象。
- **optimizer列举：**

算法|字符表示|对象表示
:-|:-:|:-:
Adam|'adam'|tf.keras.optimizers.Adam
SGD|'SGD'|tf.keras.optimizers.SGD

- **loss列举:**

算法|字符表示|对象表示
:-|:-:|:-:
交叉熵 |'categorical_crossentropy'|tf.keras.losses.categorical_crossentropy
二分类交叉熵|'binary_crossentropy'|tf.keras.losses.binary_crossentropy
MSE|'mse'|tf.keras.losses.mean_squared_error,tf.keras.losses.mse,tf.keras.metrics.MSE
mae|'mae'|tf.losses.MAE,tf.losses.mae,tf.losses.mean_absolute_error

### tf.keras.Model.fit()：喂入数据。
- **epochs**：以周期为单位进行训练。一个周期是对整个输入数据的一次迭代（以较小的批次完成迭代）。
- **batch_size**：当传递 NumPy 数据时，模型将数据分成较小的批次，并在训练期间迭代这些批次。此整数指定每个批次的大小。请注意，如果样本总数不能被批次大小整除，则最后一个批次可能更小。
- **validation_data**：在对模型进行原型设计时，可以轻松监控该模型在某些验证数据上达到的效果。输入此参数（输入和标签元组）可以让该模型在每个周期结束时显示所传递数据的损失和指标。

### 其他喂入数据的方法：tf.data.Dataset


In [38]:
# 1 定义网络
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(32, activation='relu'))
model.add(tf.keras.layers.Dense(32, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='softmax'))

# 2.模型编译——使用compile
model.compile(optimizer=tf.keras.optimizers.Adam(0.001),
             loss=tf.keras.losses.categorical_crossentropy,
             metrics=[tf.keras.metrics.categorical_accuracy])

# # 3.喂入数据_2

dataset = tf.data.Dataset.from_tensor_slices((train_x, train_y)) # 生成一个数据
dataset = dataset.batch(100)
dataset = dataset.repeat()
print(dataset)

model.fit(dataset, epochs=10, steps_per_epoch=10)



# # 4.其他操作——可视化模型结构
model.summary()

<RepeatDataset shapes: ((None, 72), (None, 10)), types: (tf.float64, tf.float64)>


To change all layers to have dtype float64 by default, call `tf.keras.backend.set_floatx('float64')`. To change just this layer, pass dtype='float64' to the layer constructor. If you are the author of this layer, you can disable autocasting by passing autocast=False to the base Layer constructor.

Train for 10 steps
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Model: "sequential_34"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_102 (Dense)            multiple                  2336      
_________________________________________________________________
dense_103 (Dense)            multiple                  1056      
_________________________________________________________________
dense_104 (Dense)            multiple                  330       
To

### 注意：一般在进行批次训练时经常有三个参数容易弄混：
- 批大小：batch_size,默认32
- 训练轮数：epochs，
- 批个数：steps_per_epoch，steps_per_epoch=总样本数（all_samples) / 批大小(batch_size）

现在用的优化器SGD是stochastic gradient descent的缩写，但不代表是一个样本就更新一回，还是基于mini-batch的。
那 batch epoch iteration代表什么呢？
- （1）batchsize：批大小。在深度学习中，一般采用SGD训练，即每次训练在训练集中取batchsize个样本训练；
- （2）iteration：1个iteration等于使用batchsize个样本训练一次；
- （3）epoch：1个epoch等于使用训练集中的全部样本训练一次，通俗的讲epoch的值就是整个数据集被轮几次。

比如训练集有500个样本，batchsize = 10 ，那么训练完整个样本集：iteration=50，epoch=1.

作者：bboysky45 
来源：CSDN 
原文：https://blog.csdn.net/qq_18668137/article/details/80883350 
版权声明：本文为博主原创文章，转载请附上博文链接！

官方网站上，阐述了 repeat 在 shuffle 之前使用可以有效提高性能，但是模糊了数据样本的 epoch 实际上，可以这样理解shuffle取之前已经重置了源数据集， 即先repeat，后shuffle。tf会将数据集乘以repeat次数，然后整个打乱一次，把它当作一个数据集。

## 1.4模型的评估与预测
训练好模型后可以对模型进行评估,使用的API时是：model.evaluate()

In [48]:
# 模型的评估
test_x = np.random.random((1000, 72))
test_y = np.random.random((1000, 10))
test_data = tf.data.Dataset.from_tensor_slices((test_x, test_y))
test_data = test_data.batch(32).repeat()
model.evaluate(test_data, steps=30)



[72.8322021484375, 0.09791667]

In [49]:
# 模型的预测
result = model.predict(test_x, batch_size=32)
print(result)

[[3.8827932e-04 4.6541311e-07 1.7521141e-21 ... 8.7908869e-13
  4.3893911e-10 1.7103927e-04]
 [3.1108255e-04 2.0661598e-07 1.6624059e-21 ... 4.2849480e-13
  5.3313892e-10 2.3800629e-04]
 [1.3693042e-04 2.1717564e-07 2.8686385e-22 ... 2.6706458e-13
  3.3628944e-10 1.3130548e-04]
 ...
 [5.6340022e-04 2.2013110e-06 5.8089653e-19 ... 3.2290354e-11
  7.3468160e-09 3.4577397e-04]
 [5.0389755e-04 1.0036985e-06 1.3823169e-19 ... 7.2727219e-12
  4.2529877e-09 5.0028716e-04]
 [6.1346550e-04 7.8577131e-07 3.4149053e-19 ... 7.8434672e-12
  5.0080353e-09 5.5151404e-04]]
