[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/zhujisheng/learn_python/blob/master/12.TensorFlow从入门到熟练/2.图像分类——多层神经网络.ipynb)

[《Python应用实战》视频课程](https://study.163.com/course/courseMain.htm?courseId=1209533804&share=2&shareId=400000000624093)

# 图像分类——多层神经网络

难度：★★★★☆

*判断一张图片中的内容，属于哪个类别的物体。*

## Fashion-MNIST

### 数据内容

![Fashion-MNIST](images/fashion-mnist-sprite.png)

- 70000张图片与标记
    - 60000张属于训练集
    - 10000张属于测试集
- 每张图片大小为28*28，256灰度
- 图片标记

  |标记|描述|
  |:------:|:------:|
  |0|T-shirt/top|
  |1|Trouser|
  |2|Pullover|
  |3|Dress|
  |4|Coat|
  |5|Sandal|
  |6|Shirt|
  |7|Sneaker|
  |8|Bag|
  |9|Ankle boot|


### 加载数据

In [None]:
import tensorflow as tf
import tensorflow.keras as keras

mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [None]:
# 查看training_images和training_labels的形状
print(train_images.shape)
print(train_labels.shape)

In [None]:
# 训练集中第一张图片的数据
train_images[0]

In [None]:
# 训练集中第一张图片
import matplotlib.pyplot as plt
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.show()

In [None]:
# 训练集中第一张图片的label
train_labels[0]

### 数据预处理

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

## 神经网络的建模、编译与训练

#### 建模

![分类神经网络](images/category_nn.png)

In [None]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(128, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

  + relu

    Rectified Linear Unit, 整流线性单位函数
        
    $f(x)=max(0,x)$
    
  + softmax
  
    归一化指数函数，调整数组中每个元素的值，使每一个元素的范围都在(0,1)之间，并且所有元素的和为1
    
    $f(x)_{i} = \frac{e^{x_{i}}}{\sum_{j} e^{x_{j}}}$


#### 模型编译

In [None]:
model.compile(loss='sparse_categorical_crossentropy',
              optimizer='adam',
              #metrics=['accuracy']
              )

  + sparse_categorical_crossentropy

    categorical cross entropy, 多分类交叉熵，计算两个概率分布之间的距离
    
    sparse，表示训练集中结果数据由单个整数表示（属于第几类），而不是概率数组
    
    $CE = -\sum_{i}y_{i} log (\widehat{y}_{i})$

  + adam

    Adaptive Moment Estimation, 一种梯度下降
    

#### 模型训练

In [None]:
model.fit(train_images, train_labels, epochs=10)

#### 模型评估

In [None]:
# 使用验证集进行评估
model.evaluate(test_images, test_labels)

In [None]:
# 准确率
predictions = model.predict(test_images)
i=0
n=0
for p in predictions:
    if p.argmax()==test_labels[i]:
        n += 1
    i += 1
print(n/i)

## 模型摘要

![分类神经网络](images/category_nn.png)

In [None]:
model.summary()

- 第一层

  将28*28的矩阵，转化为784长度的一维数组，无参数
  
- 第二层

  每一个神经元有784个输入，需要784个权重（w），加上一个偏移量（b），总共有785个参数
  785*128 = 100480
  
- 第三层

  每一个神经元有128个输入，需要128个权重（w），加上一个偏移量（b），总共有129个参数
  
  129*10 = 1290
  
总计：100480+1290=101770个参数