# 机器学习与社会科学应用

# 第七章 神经网络

# 第二节 卷积神经网络

<font face="宋体" >郭峰    
    教授、博士生导师  
上海财经大学公共经济与管理学院  
上海财经大学数实融合与智能治理实验室    
    邮箱：guofengsfi@163.com</font> 

<font face="宋体" >本节目录：  
2.1.导入模块    
2.2.加载数据  
2.3.预处理数据  
2.4.定义模型结构  
2.5.编译  
2.6.训练  
2.7.评估模型</font> 

## 2.1.导入模块

In [None]:
from keras.models import Sequential  #from keras.models import Sequential
#接下来，我们导入各种层(各种形状各异积木)
from keras.layers import Conv2D, MaxPool2D
from keras.layers import Dense, Flatten

#最后，我们导入to_categorical函数，以便之后对数据进行转换
#from keras.utils import to_categorical

import tensorflow as tf

## 2.2.加载数据

In [None]:
#MNIST是一个非常有名的手写数字数据集，我们可以使用Keras轻松加载它
from keras.datasets import mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
print(x_train.shape)# (60000, 28, 28) 60000个样本，它们都是28像素x28像素的

In [None]:
#看一下这些手写数字长什么样
import matplotlib.pyplot as plt
%matplotlib inline
plt.imshow(x_train[0])

## 2.3.预处理数据

In [None]:
#使用Keras是必须显式声明输入图像深度的尺寸。例如，具有所有3个RGB通道的全色图像的深度为3。
#我们的MNIST图像的深度为1，但我们必须明确声明。
#也就是说，我们希望将数据集从形状(n,rows,cols)转换为(n,rows,cols,channels)。
img_x, img_y = 28, 28
x_train = x_train.reshape(x_train.shape[0], img_x, img_y, 1)
x_test = x_test.reshape(x_test.shape[0], img_x, img_y, 1)

In [None]:
#除此之外，我们将数据标准化一下：
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
x_train /= 255
x_test /= 255

In [None]:
#将标记值(y_train, y_test)转换为One-Hot Encode的形式
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)
print(y_train.shape) # (60000, 10)

## 2.4.定义模型结构

In [None]:
model = Sequential()
model.add(Conv2D(32, kernel_size=(5,5), activation='relu', input_shape=(img_x, img_y, 1))) #一层卷积层，包含了32个卷积核，大小为5*5
model.add(MaxPool2D(pool_size=(2,2), strides=(2,2)))  #一个最大池化层，池化大小为2*2
model.add(Conv2D(64, kernel_size=(5,5), activation='relu'))  #添加一个卷积层，包含64个卷积和，每个卷积核仍未5*5
model.add(MaxPool2D(pool_size=(2,2), strides=(2,2))) #一个最大池化层，池化大小为2*2
model.add(Flatten())  #压平层
model.add(Dense(1000, activation='relu'))   #来一个全连接层
model.add(Dense(10, activation='softmax'))  #最后为分类层

In [None]:
#另一个定义
# build the neural net 建模型(卷积—relu-卷积-relu-池化-relu-卷积-relu-池化-全连接)
#model = Sequential()
#model.add(Conv2D(32, kernel_size=(3, 3),
#                 activation='relu',
#                 input_shape=input_shape)) # 32个过滤器，过滤器大小是3×3，32×26×26
#model.add(Conv2D(64, (3, 3), activation='relu')) #64×24×24
#model.add(MaxPooling2D(pool_size=(2, 2)))# 向下取样
#model.add(Dropout(0.25))
#model.add(Flatten()) #降维：将64×12×12降为1维（即把他们相乘起来）#
#model.add(Dense(128, activation='relu'))
#model.add(Dropout(0.5))
#model.add(Dense(num_classes, activation='softmax')) #全连接2层


## 2.5.编译

In [None]:
#现在，只需要编译模型，就可以开始训练了。当编译模型时，我们声明了损失函数和优化器（SGD，Adam等）。
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

## 2.6.训练

In [None]:
model.fit(x_train, y_train, batch_size=128, epochs=10)

## 2.7.评估模型

In [None]:
score = model.evaluate(x_test, y_test)
print('acc', score[1]) # acc 0.9926