# 线性回归

导入numpy、matplotlib库

In [None]:
import numpy as np # 导入numpy库
import matplotlib.pyplot as plt # 导入matplotlib库

生成需要拟合的线性数据

In [None]:
x = np.array([1, 2, 3])
y = 2 * x + 1

第一步：确定模型，定义一个一次函数(即只有一个参数的线性函数)作为预测函数

线性模型 y = wx + b

需要学习的参数是 w 和 b，初始化都为 0

### todo1:画出数据点

In [None]:
???

定义预测函数

In [None]:
w = 0
b = 0
def predict(x):
    return w * x + b

第二步：定义损失函数，衡量预测值与真实值之间的误差

求该线性回归模型的损失函数，这里使用均方误差除以2，即 $\frac{1}{2N}\sum_{i=1}^N{(y\_predict-y)^2}$

### todo2:根据给出的损失函数的公式，写出该损失函数

In [None]:
y_predict = predict(x)

def MSE(y_predict, y):
    return ??? # 提示：np.mean的作用就是求平均，这里是把所有的平方差加起来求平均

输出当前 w 和 b 下损失函数的值，并尝试不同的 w 和 b

In [None]:
MSE(predict(x), y)  

### todo3：将循环内更新梯度的部分补全

In [None]:
w = 0
b = 0
learning_rate = .01               
loss_list = []                    
for i in range(50):
    d_w = (y - predict(x)) @ -x   
    d_b = np.sum(predict(x) - y)  
    ???      # 更新w(为了降低loss则减去梯度，增加loss则加上梯度)
    ???      # 更新b    
    loss = MSE(predict(x), y)     
    loss_list.append(loss)        
    print("w: %.4f, b: %.4f, loss: %.4f" % (w, b, loss))      # 输出更新后的w,b以及loss            

可视化loss每一步变化

In [None]:
???

# 梯度下降

### todo4：尝试用梯度下降法对不同的损失函数进行优化，写出目标函数的梯度，尝试不同的初始化参数和学习率

定义损失函数并画出

In [None]:
import numpy as np # 导入numpy库
import matplotlib.pyplot as plt # 导入matplotlib库

def f(x):                    # 目标(损失)函数               
    return x ** 4 + x ** 3 - 20 * x ** 2 + x + 1

def d(x):                    # 梯度 d(x) 
    return ???  

x = np.linspace(-5, 5, 101)  # 画出损失函数                
y = f(x)
plt.plot(x, y)
plt.title("loss")

可视化梯度下降过程

In [None]:
from IPython.display import display, clear_output             
x_start = -2             
learning_rate = 0.1      
step = 10                
for i in range(step):
    x_start = x_start - learning_rate * d(x_start)         
    plt.title("x: %.4f, y: %.4f" % (x_start, f(x_start)))  
    plt.plot(x, y)                                         
    plt.plot(x_start, f(x_start), 'ro')                     
    plt.show()
    clear_output(wait=True)                                
    plt.pause(0.5)  

### 思考：刚刚的一次线性函数能否可以将这两类点分开

## Keras 搭建 MLP(多层感知机/神经网络)

首先我们导入一些必要的库，我们主要会用到keras库。
- Sequential: keras线性模型框架，可以理解为积木的模板
- 神经网络中的一些常用层
    - Dense: 全连接层
    - Activation：激活层
    - Flatten: 平铺层（二维转一维）
    - Dropout：随机失活层
- 优化器optimizers：优化网络参数

In [None]:
from keras.models import Sequential                               
from keras.layers import Dense, Activation, Flatten, Dropout      
from keras.optimizers import SGD                                  

import numpy as np 
import matplotlib.pyplot as plt 

模型构建

In [None]:
x = np.array([
    [0, 0],
    [0, 1],
    [1, 0],
    [1, 1]
])
y = np.array([1, 0, 0, 1])

model = Sequential()                            
model.add(Dense(2))                   
model.add(Activation('sigmoid'))      
model.add(Dense(1))                   
model.add(Activation('sigmoid'))

编译模型

搭建完卷积神经网络后，我们定义一个优化器，用来找到使损失函数最小的权重，这里我们使用SGD优化器。
最后我们使用二分类的交叉熵作为损失函数，使用准确率作为度量指标，并完成模型的搭建。

In [None]:
model.compile(optimizer = SGD(lr = 1),      
              loss = 'binary_crossentropy', 
              metrics = ['accuracy'])       

模型训练

keras提供了fit函数来进行训练，将训练的输入与输出x,y传给fit函数，指定训练轮数为500轮。

In [None]:
history = model.fit(x, y, epochs=500)    

模型训练过程可视化

In [None]:
plt.plot(history.history["loss"])       
plt.plot(history.history["accuracy"])        

输出模型每层权重

In [None]:
for layer in model.layers:        
    print(layer.get_weights())    

### todo5：画出这个 MLP，并标出这些权重是如何对应的（哪条边上的权重）

# 用 MLP 识别 MNIST 数据集

数据读取 (*这里数据读取时，需要注意路径名是否正确，当添加多个数据集时，input会为每一个数据集建一个文件夹*)

In [None]:
import pandas as pd                                                  
import numpy as np  
mnist_dir = "../input/youthaiimageclassification/"
mnist_train = pd.read_csv(mnist_dir + "mnist_train.csv")   
mnist_test = pd.read_csv(mnist_dir + "mnist_test.csv")          
x_train = np.array(mnist_train.iloc[:, 1:]).reshape(-1, 28, 28)      
y_train = np.array(mnist_train.iloc[:, 0])                           
x_test = np.array(mnist_test.iloc[:, 1:]).reshape(-1, 28, 28)        
y_test = np.array(mnist_test.iloc[:, 0])                             

num_classes = 10  

从x_train和y_train的形状可以看到训练数据中包含了60000个数据点，其中输入x是60000张28x28=784像素组成的图像，由于MNIST数据集是灰度图，所以每个像素仅由一个数字表示；输出y是60000个数字，代表了每一张图像对应的数字几。测试数据x_test和y_test中则包含了10000个数据点。

数据预处理

In [None]:
from keras.models import Sequential                               
from keras.layers import Dense, Activation, Flatten, Dropout      
from keras.optimizers import SGD                                  
import matplotlib.pyplot as plt 
from keras.utils import to_categorical

x_train = x_train / 255       
x_test = x_test / 255          
y_train = to_categorical(y_train, num_classes)  
y_test = to_categorical(y_test, num_classes)

原本的输入数据中每个像素是0-255的整数，但是对于神经网络的输入，我们一般希望将输入转化到0-1左右的较小的数字，所以我们将输入数据除以255。另外对于输出数据，我们不再简单的用一个数字来表示。对于多分类问题，我们往往采用独热编码作为输出。keras提供了一个方便的函数to_categorical来完成这个变换。

模型构建

In [None]:
model = Sequential()                           
model.add(Flatten(input_shape = (28, 28)))     
model.add(Dense(20, activation = 'relu'))      
model.add(Dense(20, activation = 'relu'))      
model.add(Dense(num_classes, activation = 'softmax')) 

In [None]:
model = Sequential()                           
model.add(Flatten(input_shape = (28, 28)))     
model.add(Dense(512, activation = 'relu'))     
model.add(Dropout(0.2))                        
model.add(Dense(512, activation = 'relu'))     
model.add(Dropout(0.2))                        
model.add(Dense(num_classes, activation = 'softmax')) 

模型各层详细信息可视化

keras提供了summary函数，方便查看模型每一层的结构，以及参数个数。

In [None]:
model.summary()  

模型编译

In [None]:
model.compile(loss='categorical_crossentropy',   
              optimizer="rmsprop",               
              metrics=['accuracy'])              

模型训练、评估

In [None]:
batch_size = 32        
epochs = 5             
history = model.fit(x_train, y_train, 
                    batch_size=batch_size,
                    epochs=epochs,
                    verbose=1,   
                    validation_data=(x_test, y_test))  
score = model.evaluate(x_test, y_test, verbose=0)      
print('Test loss:', score[0])     
print('Test accuracy:', score[1]) 

模型预测

In [None]:
model.predict(x_test[0:1]) 

# 用卷积神经网络 CNN 识别 CIFAR-10 数据集

模型构建

首先我们导入一些必要的库，我们主要会用到keras库。
- Sequential: keras线性模型框架，可以理解为积木的模板
- 卷积神经网络中的一些常用层
    - Dense: 全连接层
    - Flatten: 平铺层（二维转一维）
    - Conv2D: 二维卷积层
    - MaxPooling2D: 二维池化层

In [None]:
import pickle
with open("../input/youthaiimageclassification/cifar10.pkl", "rb") as f:
    (x_train, y_train), (x_test, y_test) = pickle.load(f)

    
from keras.models import Sequential                               
from keras.layers import Dense, Activation, Flatten, Dropout      
from keras.optimizers import SGD                                 
import matplotlib.pyplot as plt 
from keras.utils import to_categorical

print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)

# 数据预处理
???  # 训练数据归一化
???  # 测试数据归一化
num_classes = 10         # 数据一共有10类
???  # 将训练数据的标签独热编码
???  # 将测试数据的标签独热编码 

模型搭建

In [None]:
from keras.layers import Conv2D, MaxPooling2D  

model = Sequential()
model.add(Conv2D(16, (5, 5), padding='same',    
                 input_shape=x_train.shape[1:]))
model.add(Activation('relu'))                   
model.add(Conv2D(32, (5, 5)))                   
model.add(Activation('sigmoid'))                
model.add(MaxPooling2D(pool_size=(2, 2)))      
model.add(Dropout(0.25))                       

model.add(Conv2D(64, (5, 5), padding='same'))   
model.add(Activation('relu'))                   
model.add(MaxPooling2D(pool_size=(2, 2)))       
model.add(Dropout(0.25))                        

model.add(Flatten())
model.add(Dense(100))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes))
model.add(Activation('softmax'))

# 模型编译
model.compile(loss='categorical_crossentropy',  
              optimizer="adam",                 
              metrics=['accuracy'])             

模型训练

In [None]:
'''
batch_size = 32               
epochs = 5                    
history = model.fit(x_train, y_train,                  
                    batch_size=batch_size,
                    epochs=epochs,
                    verbose=1,                                     
                    validation_data=(x_test, y_test))   
score = model.evaluate(x_test, y_test, verbose=0)       
print('Test loss:', score[0])                           
print('Test accuracy:', score[1])                       
'''

### todo6:自己搭建一个卷积神经网络进行 CIFAR-10 数据集识别