# 利用神经网络来预测图像是狗狗概率

本项目使用了一个经过预处理后较小的数据集，数据集中仅含有图像的特征结果。对于如何获取图像的特征，这里附上了open cv中对于图像特征的说明。
http://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_feature2d/py_features_meaning/py_features_meaning.html


在该 notebook 中，我们基于以下三个特征来了解图像是狗狗的概率：

- Feature1
- Feature2
- Feature3

图像是否是狗狗，通过0，1来表示；
每一行代表一个图像，第一列：是否是狗狗；第二至第四列：feature1-3；

## 加载数据

为了加载数据并很好地进行格式化，我们将使用两个非常有用的包，即 Pandas 和 Numpy。 你可以在这里阅读文档：

- https://pandas.pydata.org/pandas-docs/stable/
- https://docs.scipy.org/

In [None]:
# Importing pandas and numpy
import pandas as pd
import numpy as np

# Reading the csv file into a pandas DataFrame
data = pd.read_csv('dog_data.csv')

# Printing out the first 10 rows of our data
data[:10]

## 绘制数据


首先让我们对数据进行绘图，看看它是什么样的。为了绘制二维图，让我们先忽略feature3。

In [None]:
# Importing matplotlib
import matplotlib.pyplot as plt

# Function to help us plot
def plot_points(data):
    X = np.array(data[["feature1","feature2"]])
    y = np.array(data["dog"])
    admitted = X[np.argwhere(y==1)]
    rejected = X[np.argwhere(y==0)]
    plt.scatter([s[0][0] for s in rejected], [s[0][1] for s in rejected], s = 25, color = 'red', edgecolor = 'k')
    plt.scatter([s[0][0] for s in admitted], [s[0][1] for s in admitted], s = 25, color = 'cyan', edgecolor = 'k')
    plt.xlabel('Feature_1')
    plt.ylabel('Feature_2')
    
# Plotting the points
plot_points(data)
plt.show()

粗略来说，这两个feature并没有很好地分离图像是不是狗狗。 也许将feature3考虑进来会有帮助？ 
接下来我们将绘制 4 个图，每个图代表一个级别。
因为feature3是离散型数据，每个图像的feature3为[1,2,3,4]中的一个数字，这里用Rank（等级）表示。

In [None]:
# Separating the ranks
data_rank1 = data[data["feature3"]==1]
data_rank2 = data[data["feature3"]==2]
data_rank3 = data[data["feature3"]==3]
data_rank4 = data[data["feature3"]==4]

# Plotting the graphs
plot_points(data_rank1)
plt.title("Rank 1")
plt.show()
plot_points(data_rank2)
plt.title("Rank 2")
plt.show()
plot_points(data_rank3)
plt.title("Rank 3")
plt.show()
plot_points(data_rank4)
plt.title("Rank 4")
plt.show()

现在看起，等级越高，图像是狗狗的概率越高。 让我们使用评级 (rank) 作为我们的输入之一。 为了做到这一点，我们应该对它进行一次one-hot 编码。

## 任务1: 将feature3进行 One-hot 编码
我们将在 Pandas 中使用 `get_dummies` 函数，根据todo的提示完成任务。

In [None]:
# TODO:  Make dummy variables for rank
one_hot_data = None

# TODO: Drop the previous rank column
one_hot_data = None

# Print the first 10 rows of our data
one_hot_data[:10]

## 任务2: 数据的标准化

下一步是缩放数据。 我们注意到feature2的范围是 1.0-4.0，而feature1的范围大概是 200-800，这个范围要大得多。 这意味着我们的数据存在偏差，使得神经网络很难处理。 让我们将两个特征放在 0-1 的范围内，将feature2除以 4.0，将feature1除以 800。

In [None]:
# Making a copy of our data
processed_data = one_hot_data[:]

# TODO: Scale the columns
processed_data['feature1'] = None
processed_data['feature2'] = None

# Printing the first 10 rows of our procesed data
processed_data[:10]

## 任务3: 将数据分成训练集和测试集

为了测试我们的算法，我们将数据分为训练集和测试集。 测试集的大小将占总数据的 10％。
可以使用numpy中的random choice函数来实现。

In [None]:
# TODO: separate dataset into train and test dataset, 10% of which is test dataset



print("Number of training samples is", len(train_data))
print("Number of testing samples is", len(test_data))
print(train_data[:10])
print(test_data[:10])

## 将数据分成特征和目标（标签）
现在，我们将把数据分为特征 (features)（X）和目标 (targets)（y），并把这里’dog‘标签去除。

In [None]:
features = train_data.drop('dog', axis=1)
targets = train_data['dog']
features_test = test_data.drop('dog', axis=1)
targets_test = test_data['dog']

print(features[:10])
print(targets[:10])

## 问题1-请双击文字来回答:

（请查阅资料回答我们）针对一个数据集的预处理，有哪些可行的数据清洗方式？

你的回答：

## 问题2

除了使用numpy.random.choice函数以外，还有哪些用于拆分训练集及验证集的方式？

你的回答：

## 任务4: 训练二层神经网络
下列函数会训练二层神经网络。 首先，我们将写一些 helper 函数，用于函数的正向传播。
- Sigmoid 激活函数

$$\sigma(x) = \frac{1}{1+e^{-x}}$$

- Sigmoid函数导数

$$\sigma'(x) = \sigma(x) * (1 - \sigma(x))$$

- 误差函数

$$Error(y, \hat{y}) = - y \log(\hat{y}) - (1-y) \log(1-\hat{y})$$

In [None]:
# TODO: Activation (sigmoid) function
def sigmoid(x):
    return None

def sigmoid_prime(x):
    return None

def error_formula(y, output):
    return None

# 任务5: 误差反向传播

现在轮到误差项的编写。 记住这是由方程 $$ -(y-\hat{y}) \sigma'(x) $$ 给出的。

In [None]:
# TODO: Write the error term formula
def error_term_formula(y, output):
    return None

# 任务6:编写权重更新函数的神经网络训练模型

之前已经把神经网络传播需要的函数都编写好了，下面来写我们最重要的神经网络更新函数吧！

In [None]:
# Training function
def train_nn(features, targets, epochs, learnrate):
    
    # Use to same seed to make debugging easier
    np.random.seed(42)

    n_records, n_features = features.shape
    last_loss = None

    # Initialize weights
    weights = np.random.normal(scale=1 / n_features**.5, size=n_features)

    for e in range(epochs):
        del_w = np.zeros(weights.shape)
        for x, y in zip(features.values, targets):
            # Loop through all records, x is the input, y is the target

            # TODO: forward Propagation
            # Activation of the output unit
            #   Notice we multiply the inputs and the weights here 
            #   rather than storing h as a separate variable 
            output = None

            # TODO: The error, the target minus the network output
            error = None
            
            # TODO:  Backward Propagation
            # The error term
            error_term = None

            # TODO: The gradient descent step, the error times the gradient times the inputs
            del_w += None

        # TODO: Update the weights here. The learning rate times the 
        # change in weights, divided by the number of records to average
        weights = None

        # Printing out the mean square error on the training set
        if e % (epochs / 10) == 0:
            
            # TODO: get model output
            out = None
            
            # TODO: get least square loss 
            loss = None
            
            print("Epoch:", e)
            
            # TODO: set last_loss = loss of previous iteration
            # compare last_loss and loss
            # if loss > last_loss, then print 'WARNING!- Loss Increasing'
            if :
                None
            else :
                None
    print("Finished training!")
    return weights
 

# 任务7: 调整参数来训练训练你的网络

在这里，你可以调整你的epochs以及learnrate来提高你的网络预测精度

# （可选任务）：绘制你的loss曲线来查看合适的参数设置

通过修改train_nn函数来输出你的loss值变化，判断参数设置的修改方案

In [None]:
# TODO: SET Neural Network hyperparameters
epochs = None
learnrate = None
weights = train_nn(features, targets, epochs, learnrate)

# 任务8: 计算测试 (Test) 数据的精确度

由于我们这个模型用于预测狗狗是图像的可能性，结果为二分法。
因此，我们使用model输出是否大于0.5来判断模型的预测结果是不是狗狗。

In [None]:
# TODO: Calculate accuracy on test data
tes_out = None
predictions = None
accuracy = None
print("Prediction accuracy: {:.3f}".format(accuracy))

## 有趣的狗狗图像

恭喜你！经过上面的神经网络训练，我们已经得到一个可以估计狗狗的网络了！

下面就演示如何使用一个神经网络来估算图像中狗狗的位置，在这里我们要使用一个卷积神经网络，以及一个已经训练好的结果。我们会在正式的课程里面详细给大家介绍卷积神经网络是如何使用的（可选课程）。

这里简单解释一下：
- 卷积神经网络会在图像中提取特征
- 训练好的网络会将图像特征分类为具体的物体

因此使用卷积神经网络提取特征之后，直接使用训练好的网络来得到分类物体就能得到如下的分类结果。很酷炫吧！

In [None]:
from ResNet_CAM import *
import glob

lists = glob.glob('images/*.png')

# TODO: Upload your image or pick up any image in the folder 'images/xx.png'
for img_path in lists:
    fig, (ax1, ax2) = plt.subplots(1,2)
    CAM = plot_CAM(img_path,ax1,ax2,fig)
    plt.show()