# 一、损失函数方法补充

- 损失函数是用来评价模型的预测值和真实值之间的相差程度，通常损失函数的值越小，模型的性能越好。
- 损失函数分为经验损失函数和结构风险损失函数。经验损失函数指的是预测结果和实际结果的差别，结构风险损失函数指的是经验损失函数加正则项。

## 1、0-1损失函数
![1.png](attachment:1.png)

## 2、绝对值损失函数
![2.png](attachment:2.png)

## 3、log损失函数
![3.png](attachment:3.png)

## 4、平方损失函数
![4.png](attachment:4.png)

## 5、指数损失函数
![5.png](attachment:5.png)

## 6、Hinge损失函数
![6.png](attachment:6.png)

## 7、感知损失函数
![7.png](attachment:7.png)

## 8、交叉熵损失函数
![8.png](attachment:8.png)

# 二、损失函数Python代码实现

## 1、log损失函数

In [None]:
def logloss(y_true, y_pred, eps=1e-15):
    import numpy as np
    y_true = np.array(y_true)
    y_pred = np.array(y_pred)
    assert (len(y_true) and len(y_true) == len(y_pred))
    p = np.clip(y_pred, eps, 1-eps)
    loss = np.sum(- y_true * np.log(p) - (1 - y_true) * np.log(1-p))
    return loss / len(y_true)

## 2、平方损失函数

In [None]:
import numpy as np
def mean_squared_error(p,y):
    return np.sum((p-y)**2)/y.shape[0]

## 3、交叉熵损失函数

In [None]:
def cross_entropy_error(p,y):
    delta=1e-7
    return np.sum(-y*np.log(p+delta))

# 三、池化方法补充

- 池化（Pooling）是卷积神经网络中的一个重要的概念，它实际上是一种形式的降采样。有多种不同形式的非线性池化函数，而其中“最大池化（Max pooling）”是最为常见的。它是将输入的图像划分为若干个矩形区域，对每个子区域输出最大值。直觉上，这种机制能够有效的原因在于，在发现一个特征之后，它的精确位置远不及它和其他特征的相对位置的关系重要。池化层会不断地减小数据的空间大小，因此参数的数量和计算量也会下降，这在一定程度上也控制了过拟合。通常来说，CNN的卷积层之间都会周期性地插入池化层。

## 1、最大池化
![9.png](attachment:9.png)

## 2、均值池化
![10.png](attachment:10.png)

## 3、随即池化
![11.png](attachment:11.png)

# 四、数据增强方法修改及补充

## 1、翻转
![12.png](attachment:12.png)

## 2、旋转
![13.png](attachment:13.png)

## 3、缩放
![14.png](attachment:14.png)

## 4、裁剪
![15.png](attachment:15.png)

## 5、移位
![16.png](attachment:16.png)

# 五、图像分类方法综述

- 计算机视觉技术的三个层次
![17.png](attachment:17.png)

- 图像分类的基本流程
![18.png](attachment:18.png)

## 1、传统算法
- 底层特征提取: 通常从图像中按照固定步长、尺度提取大量局部特征描述。常用的局部特征包括SIFT(Scale-Invariant Feature Transform, 尺度不变特征转换) 、HOG(Histogram of Oriented Gradient, 方向梯度直方图) 、LBP(Local Bianray Pattern, 局部二值模式)等，一般也采用多种特征描述，防止丢失过多的有用信息。
- 特征编码: 底层特征中包含了大量冗余与噪声，为了提高特征表达的鲁棒性，需要使用一种特征变换算法对底层特征进行编码，称作特征编码。常用的特征编码方法包括向量量化编码、稀疏编码、局部线性约束编码、Fisher向量编码等。
- 空间特征约束: 特征编码之后一般会经过空间特征约束，也称作特征汇聚。特征汇聚是指在一个空间范围内，对每一维特征取最大值或者平均值，可以获得一定特征不变形的特征表达。金字塔特征匹配是一种常用的特征汇聚方法，这种方法提出将图像均匀分块，在分块内做特征汇聚。
- 通过分类器分类: 经过前面步骤之后一张图像可以用一个固定维度的向量进行描述，接下来就是经过分类器对图像进行分类。通常使用的分类器包括SVM(Support Vector Machine, 支持向量机)、随机森林等。而使用核方法的SVM是最为广泛的分类器，在传统图像分类任务上性能很好。

## 2、深度学习

- CNN
![19.png](attachment:19.png)

- VGG
![20.png](attachment:20.png)

- GoogleNet
![21.png](attachment:21.png)

- ResNet
![22.png](attachment:22.png)