在前面的学习中，我们假设训练样本是线性可分的，也就是存在一个划分超平面能将训练样本正确分类，那么如果训练样本是非线性的，不存在这样的划分超平面时，该如何解决呢？

譬如下面的异或问题就不是线性可分的：

<img src="../../images/xor-nonlinear.png" width="600px" />

我们在学习非线性回归的时候也遇到过类似这种问题，可以将样本从原始空间映射到一个更高维的特征空间，比如上图中我们将其映射到三维空间，这时就能找到合适的划分超平面。

令 $\phi(x)$ 表示 $x$ 映射后的特征向量，于是划分超平面可以表示为：

$$
f(x) = w^T\phi(x) + b
$$

优化目标可以写为：

$$
\begin{align}
&\mathop \min_{w,b} \frac{1}{2}\|w\|^2 \\
&s.t. y_i(w^T\phi(x_i) + b) \geq 1, i = 1,2,\dots,n
\end{align}
$$

其对偶问题为：

$$
\begin{align}
&\mathop \min_{\alpha} \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j \phi(x_i)^T \phi(x_j) - \sum_{i=1}^n \alpha_i \\
&s.t. \sum_{i=1}^n \alpha_i y_i = 0, \alpha_i \geq 0, i = 1,2,\dots,n
\end{align}
$$

上式中，$\phi(x_i)^T \phi(x_j)$ 表示样本 $x_i$ 和 $x_j$ 映射到特征空间之后的内积，由于特征空间维数可能很高，直接计算通常比较困难，可以设想这样一个函数：

$$
\kappa(x_i, x_j) = \langle \phi(x_i), \phi(x_j) \rangle = \phi(x_i)^T \phi(x_j)
$$

也就是 $x_i$ 和 $x_j$ 在特征空间的内积等于它们在原始样本空间中通过函数 $\kappa(\centerdot, \centerdot)$ 计算的结果，这个函数就是 **核函数**（kernel function）。

通过引入核函数，非线性支持向量机的优化目标就可以写成下面这种形式：

$$
\mathop \min_{\alpha} \frac{1}{2} \sum_{i=1}^n \sum_{j=1}^n \alpha_i \alpha_j y_i y_j \kappa(x_i, x_j) - \sum_{i=1}^n \alpha_i
$$

使用核函数解决非线性分类问题的思想被称为 **核技巧**（kernel trick），通过一个非线性变换将输入空间（欧式空间 $R^n$ 或离散集合）对应于一个特征空间（希尔伯特空间 $\mathcal{H}$），使得在输入空间中的超曲面模型对应特征空间中的超平面模型，这样，分类问题的学习任务通过在特征空间中求解线性支持向量机就可以完成。

那么这样的核函数是否存在呢？如果已知映射函数 $\phi(x)$，那么显然核函数可以通过映射函数的内积计算得到，如果不知道 $\phi(x)$ 的具体形式，核函数是否存在？什么样的函数可以当作核函数？

根据 **Mercer定理**，如果函数 $\kappa$ 是对称的，并且对任意的输入数据它对应的 **核矩阵**（kernel matrix）$K$ 总是 **半正定** 的，那么 $\kappa$ 就是一个核函数。核矩阵是由核函数构成的一个矩阵：

$$
K = 
\left [
\begin{array}{ccc}
\kappa(x_1, x_1) & \kappa(x_1, x_2) & \dots & \kappa(x_1, x_n) \\
\vdots & \vdots & \vdots & \vdots \\
\kappa(x_n, x_1) & \kappa(x_n, x_2) & \dots & \kappa(x_n, x_n)
\end{array} 
\right ]
$$

也就是说，对于任何一个半正定的核矩阵，总能找到一个与之对应的映射 $\phi$，对于任何一个核函数，都隐式的对应一个特征空间，这个特征空间被称为 **再生核希尔伯特空间**（Reproducing Kernel Hilbert Space，简称 RKHS 空间）。

关于核函数的概念，涉及很多泛函分析的概念，包括各种函数空间的概念，可以参考：[说一说核方法（一）——核方法与核函数简介](http://sakigami-yang.me/2017/08/13/about-kernel-01/)、[说一说核方法（二）——数学角度简介](http://sakigami-yang.me/2017/08/13/about-kernel-02/)。