本章将讨论目标函数为一元单值函数 $f$:$\Bbb{R}\rightarrow \Bbb{R}$ 时的最小化优化问题(即一维问题)的迭代求解方法。

**本章将介绍一下算法**
- 黄金分割法(只使用目标函数值$f$)
- 斐波那契数列方法(只使用目标雨数值$f$)
- 二分法(只使用目标函数的一阶导数${f}'$)
- 割线法(只使用目标函数的一阶导数${f}'$)
- 牛顿法(同时使用目标函数一阶导数${f}'$和二阶导数${f}''$)

### 1. 黄金分割法

黄金分割法可用于求解一元单值函数$f$:$\Bbb{R}\rightarrow \Bbb{R}$在闭区间$[a_0,b_0]$上的极小点。后面的斐波拉契数列方法和二分法也是解决这类问题。<br>
**前提**<br>
- 目标函数$f$在区间$[a_0,b_0]$是单峰的。即存在唯一的局部极小点。如**7.1图**所示
![](https://gitee.com/data2world/OpimizationPhoto/raw/master/%E7%AC%AC7%E7%AB%A0/7-1.png)
黄金分割法的思路是比较压缩区间。通过不断地压缩来寻找极小点，如**7.2图**所示
![](https://gitee.com/data2world/OpimizationPhoto/raw/master/%E7%AC%AC7%E7%AB%A0/7-2-3.png)
在上图中，我们有：

$$
a_1-a_0=b_0-b_1=\rho(b_0-a_0)
$$

其中$\rho<\frac{1}{2}$

$$
f(n)= \begin{cases} [a_0, b_1], & \text {if $f(a_1)<f(b_1)$ } \\ [a_1, b_0], & \text{if $f(a_1)\geq f(b_1)$} \end{cases} 
$$

**一般性推导：**
假设初始区间$[a_0,b_0]$的长度为1。由**7.4图**可知
![](https://gitee.com/data2world/OpimizationPhoto/raw/master/%E7%AC%AC7%E7%AB%A0/7-4.png)

- $b_0-a_0$的长度是1。
- 

## 3 斐波拉契数列法

黄金分割法在压缩过程中，参数$\rho$始终保持不变。而斐波拉契数列法允许参数不断调整。


![](https://gitee.com/data2world/OpimizationPhoto/raw/master/%E7%AC%AC7%E7%AB%A0/7-5.png)

## 4 二分法

## 5 牛顿法
牛顿法的迭代公式如下：
$$
x^{(k+1)}=x^{(k)}-\frac{{f}'(x^{(k)})}{{f}''(x^{(k)})}
$$

In [None]:
def f(x):
    return 1/2.*

In [1]:
def dx(f, x):
    return abs(0-f(x))

def newtons_method(f, df, x0, e):
    delta = dx(f, x0)
    while delta > e:
        x0 = x0 - f(x0)/df(x0)
        delta = dx(f, x0)
    print 'Root is at: ', x0
    print 'f(x) at root is: ', f(x0)

In [13]:
from __future__ import division
from sympy import *
x=Symbol("x")
print type(diff((1/2*x**2-sin(x)),x))
fx = diff(diff((1/2*x**2-sin(x)),x), x)

<class 'sympy.core.add.Add'>


In [15]:
fx.

sin(x) + 1.0

## 割线法


## 划界法

### 算法说明

**前面的优化方法都有一个前提，就是需要一个初始的区间**， 而寻找这个初始区间的方法，我们叫做**划界法**。划界法的算法步骤如下：

**输入：单峰函数；任选三个点满足：$x_0<x_1<x_2$<br>
输出：初始区间**
1. 计算$f(x_0), f(x_1), f(x_2)$
2. 如果$f(x_1)<f(x_0)且f(x_1)<f(x_2)$，那么停止计算，极小点就在这个初始区间内 
3. 如果$f(x_0)>f(x_1)>f(x_2)$，则选择一个点$x_3>x_2$,检查$f(x_3)>f(x_2)$是否成立，如果成立，极小点就是在区间$[x_1, x_3]$中。否则，重复这个过程直到成立。**新点的选择与上一个点最好成倍增的关系，如下图所示**

![](https://gitee.com/data2world/OpimizationPhoto/raw/master/%E7%AC%AC7%E7%AB%A0/7-11.png)

### 算法实现

In [36]:
def Bracketing(func, x0, x1, x2):
    rho = 1.68
    iter_num = 1
    if func(x1)<func(x0) and func(x1)<func(x2):
        if iter_num == 1:
            return x0, x2
        if right:
            return x0, x1
        else:
            return x1, x2
    elif func(x0)<func(x1)<func(x2):
        iter_num += 1 
        x0 = x0 - 1.68*(x1 - x0)
        right = True
        Bracketing(func, x0, x1, x2)
    else:
        iter_num += 1 
        x2 = x2 + 1.68*(x2-x1)
        right = False
        Bracketing(func, x0, x1, x2)

In [37]:
def func(x):
    return 2*x*x

In [38]:
func(-1.5)

4.5

In [39]:
print Bracketing(func, 1, 2, 3)

None


## 多维优化问题中的一维搜索
接下来的几章会讨论一维搜索算法在多维优化问题中的应用。
$$
x^{k+1} = x^k + \alpha_{k} d^k
$$
$x^{k+1}$是迭代计算后的值，$x^k$是上一次计算得到的值，$\alpha_{k}$是学习率，$d^k$是梯度方向。如下图所示
![](https://gitee.com/data2world/OpimizationPhoto/raw/master/%E7%AC%AC7%E7%AB%A0/7-12.png)

那么使下面的函数值达到最小:
$$
\phi(\alpha)=f(x^k +\alpha \mathbf{d}^k)
$$
本章讨论的所有方法都可以求$\phi(\alpha)$的极小点。利用链式求导法则有:
$$
\phi'(\alpha)=d^{(k)T}f'(x^{(k)}+\alpha d^{(k)})
$$

### 一维搜索方法的一些问题
- 精确地求解极小点可能需要非常大的计算量
- 在工业界中大多是多维优化的问题，需要将计算资源配置到多维优化的问题中
- 所以我们需要设计合适的停止条件，第一个基本的理念是保证步长$\alpha_k$不要太小或不要太大

### Armijo条件
- 3个常数：$\epsilon \in (0,1)$, $\gamma > 1$和$\eta \in (\epsilon, 1)$

保证$\alpha_k$不会太大
$$
\phi(\alpha_k) \leq \phi_k(0)+\epsilon \alpha_k \phi'_k(0)
$$

保证$\alpha_k$不会太小

$$
\phi(\gamma \alpha_k) \geq \phi_k(0)+\epsilon \gamma \alpha_k \phi'_k(0)
$$


### Goldstein条件
**将Armijo条件中的第二个不等式调整为**

$$
\phi_k(\alpha_k) \geq \phi_k(0)+\epsilon \alpha_k \phi'_k(0)
$$

### Wolfe条件
Wolfe条件只包括函数$\phi_k$的一阶导数

$$
\phi'_k(\alpha_k) \geq \epsilon \phi'_k
$$

Annijo划界法是一种简单实用的(非精确)一维搜索方法。一开始先为步长向选定一个备选值。如果能够满足预定的停止条件(通常是Annijo条件中的第一个不等式) ，则停止搜索将其作为步长;否则，在该备选值上乘以一个缩小系数$\tau \in (0, 1)$，通常$\tau = 0.5$