# 实验8-线性规划

什么是优化问题？所谓优化问题就是在一定的约束条件下，求解目标函数的最大值或最小值。在实际生活中，我们经常会遇到各种各样的优化问题，比如：如何在有限的时间内到达目的地？如何在有限的预算下购买到最满意的商品？如何在有限的时间内完成作业？如何在有限的资源下获得最大的利润？等等。这些问题都可以用优化问题来描述。优化问题是数学、经济学、物理学、生物学、工程学等领域中的一个重要问题。

#### 数学规划模型的三要素

1. 决策变量：决策变量是问题要求解的未知量，通常用n维向量x表示，$x=(x1,x2,...,xn)^T$。决策变量的取值范围是问题的解空间。
2. 目标函数：目标函数是决策变量的函数，通常用f(x)表示。目标函数的最优值是问题的最优解。
3. 约束条件：由该问题对决策变量的限制条件给出，通常用一组关于x的不等式$g_i(x)\leq 0(i=1,2,\cdots,m)$界定。一般地，这类年模型可模型可以表述成以下形式
   $$
   opt \quad z=f(x) \tag{1}  
   $$
   $$
   s.t. \quad g_i(x)\leq 0 \quad (i=1,2,\cdots,m) \tag{2}
   $$
   其中满足(2)的解集合称为可行解，同时满足(1)的可行解中的最优解称为最优解。  
   由(1)式(2)式组成的模型称为约束优化,若只有(1)式将就是无约束优化。

#### 线性规划,整数规划,非线性规划
- 当目标函数和约束条件都是线性函数,且决策变量的所有分量均是实数时,称为线性规划问题。
- 若决策变量或目标函数至少有一个非线性函数,则称为非线性规划
- 若x至少有一个变量只去整数,称为整数规划
- 线性规划和非线性规划都是连续优化问题,整数规划是离散优化(组合优化)问题,它们统称数学规划。

## 无约束优化的基本思想
假设不名目标为最小化为无约束新约束非线性规划问题为
$$
min f(x),\quad x = (x_1,x_2,\cdots,x_n)^T \in R^n . \tag{3}
$$
这实际为为一个极值问题,将求得的解通常都是局部最优解,而不是全局最优解.求解全局月最优需要将局部最优比较后得到.

### 最优解的充分与必要他条件
记$f(x)$在$x^*$处的梯度为$\nabla f(x^*)$,则有有如下结论:
- $x=x^*$是$f(x)$的最优解必要条件是$\nabla f(x^*)=0$
- $x=x^*$是$f(x)$的最优解充分条件是$\nabla f(x^*)=0$且$\nabla^2 f(x^*)$正定

### 下降法的基本思想
下降法是一种迭代算法,其基本思想是从初始点$x^{(0)}$出发,在迭代的第k步，沿着搜索方向$d^{(k)}$不断迭代,直到满足停止准则为止.
1.选初始解$x^0$和迭代停止准则$\varepsilon>0$
2.计算搜索方向$d^k$与步长$\alpha_k$，令$x^{k+1}=x^k+\alpha_kd^k$，使得$f(x^{k+1})<f(x^k)$
3.若$\|x^{k+1}-x^k\|<\varepsilon$，则停止迭代，否则令$k=k+1$，返回步骤2
下面讨论搜索方向与步长的选择
#### 搜索方向的选择
- 最速下降法
  将$f(x^{k+1})$在$x^k$处进行泰勒展开，取一阶近似，即
   $$
   f(x^{k+1})=f(x^k+d^k)\approx f(x^k)+\nabla f^T(x^k)d^k \tag{4}
   $$
   为使f下降最快，$d^k=-\nabla f^T(x^k)$,综上，最速下降法的搜索方向为
   $$
   x^{k+1}=x^k-\alpha_k\nabla f(x^k) \tag{5}
   $$
- 牛顿法
  搜索方向为
   $$
   d^k=-[\nabla^2 f(x^k)]^{-1}\nabla f(x^k) \tag{6}
   $$
   即$d^k$满足
   $$
   \nabla^2f(x^k)d^k= -\nabla f(x^k)\tag{7}
   $$

- 拟牛顿法
  因为牛顿法中的黑塞矩阵$\nabla^2 f(x^k)$的计算比较复杂，所以我们可以用拟牛顿法来代替牛顿法。拟牛顿法的基本思想是用一个矩阵来近似黑塞矩阵，从而简化计算。拟牛顿法的搜索方向为
   $$
   d^k=-B_k^{-1}\nabla f(x^k) \tag{8}
   $$
   其中$B_k$是拟黑塞矩阵，满足
   $$
   B_{k+1}=B_k+\Delta B_k \tag{9}
   $$
   其中$\Delta B_k$是校正矩阵，满足
   $$
   \Delta B_k=\frac{y_ky_k^T}{y_k^Ts_k}-\frac{B_ks_ks_k^TB_k}{s_k^TB_ks_k} \tag{10}
   $$
   其中$y_k=\nabla f(x^{k+1})-\nabla f(x^k)$，$s_k=x^{k+1}-x^k$。

#### 搜索步长的确定




### 最小二乘法

#### 最小二乘准则

当方程个数大于待定系数个数时,称为超定方程组.一般来说,超定方程组在普通意义下是无解的,因此我们需要数据拟合.
数据拟合几何上可以看作是月找到一条曲线y=f(t),与平面上的n个点$(t_i,y_i)$在某种准则下最为接近.称为曲线拟合