# Семинар 19
# Оптимизация на множествах простой структуры

## На прошлом семинаре...

- История линейного программирования
- Концепция методов внутренней точки
- Прямой барьерный метод


## Методы решения каких задач уже известны

- Безусловная минимизация: функция достаточно гладкая, но ограничений на аргумент нет.
- Линейное программирование: линейная функция при линейных ограничениях

Следующий шаг: произвольная достаточно гладкая функция на достаточно простом множестве - не обязательно полиэдральном.

## Базовая часть

## Что такое "простое множество"?


**Определение.** Множество будем называть *простым*, если проекцию на него можно найти существенно быстрее (чаще всего аналитически) по сравнению с решением исходной задачи минимизации.

## Примеры простых множеств

- Полиэдр $Ax = b, Cx \leq d$
    - аффинное множество
    - гиперплоскость
    - полупространство
    - отрезок, интервал, полуинтервал
    - симплекс
- Конусы
    - положительный ортант
    - Лоренцев конус
    - $\mathbb{S}^n_{+}$
    
**Замечание:** убедитесь, что Вы понимаете, что стоит за этими названиями и обозначениями!

## Напоминание: как искать проекцию?
Для данной точки $y \in \mathbb{R}^n$ требуется решить следующую задачу
$$
\min_{x \in P} \|x - y \|_2
$$
Обозначение: $\pi_P(y)$ - проекция точки $y$ на множество $P$.

## Примеры проекций

- Отрезок $P = \{x | l \leq x \leq u \}$
$$
(\pi_P(y))_k = 
\begin{cases}
u_k & y_k \geq u_k \\
l_k & y_k \leq l_k \\
y_k & \text{otherwise.}
\end{cases}
$$

- Аффинное множество $P = \{ x| Ax = b \}$
$$
\pi_P(y) = y - A^+(Ay - b),
$$ 
где $A^+$ - псевдообратная матрица. Если $A$ полного ранга и столбцы линейно-независимы, тогда $A^+ = (A^{\top}A)^{-1}A^{\top}$.

- Конус положительно полуопределённых матриц $P = \mathbb{S}^n_+ = \{X \in \mathbb{R}^{n \times n} | X \succeq 0, \; X^{\top} = X \}$
$$
\pi_P(Y) = \prod_{i=1}^n (\lambda_i)_+ v_i v_i^{\top},
$$
где $(\lambda_i, v_i)$ - пары собственных значений и векторов матрицы $Y$. 

## Метод проекции градиента

$$
\min_{x \in P} f(x)
$$
Идея: делать шаг градиентного спуска и проецировать полученную точку на допустимое множество $P$.

## Псевдокод

```python
def ProjectedGradientDescent(f, gradf, proj, x0, tol):
    x = x0
    while True:
        gradient = gradf(x)
        alpha = get_step_size(x, f, gradf, proj)
        x = proj(x - alpha * grad)
        if check_convergence(x, gradf, f):
            break
    return x
```

## Поиск шага

- Постоянный шаг: $\alpha = \overline{\alpha}$, где $\overline{\alpha}$ достаточно мало
- Наискорейший спуск: 
$$
\min_{\alpha > 0} f(x_k(\alpha))
$$
$x_k(\alpha) = \pi_P (x_k - \alpha f'(x_k))$
- Линейный поиск: уменьшать шаг по правилу Армихо, пока не будет выполнено условие
$$
f(x_k(\alpha)) - f(x_k) \leq c_1 \langle f'(x_k), x_k(\alpha) - x_k \rangle
$$

## Критерии остановки
- Сходимость по аргументу, то есть сходимость последовательности $x_k$ к предельной точке
- Сходимость по функционалу, то есть првоерка изменения значения целевой функции

**Важное замечание:** проверять норму градиента бессмысленно, так как это случай условной оптимизации!

## Теорема сходимости (Б.Т. Поляк "Введение в оптимизацию", гл. 7, $\S$ 2)

**Теорема.** Пусть $f$ выпуклая дифференцируемая функция и её градиент липшицев на $P$ с константой $L$. Пусть $P$ выпуклое и замкнутое множество и $0 < \alpha < 2 / L$. 

Тогда
- $x_k \to x^*$
- если $f$ сильно выпуклая, то $x_k \to x^*$ со скоростью геометрической прогрессии с коэффициентом $1 - \frac{\alpha}{2 - \alpha L}$
- если $f$ дважды дифференцируема и $f''(x) \succeq l\mathbf{I}, \; x \in P$, $l > 0$, то знаменатель прогрессии $q = \max \{ |1 - \alpha l|, |1 - \alpha L|\}$.

## Что такое "простое множество"?

**Определение.** Множество $D$ будем называть *простым*, если можно найти решение следующей задачи
$$
\min_{x \in D} \langle c, x \rangle
$$
существенно быстрее (чаще всего аналитически) по сравнению с решением исходной задачи минимизации.

## Метод условного градиента (aka Frank-Wolfe algorithm)

### Теорема сходимости (Б.Т. Поляк "Введение в оптимизацию", гл. 7, $\S$ 2)


## Факультативная часть

## Резюме
- Множество простой структуры
- Проекция
- Метод проекции градиента
- Метод условного градиента
- 