# Семинар 12

# Введение в численные методы оптимизации 

 1. Обзор материала весеннего семестра
 2. Постановка задачи
 3. Общая схема решения
 4. Сравнение методов оптимизации
 5. Методы одномерной минимизации


## Обзор материала весеннего семестра

Также на [странице курса](https://github.com/amkatrutsa/MIPT-Opt#Весенний-семестр).

1. Методы решения задач **безусловной** оптимизации
    - Одномерная минимизация (уже сегодня!)
    - Градиентный спуск
    - Метод Ньютона
    - Квазиньютоновские методы
    - Метод сопряжённых градиентов  
    - Опционально:
        - Решение задачи наименьших квадратов
        - Оптимальные методы и нижние оценки
2. Методы решения задач **условной** оптимизации
    - Линейное программирование
    - Методы проекции градиента и условного градиента
    - Методы штрафных и барьерных функций
    - Метод модифицированой функции Лагранжа

## Организация работы в семестре

1. Семинар и лекция раз в неделю
2. Два задания в течение семестра
3. Итоговая контрольная в конце семестра
4. Экзамен в конце семестра (схема выставлении оценки будет объявлена позже)
5. Миниконтрольные в начале каждого семинара
6. Домашнее задание почти каждую неделю: $\TeX$ или Jupyter Notebook

## Постановка задачи

\begin{equation}
\begin{split}
& \min_{x \in S} f_0(x)\\
\text{s.t. } & f_j(x) = 0, \; j = 1,\ldots,m\\
& g_k(x) \leq 0, \; k = 1,\ldots,p
\end{split}
\end{equation}
где $S \subseteq \mathbb{R}^n$, $f_j: S \rightarrow \mathbb{R}, \; j = 0,\ldots,m$, $g_k: S \rightarrow \mathbb{R}, \; k=1,\ldots,p$

<span style="color:red;"> 
Важный факт</span>: задачи **нелинейной** оптимизации в их самой общей форме являются **численно неразрешимыми**!

## Аналитические результаты
- Необходимое условие первого порядка: если $x^*$ точка локального минимума дифференцируемой функции $f(x)$, тогда $$
f'(x^*) = 0
$$
- Необходимое условие второго порядка: если $x^*$ точка локального минимума дважды дифференцируемой функции $f(x)$, тогда 
$$
f'(x^*) = 0 \quad \text{и} \quad f''(x^*) \succeq 0
$$
- Достаточное условие: пусть $f(x)$ дважды дифференцируемая функция, и пусть точка $x^*$ удовлетворяет условиям
$$
f'(x^*) = 0 \quad f''(x^*) \succ 0,
$$
тогда $x^*$ является точкой строго локального минимума функции $f(x)$.

**Замечание**: убедитесь, что Вы понимаете, как доказывать эти результаты!

## Особенности численного решения

1. Точно решить задачу принципиально невозможно из-за погрешности машинной арифметики
2. Необходимо задать критерий обнаружения решения
3. Необходимо определить, какую информацию о задаче использовать

## Общая итеративная схема

Дано: начальное приближение $x$, требуемая точность $\varepsilon$.

Основной цикл:
```python
while stop_criterion(x) > epsilon:
    oracle_response = request_oracle(x)
    update_information(I, x, oracle_response)
    x = next_point(I, x)
return x
```

### Вопросы
1. Какие критерии основа могут быть?
2. Что такое оракул и зачем он нужен?
3. Что такое информационная модель?
4. Как вычисляется новая точка?

#### Критерии останова
1. Сходимость по аргументу: 
$$
\| x_k - x^*  \|_2 < \varepsilon
$$ 
2. Сходимость по функционалу: 
$$
\| f_k - f^* \|_2 < \varepsilon
$$ 
3. Выполнение необходимого условия для дифференцируемой функции 
$$
\| f'(x_k) \|_2 < \varepsilon
$$

#### Что такое оракул?

#### Информация о задаче

#### Вычисление новой точки

## Как сравнивать методы оптимизации?
1. Сложность
    - аналитическая: число обращений к оракулу для решения задачи с точностью $\varepsilon$
    - арифметическая: общее число всех вычислений, необходимых для решения задачи с точностью $\varepsilon$
2. Скорость сходимости

### Скорости сходимости 
1. Сублинейная
2. Линейная (геометрическая прогрессия)
3. Сверхлинейная
4. Квадратичная

### Значение теорем сходимости


## Классификация задач

## Классификация методов

## Одномерная минимизация

### Метод дихотомии

### Метод золотого сечения

### Метод Фибоначчи 