# Другое


## Метод золотого сечения


### Введение


**Определение:** Метод золотого сечения (Golden Section Search) - это метод оптимизации, используемый для нахождения экстремума (минимума или максимума) унимодальной функции путем последовательного сужения интервала, в котором находится экстремум.

**Определение:** Унимодальная функция на интервале $[a, b]$ - это функция, которая либо строго возрастает, либо строго убывает, либо строго возрастает до некоторой точки $x^*$ (точки экстремума), а затем строго убывает.

**Определение:** Золотое сечение - это деление отрезка на две части в таком отношении, при котором отношение длины всего отрезка к длине большей части равно отношению длины большей части к длине меньшей части. Это отношение равно иррациональному числу $\varphi = \frac{1 + \sqrt{5}}{2} \approx 1.618$.


### Теоретическое обоснование


Пусть дана унимодальная функция $f(x)$ на интервале $[a, b]$, и мы хотим найти точку минимума этой функции. Метод золотого сечения основан на следующей идее: выберем две внутренние точки $c$ и $d$ такие, что $a < c < d < b$, и вычислим значения функции $f(c)$ и $f(d)$. В зависимости от соотношения этих значений, мы можем отбросить часть исходного интервала.

**Теорема 1:** Если $f(c) < f(d)$, то минимум функции $f(x)$ находится на интервале $[a, d]$.

$\square$
Доказательство: Поскольку функция $f(x)$ унимодальна, и $f(c) < f(d)$, то точка минимума не может находиться на интервале $(d, b]$. Действительно, если бы точка минимума $x^*$ находилась на интервале $(d, b]$, то функция $f(x)$ должна была бы убывать на интервале $[c, x^*]$, что противоречит условию $f(c) < f(d)$. Следовательно, точка минимума находится на интервале $[a, d]$.
$\blacksquare$

**Теорема 2:** Если $f(c) > f(d)$, то минимум функции $f(x)$ находится на интервале $[c, b]$.

$\square$
Доказательство: Аналогично предыдущему случаю. Поскольку функция $f(x)$ унимодальна, и $f(c) > f(d)$, то точка минимума не может находиться на интервале $[a, c)$. Если бы точка минимума $x^*$ находилась на интервале $[a, c)$, то функция $f(x)$ должна была бы возрастать на интервале $[x^*, d]$, что противоречит условию $f(c) > f(d)$. Следовательно, точка минимума находится на интервале $[c, b]$.
$\blacksquare$

**Теорема 3:** Если $f(c) = f(d)$, то минимум функции $f(x)$ находится на интервале $[c, d]$.

$\square$
Доказательство: Поскольку функция $f(x)$ унимодальна, и $f(c) = f(d)$, то на интервале $[c, d]$ функция должна иметь минимум. Если бы минимум находился вне этого интервала, например, на интервале $[a, c)$, то функция должна была бы возрастать на интервале $[c, d]$, что противоречит условию $f(c) = f(d)$. Аналогично, минимум не может находиться на интервале $(d, b]$.
$\blacksquare$


### Выбор точек деления


Для эффективной работы метода золотого сечения необходимо выбирать точки $c$ и $d$ таким образом, чтобы при переходе к новому интервалу можно было использовать одну из уже вычисленных точек. Это позволяет сократить количество вычислений функции.

**Теорема 4:** Если точки $c$ и $d$ выбраны в соответствии с золотым сечением, то при переходе к новому интервалу одна из этих точек может быть использована повторно.

$\square$
Пусть исходный интервал $[a, b]$ имеет длину $L = b - a$. Выберем точки $c$ и $d$ так, что:
$c = a + (1 - \tau) \cdot (b - a)$
$d = a + \tau \cdot (b - a)$
где $\tau = \frac{\sqrt{5} - 1}{2} \approx 0.618$ - это обратное значение золотого сечения.

Рассмотрим случай, когда $f(c) > f(d)$, и мы переходим к интервалу $[c, b]$. Новая длина интервала будет $L' = b - c = b - (a + (1 - \tau) \cdot (b - a)) = \tau \cdot (b - a) = \tau \cdot L$.

Для нового интервала $[c, b]$ нам нужно выбрать две внутренние точки. Одной из них может быть точка $d$, которая уже была вычислена. Вторую точку $e$ нужно выбрать так, чтобы:
$e = c + (1 - \tau) \cdot (b - c) = c + (1 - \tau) \cdot \tau \cdot L$

Проверим, что $d = a + \tau \cdot L$ и $e = c + (1 - \tau) \cdot \tau \cdot L$ находятся на правильных позициях относительно нового интервала $[c, b]$:

$c = a + (1 - \tau) \cdot L$
$d = a + \tau \cdot L$
$e = c + (1 - \tau) \cdot \tau \cdot L = a + (1 - \tau) \cdot L + (1 - \tau) \cdot \tau \cdot L = a + (1 - \tau) \cdot L \cdot (1 + \tau)$

Поскольку $\tau$ удовлетворяет уравнению $\tau^2 + \tau = 1$ (это свойство золотого сечения), то $(1 + \tau) = \frac{1}{\tau}$. Следовательно:

$e = a + (1 - \tau) \cdot L \cdot \frac{1}{\tau} = a + \frac{(1 - \tau) \cdot L}{\tau} = a + \frac{L - \tau \cdot L}{\tau} = a + \frac{L}{\tau} - L = a + L \cdot (\frac{1}{\tau} - 1) = a + L \cdot \frac{1 - \tau}{\tau}$

Поскольку $\frac{1 - \tau}{\tau} = 1$ (еще одно свойство золотого сечения), то:

$e = a + L = b$

Это означает, что точка $e$ совпадает с правой границей нового интервала, что некорректно. Однако, если мы выберем точки в соответствии с правилом:

$c = a + (1 - \tau) \cdot (b - a)$
$d = a + \tau \cdot (b - a)$

то при переходе к интервалу $[c, b]$ точка $d$ будет находиться на расстоянии $(1 - \tau) \cdot (b - c)$ от левой границы нового интервала, что соответствует требуемому положению для метода золотого сечения.

Аналогично можно показать, что при переходе к интервалу $[a, d]$ точка $c$ будет находиться на правильной позиции.
$\blacksquare$


### Скорость сходимости


**Теорема 5:** Метод золотого сечения имеет линейную скорость сходимости с коэффициентом $\tau = \frac{\sqrt{5} - 1}{2} \approx 0.618$.

$\square$
На каждой итерации метода золотого сечения длина интервала, содержащего минимум, умножается на коэффициент $\tau$. Таким образом, после $n$ итераций длина интервала будет равна $L_n = \tau^n \cdot L_0$, где $L_0$ - длина исходного интервала.

Для достижения заданной точности $\varepsilon$ необходимо, чтобы $L_n \leq \varepsilon$, то есть $\tau^n \cdot L_0 \leq \varepsilon$. Отсюда получаем:
$n \geq \frac{\log(\varepsilon / L_0)}{\log(\tau)}$

Поскольку $\tau < 1$, то $\log(\tau) < 0$, и мы имеем:
$n \geq \frac{\log(L_0 / \varepsilon)}{-\log(\tau)}$

Это означает, что количество итераций, необходимых для достижения заданной точности, пропорционально логарифму отношения начальной длины интервала к требуемой точности, что соответствует линейной скорости сходимости.
$\blacksquare$


### Реализация метода золотого сечения


In [None]:
import numpy as np
import matplotlib.pyplot as plt

def golden_section_search(f, a, b, tol=1e-5, max_iter=1000):
    """
    Метод золотого сечения для нахождения минимума унимодальной функции на интервале [a, b].

    Параметры:
    f -- целевая функция
    a, b -- границы интервала
    tol -- требуемая точность
    max_iter -- максимальное количество итераций

    Возвращает:
    x -- точка минимума
    f(x) -- значение функции в точке минимума
    iterations -- количество выполненных итераций
    """
    # Коэффициент золотого сечения
    tau = (np.sqrt(5) - 1) / 2

    # Инициализация точек деления
    c = a + (1 - tau) * (b - a)
    d = a + tau * (b - a)

    # Вычисление значений функции в точках деления
    fc = f(c)
    fd = f(d)

    iterations = 0

    # История изменения интервала для визуализации
    history = [(a, b, c, d, fc, fd)]

    while (b - a) > tol and iterations < max_iter:
        if fc < fd:
            # Минимум находится на интервале [a, d]
            b = d
            d = c
            fd = fc
            c = a + (1 - tau) * (b - a)
            fc = f(c)
        else:
            # Минимум находится на интервале [c, b]
            a = c
            c = d
            fc = fd
            d = a + tau * (b - a)
            fd = f(d)

        iterations += 1
        history.append((a, b, c, d, fc, fd))

    # Возвращаем середину конечного интервала как приближение к точке минимума
    x = (a + b) / 2
    return x, f(x), iterations, history

# Пример использования
def f(x):
    return x**2 + 4*np.sin(x)

a, b = -2, 2
x_min, f_min, iterations, history = golden_section_search(f, a, b)

print(f"Точка минимума: x = {x_min:.6f}")
print(f"Значение функции в точке минимума: f(x) = {f_min:.6f}")
print(f"Количество итераций: {iterations}")

# Визуализация
x = np.linspace(a, b, 1000)
y = [f(xi) for xi in x]

plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.plot(x, y)
plt.grid(True)
plt.title('Функция f(x) = x^2 + 4*sin(x)')
plt.xlabel('x')
plt.ylabel('f(x)')

# Отметим точку минимума
plt.plot(x_min, f_min, 'ro', markersize=8)
plt.text(x_min, f_min, f'  ({x_min:.4f}, {f_min:.4f})', verticalalignment='bottom')

# Визуализация сужения интервала
plt.subplot(1, 2, 2)
iterations_list = list(range(len(history)))
intervals = [h[1] - h[0] for h in history]

plt.semilogy(iterations_list, intervals)
plt.grid(True)
plt.title('Сужение интервала')
plt.xlabel('Итерация')
plt.ylabel('Длина интервала (логарифмическая шкала)')

plt.tight_layout()
plt.show()


### Сравнение с другими методами оптимизации


Метод золотого сечения имеет ряд преимуществ и недостатков по сравнению с другими методами оптимизации:

**Преимущества:**
1. Не требует вычисления производных функции
2. Гарантированно сходится для унимодальных функций
3. Требует только одно новое вычисление функции на каждой итерации
4. Устойчив к численным ошибкам

**Недостатки:**
1. Применим только для унимодальных функций одной переменной
2. Имеет линейную скорость сходимости, что медленнее, чем у методов, использующих производные (например, метод Ньютона)
3. Требует, чтобы интервал, содержащий минимум, был известен заранее


### Модификации метода золотого сечения


**Комбинированный метод золотого сечения и парабол**

Метод золотого сечения можно комбинировать с методом парабол (методом Брента) для ускорения сходимости. Идея заключается в том, чтобы использовать квадратичную интерполяцию, когда это возможно, и переключаться на метод золотого сечения, когда интерполяция не дает хороших результатов.


In [None]:
def brent_method(f, a, b, tol=1e-5, max_iter=1000):
    """
    Метод Брента для нахождения минимума унимодальной функции на интервале [a, b].

    Параметры:
    f -- целевая функция
    a, b -- границы интервала
    tol -- требуемая точность
    max_iter -- максимальное количество итераций

    Возвращает:
    x -- точка минимума
    f(x) -- значение функции в точке минимума
    iterations -- количество выполненных итераций
    """
    # Коэффициент золотого сечения
    tau = (3 - np.sqrt(5)) / 2

    # Инициализация
    x = w = v = a + tau * (b - a)
    fx = fw = fv = f(x)

    d = e = b - a

    iterations = 0

    while iterations < max_iter:
        g = e
        e = d

        # Проверяем, можно ли использовать параболическую интерполяцию
        use_parabolic = False
        if (x != w and x != v and w != v and
            fx != fw and fx != fv and fw != fv):
            # Коэффициенты параболы через точки (v, fv), (w, fw), (x, fx)
            p1 = (x - w) * (fx - fv)
            p2 = (x - v) * (fx - fw)
            p = (x - v) * p2 - (x - w) * p1
            q = 2 * (p2 - p1)

            if q > 0:
                p = -p
            else:
                q = -q

            # Сохраняем предыдущее значение d
            d_old = d

            # Если параболическая интерполяция дает точку внутри [a, b] и
            # не слишком близко к границам текущего интервала, используем ее
            if (abs(p) < abs(q * d_old / 2) and
                a + tol < x - p/q < b - tol):
                d = p / q
                u = x + d
                use_parabolic = True

                # Если u слишком близко к a или b, используем золотое сечение
                if u - a < 2 * tol or b - u < 2 * tol:
                    d = tol if x < (a + b) / 2 else -tol
                    use_parabolic = False

        # Если параболическая интерполяция не используется, применяем золотое сечение
        if not use_parabolic:
            if x < (a + b) / 2:
                d = b - x
                e = d
            else:
                d = a - x
                e = d
            d = tau * d

        # Если шаг достаточно большой, делаем его, иначе используем минимальный шаг
        if abs(d) >= tol:
            u = x + d
        else:
            u = x + (tol if d > 0 else -tol)

        fu = f(u)

        # Обновляем a, b, v, w, x в зависимости от результата
        if fu <= fx:
            if u < x:
                b = x
            else:
                a = x
            v, w, x = w, x, u
            fv, fw, fx = fw, fx, fu
        else:
            if u < x:
                a = u
            else:
                b = u
            if fu <= fw or w == x:
                v, w = w, u
                fv, fw = fw, fu
            elif fu <= fv or v == x or v == w:
                v = u
                fv = fu

        iterations += 1

        # Проверяем условие сходимости
        if b - a < 2 * tol:
            break

    return x, fx, iterations

# Пример использования
def f(x):
    return x**2 + 4*np.sin(x)

a, b = -2, 2
x_min, f_min, iterations = brent_method(f, a, b)

print(f"Метод Брента:")
print(f"Точка минимума: x = {x_min:.6f}")
print(f"Значение функции в точке минимума: f(x) = {f_min:.6f}")
print(f"Количество итераций: {iterations}")


### Применение метода золотого сечения в многомерной оптимизации


Метод золотого сечения можно использовать как составную часть алгоритмов многомерной оптимизации, например, в методе покоординатного спуска или в методе Пауэлла.


In [None]:
def coordinate_descent(f, x0, tol=1e-5, max_iter=1000):
    """
    Метод покоординатного спуска с использованием метода золотого сечения
    для нахождения минимума функции многих переменных.

    Параметры:
    f -- целевая функция
    x0 -- начальная точка (список или массив)
    tol -- требуемая точность
    max_iter -- максимальное количество итераций

    Возвращает:
    x -- точка минимума
    f(x) -- значение функции в точке минимума
    iterations -- количество выполненных итераций
    """
    x = np.array(x0, dtype=float)
    n = len(x)

    iterations = 0

    while iterations < max_iter:
        x_old = x.copy()

        for i in range(n):
            # Определяем функцию одной переменной вдоль i-й координаты
            def g(t):
                x_new = x.copy()
                x_new[i] = t
                return f(x_new)

            # Находим минимум вдоль i-й координаты
            a = x[i] - 1.0  # Произвольный интервал поиска
            b = x[i] + 1.0

            # Используем метод золотого сечения для поиска минимума
            x[i], _, _, _ = golden_section_search(g, a, b, tol)

        # Проверяем условие сходимости
        if np.linalg.norm(x - x_old) < tol:
            break

        iterations += 1

    return x, f(x), iterations

# Пример использования
def f_multi(x):
    return x[0]**2 + 4*np.sin(x[0]) + (x[1] - 2)**2

x0 = [0, 0]
x_min, f_min, iterations = coordinate_descent(f_multi, x0)

print(f"Метод покоординатного спуска:")
print(f"Точка минимума: x = {x_min}")
print(f"Значение функции в точке минимума: f(x) = {f_min:.6f}")
print(f"Количество итераций: {iterations}")


### Заключение


Метод золотого сечения является эффективным алгоритмом для нахождения минимума унимодальной функции одной переменной. Он не требует вычисления производных и гарантированно сходится. Хотя его скорость сходимости линейна, что медленнее, чем у методов, использующих производные, он остается полезным инструментом в оптимизации, особенно когда вычисление производных затруднено или невозможно.

Метод золотого сечения также может быть использован как составная часть более сложных алгоритмов оптимизации, таких как метод покоординатного спуска или метод Пауэлла, для решения задач многомерной оптимизации.

В практических приложениях метод золотого сечения часто комбинируется с другими методами, такими как метод парабол (метод Брента), для достижения лучшей производительности.
