# Лабораторная работа №4.
### Поиск экстремума функции многих переменных.
### Вариант №21

*Отчёт выполнил: Бугров Александр, 430 группа.*

## Постановка задачи

Найти точку максимума функции  
  
$f(x_{1},x_{2}) = -x_{1}^2/3 - x_{1}x_{2}/6 + 19x_{1}/2 - x_{2}^2/3 + 16x_{2} + 235/3 $;  
[$x_{1} = 28, x_{2} = 19$]  

методом покоординатного спуска. Для одномерной минимизации использовать метод золотого сечения. В окрестности точки максимума оценить овражность, построить линии уровня и траекторию поиска (на одном графике).

## Теоретическая часть
Рассмотрим задачу нахождения безусловного минимума функции $f(x)$ векторного аргумента $x=$ {$x_{1},x_{2},...,x_{3}$}, заданного на всём пространстве $R^n$, символически записываемую в виде:  
  
$$f(x) \rightarrow min, x \in R^n.$$  

Для численного решения этой задачи обычно строят некоторую последовательность векторов {$x^k$}$_{k=0}^{\infty}$, обрывая процесс построения тогда, когда появляется уверенность, что последний из построенных элементов последовательности близок к точке минимума в том или ином смысле.

Большинство процессов, используемых для приближенного решения этой задачи можно представить в виде:  
  
$$x^{k+1} = x^k + \alpha_{k}p^k,$$  
где $p^k$ - вектор, определяющий направление движения от точки $x^k$ к точке $x^{k+1}$, $\alpha_{k}$ - числовой множитель, величина которого задаёт длину шага в направлении $p^k$.  
  
В различных итерационных процессах для нахождения $\alpha_{k}$ и $p^k$ привлекаются различные сведения о минимизируемой функции $f(x)$. Процессы, использующие для этого только значения самой функции, называются процессами нулевого порядка или методами поиска. Процессы, требующие вычисления производных $f(x)$ до m-го порядка включительно, называют процессами m-го порядка.  
  
В задачах безусловной минимизации методы нулевого порядка сходятся, как правило, хуже методов, использующих информацию о производных. Однако этот недостаток зачастую перекрывается тем достоинством методов поиска, что они требуют гораздо меньше времени на подготовку задачи к решению (исключаются, например, такие трудные операции, как вычисление производных).

### Метод покоординатного спуска
Вектор $p^k$ определяется по правилу (циклический покоординатный спуск):  
  
$$p^k = e_{k - [k/n]n + 1}, k = 0,1,2,...,$$  
где $[t]$ - целая часть числа $t$, $e_{j}=$ {$0,...0,1,0,...0$} (единица стоит на $j$-ом месте), $j = 1,...,n$. Число $\alpha_{k} \in (-\infty, +\infty)$ можно определять, например, следующим образом:  
  
$$f(x^k + \alpha_{k}p^k) = \underset{-\infty < \alpha < +\infty}{min} f(x^k + \alpha_{k}p^k).$$  
  
Метод покоординатного спуска очень прост, но не очень эффективен. Проблемы могут возникнуть, когда линии уровня сильно вытянуты, т.е. для овражных функций. В подобной ситуации поиск быстро застревает на дне такого оврага, а если начальное приближение оказывается на оси "эллипсоида то процесс так и останется в этой точке. Хорошие результаты получаются в тех случаях, когда целевая функция представляет собой выпуклую функцию.

### Метод золотого сечения
Поиск с помощью метода золотого сечения основан на разбиении отрезка неопределённости на две части, известном как "золотое сечение". При этом отношение длины всего отрезка к большей части равно отношению большей части к меньшей и равно числу 
$\tau = 2^{-1}(1 + \sqrt5) \approx 1,6118$ ($\tau$ - корень уравнения $\tau^{2} = 1 + \tau$). В методе золотого сечения точки $x^1$ и $x^2$ на каждом отрезке неопределённости $[a,b]$ выбираются по правилу  
  
$$x^1 = b - (b - a)/\tau,$$
$$x^2 = a + (b - a)/\tau.$$
  
Показатель эффективности метода равен $E_{m} = \tau^{1 - m}$.

### Оценка овражности функции в максимуме

Оценим овражность функции $f(x,y)$ в области максимума функции. Не рассчитывая численное значение максимума, ограничимся аналитическим значением максимума функции, например, в точке $(-2\pi,\pi/2)$.

По определению, под показателем овражности $k$ функции $f(x)$ в окрестности точки  $(x',y')$ подразумевают отношение наибольшего собственного числа матрицы Гессе $\nabla^2 f(x',y')$ к наименьшему.

Чем больше этот показатель, тем более вытянутым и крутым является <<овраг>> поверхности уровня исследуемой функции в окрестности $(x',y')$ и тем медленнее сходятся в этой окрестности градиентные итерационные методы.

## Практическая часть

In [None]:
import matplotlib
import numpy as np
from numpy import pi,cos,sin,abs,sqrt,exp
import matplotlib.pyplot as plt
from scipy import optimize

In [None]:
def f(x,y):
    return -x ** 2 - x*y/6 + 19*x/2 - y/3 + 16*y + 235/3

#вычисляем из формулы для золотого сечения
phi = 0.5 * (1.0 + sqrt(5.0))

In [None]:
#золотое сечение
def minimize(f,eps,a,b,X,par): 
    dd=abs(f(b,par)-f(a,par))
    if X:
        dd=abs(f(par,b)-f(par,a))
    if dd < eps: 
        return (a+b)/2
    else:
        t = (b-a)/phi
        x1, x2 = b - t, a + t
        q=f(x1,par)
        Q=f(x2,par)
        if X:
            q=f(par,x1)
            Q=f(par,x2)
        if q>=Q:
            return minimize(f, eps, x1, b,X,par)
        else:
            return minimize(f, eps, a, x2,X,par)
        
def scrola(f,x0):
    h=0.05
    N=0
    while not((f(x0-h)>f(x0))&(f(x0)<f(x0+h))):
        N+=1
        if f(x0-h)>f(x0+h):
            x0=x0+h/2
        else:
            x0=x0-h/2
    return x0


xmin,xmax=0,30
ymin,ymax=0,30
x0,y0=29,19
eps=0.0001

X = np.arange(xmin,xmax, 0.010)
Y = np.arange(ymin,ymax, 0.010)
X, Y = np.meshgrid(X, Y)

plt.contour(X,Y,f(X,Y),50)
plt.plot(x0,y0,'bo')

i=xo=yo=0
while abs(f(xo,yo)-f(x0,y0))>eps:
    i+=1
    if i>10**3:
        print('break!')
        break
    xo,yo=x0,y0
    def ff(x):
        return f(x,y0)
    x0=minimize(f,eps,np.min([x0,scrola(ff,x0)]),np.max([x0,scrola(ff,x0)]),False,y0)
    def ff(y):
        return f(x0,y)
    y0=minimize(f,eps,np.min([y0,scrola(ff,y0)]),np.max([y0,scrola(ff,y0)]),True,x0)
    plt.plot([xo,xo,x0],[yo,y0,y0],'-b')

plt.plot(x0,y0,'ro')
print('Итераций: ', i)
print(x0,y0)
plt.show()

In [None]:
#Гессиан
def gessian(x,y):
    Arr=np.array([[-sin(y)*cos(x),-sin(x)*cos(y)],
        [-sin(x)*cos(y),-sin(y)*cos(x)]])
    return Arr 

# Точка максимума
XX=-2*pi
YY=pi/2

# Собственные значения матрицы Гессе
P=np.linalg.eig(gessian(XX,YY))[0]

# Коэфф. овражности
k=np.max(P)/np.min(P)
print('Коэффициент овражности:',k)

In [None]:
# считаем овражность
lambda1 = 1
lambda2 = 1
O = lambda1/lambda2
print("Овражность "+str(O))