In [1]:
import numpy as np
import pandas as pd
from numpy.linalg import *

# Функции многих переменных


## Частные производные и градиент

Для функций многих переменных (мы ограничимся рассмотрением только двухмерных случаев, так как все аналогично) $f(x, y)$ существует понятие частной производной, то есть это производная по одной из переменных, в то время как все остальные переменные зафиксированны.

То есть частные производные для функции $f(x, y)$:
1. Частная производная по $x$: $f'_{x}(x, y)=\lim_{\Delta x\to 0}\frac{f(x + \Delta x, y) - f(x, y)}{\Delta x}$
2. Частная производная по $x$: $f'_{y}(x, y)=\lim_{\Delta y\to 0}\frac{f(x, y + \Delta y) - f(x, y)}{\Delta x}$

Если у функции много параметров, то значит и много частных производных, поэтому хотелось бы работать с одной сущностью, которой и стал **градиент функции**.

**Опр.** Градиент функции $f(x_{1}, x_{2}, \dots x_{n})$ - это вектор составленный из частных производных по всем параметрам функции $\nabla f = (f'_{x_{1}}, f'_{x_{2}}, \dots, f'_{x_{n}})^{T}$.

**Теорема.** Необходимое условие экстремума функции многих переменных - равенство нулю ее градиента, то есть $\nabla f = 0$.


Кроме того, через частные производные можно записать и приращение функции в некоторой точке: 

$$
    \Delta f = f'_{x} \Delta x + f'_{y} \Delta y = (\nabla f, (\Delta x, \Delta y)^{T})
$$

<img src='img/grad_geom.png'>

Таким образом, линейное приближение функции многих переменных в точке задается плоскостью (аналогично для касательной в одномерном случае).

При невозможности вычислить аналитически используется метод градиентного спуска, основная идея которого идти по антиградиенту функции:
 $$
     x_{n+1} = x_{n} -\gamma \nabla f(\vec{x})
 $$

## Производная по направлению

**Опр.** Производная функции многих переменных $f(\vec{x})$ определяется как:
$$
    f'_{l} = \lim_{t\to 0}\frac{f(\vec{x}+t\vec{l}) - f(\vec{x})}{t},
$$
где $\vec{l}$ и $\vec{x}$ - вектора, а $t$ - число.

Легко понять что если взять плоскость сечения функции вдоль заданного направления, то это будет обычная производная - а значит *производная по направлению показывает направление наискорейшего роста функции в данной точке*.

<img src='img/der_in_direction.png'>

## Смысл градиента

Давайте распишем прирпщение функции двух переменных $f(x, y)$:

$$
    \Delta f(x, y) = f'_{x}\Delta x + f'_{y} \Delta y = (\nabla f(x, y), (\Delta x, \Delta y)^{T}).
$$


но пусть $\Delta x = t l_{x}$, $\Delta y = t l_{y}$, тогда

$$
    \Delta f(x, y) = t(\nabla f(x, y), \vec{l})
$$

И тогда производня по направлению:

$$
    \frac{\partial f}{\partial l} = \lim_{t \to 0}\frac{\Delta f}{t} = (\nabla f(x, y), \vec{l})
$$

Таким образом, так как производная по напрвлению показывает направление наискорпейшего роста функции в заданном направлении, и скалярное произведенеи принимает максимальное значение при сонаправленности векторов, то значит **напрвлание наискорейшего роста функции совпадает с вектором градиента этой функции**.