# Необходимые понятия из математического анализа и линейной алгебры

In [200]:
%matplotlib notebook

In [11]:
import numpy as np
import numpy.linalg as la

## Линейная алгебра

### Обозначения

$A ∈ R^{m×n}$ матрица с m строками и n столбцами и действительными числами.
are real numbers. $A_{ij}$ - элемент на i строке и j столбце

$x ∈ R^{n}$ вектор с n элементами, здесь вектором будут обозначать вектор столбец, $x^T$ будем обозначать вектор строчку.
$x_i$ - i элемент вектора x


In [8]:
x = np.ones(10).reshape(10, 1)
A = np.ones(10).reshape(2, 5)

In [9]:
x

array([[1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.],
       [1.]])

In [10]:
A

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

Базовые операции с векторами

In [16]:
x = np.random.rand(3)
y = np.random.rand(3)

In [19]:
x, x + 1, x * 2, x**2

(array([0.9800766 , 0.57613862, 0.43178602]),
 array([1.9800766 , 1.57613862, 1.43178602]),
 array([1.9601532 , 1.15227723, 0.86357205]),
 array([0.96055014, 0.33193571, 0.18643917]))

In [21]:
# сложение векторов
x, y, x + y

(array([0.9800766 , 0.57613862, 0.43178602]),
 array([0.70252636, 0.43411265, 0.04579168]),
 array([1.68260296, 1.01025126, 0.47757771]))

векторизация

In [51]:
x = np.random.rand(10000)
y = np.random.rand(10000)
%time z = [xi+ yi for xi, yi in zip(x , y)]
%time z2 = x + y
np.array_equal(z, z2), np.allclose(z, z2)

CPU times: user 3.84 ms, sys: 0 ns, total: 3.84 ms
Wall time: 3.85 ms
CPU times: user 26 µs, sys: 2 µs, total: 28 µs
Wall time: 31.5 µs


(True, True)

#  Скалярное произведение векторов

$\textbf{u} \cdot \textbf{v} = \left \Vert \textbf{u} \right \| \times \left \Vert \textbf{v} \right \| \times cos(\theta)$  

или

$\textbf{u} \cdot \textbf{v} = \sum_i({\textbf{u}_i \times \textbf{v}_i})$


In [52]:
%time z1 = sum([ xi*yi for xi, yi in zip(x , y)])
%time z2 = x.dot(y)
%time z3 = np.dot(x, y)
%time z4 = x @ y
print(z1, z2, z3, z4)

CPU times: user 1.45 ms, sys: 133 µs, total: 1.59 ms
Wall time: 1.59 ms
CPU times: user 681 µs, sys: 0 ns, total: 681 µs
Wall time: 181 µs
CPU times: user 182 µs, sys: 0 ns, total: 182 µs
Wall time: 42.4 µs
CPU times: user 700 µs, sys: 64 µs, total: 764 µs
Wall time: 182 µs
2491.860186816321 2491.8601868163178 2491.8601868163178 2491.8601868163178


### Норма вектора

Норма вектора - мера длины. Рассмотрим l-n норму.

$\left \Vert \textbf{u} \right \|_l = ({\sum_{i}{\textbf{u}_i}^l})^{1/l}$

Например l2

$\left \Vert \textbf{u} \right \|_2 = \sqrt{{\textbf{u}_1}^2 + {\textbf{u}_2}^2 + {\textbf{u}_3}^2 + ...}$

In [54]:
%time z1 = sum([ xi**2 for xi in x])**0.5
%time z2 = la.norm(x)
%time z3 = np.sqrt(np.sum(x**2))
%time z4 = np.sqrt(np.dot(x, x))
print(z1, z2, z3, z4)

CPU times: user 5.38 ms, sys: 116 µs, total: 5.49 ms
Wall time: 5.46 ms
CPU times: user 742 µs, sys: 0 ns, total: 742 µs
Wall time: 208 µs
CPU times: user 446 µs, sys: 39 µs, total: 485 µs
Wall time: 114 µs
CPU times: user 2.78 ms, sys: 242 µs, total: 3.02 ms
Wall time: 868 µs
57.79714283793897 57.797142837939 57.797142837939 57.797142837939


Вопросы: 
    - чему равна l1 норма?
    - чему равна l-бесконечность норма?

In [None]:
x = np.arange(3)
la.norm(x, 1), la.norm(x, np.inf)

### Умножение матрицы на вектор
https://see.stanford.edu/materials/aimlcs229/cs229-linalg.pdf

#### Умножение матрицы на вектор столбец.
y = Ax

$A ∈ R^{m×n}$, x ∈ $R^n$, y ∈ $R^m$

$y_i = \sum_{k=1}^n A_{ik} x_{k}$


Интерпретация:
1. Вектор со скалярными произведениями строчeк A и x
2. Вектор который явзяется линейной комбинайцией столбцов A с коэффициентами x

#### Умножение матрицы на вектор строчку.
$y^T = x^TA$ - умножение вектор строчка на матрицу

Интерпретация:
1. Вектор со скалярными произведениями столбцов A и x
2. Вектор который явзяется линейной комбинайцией строчек A с коэффициентами x

In [61]:
x = np.arange(1, 4).reshape(-1, 1)
A = np.array([
    [1, 4, 3],
    [4, 1, 7],
])

In [62]:
x

array([[1],
       [2],
       [3]])

In [63]:
A

array([[1, 4, 3],
       [4, 1, 7]])

In [64]:
A @ x

array([[18],
       [27]])

In [69]:
# распишем произведение по определению
m, n = A.shape
for i in range(m):
    val = 0
    for k in range(n):
        val += A[i, k] * x[k]
    print(f'{i}-th element is {val}')

0-th element is [18]
1-th element is [27]


In [68]:
# распишем произведение как скалярное произведение
for i in range(m):
    print(f'{i}-th element is {A[i].dot(x)}')

0-th element is [18]
1-th element is [27]


In [74]:
# распишем произведение сумму векторов
res = 0
for i in range(n):
    print(f'{i}-th column: {A[:, i]} * {x[i]}')
    res += A[:, i] * x[i]
res

0-th column: [1 4] * [1]
1-th column: [4 1] * [2]
2-th column: [3 7] * [3]


array([18, 27])

In [76]:
# не можем умножить слева, так как x это вектор столбец
x * A

ValueError: operands could not be broadcast together with shapes (3,1) (2,3) 

In [80]:
# зато можем умножить вектор строчку на матрицу
x.T @ A.T

array([[18, 27]])

In [89]:
# рассмотрим векторизацию
def matrix_vector_prod(A, x):
    res = []
    m, n = A.shape
    for i in range(m):
        val = 0
        for k in range(n):
            val += A[i, k] * x[k]
        res.append(val)
    return res

In [90]:
A = np.random.rand(1000, 20000)
x = np.random.rand(20000)

%time z1 = matrix_vector_prod(A, x)
%time z2 = A @ x

CPU times: user 5.16 s, sys: 0 ns, total: 5.16 s
Wall time: 5.16 s
CPU times: user 26.8 ms, sys: 0 ns, total: 26.8 ms
Wall time: 6.57 ms


### Умножение матрицы на матрицу

Определение:

$A ∈ R^{m×n}$, B ∈ $R^{n×p}$

$C = AB ∈ R^{m×p}$

$C_{ij} = \sum_{k=1}^n A_{ik} B_{kj}$



Интерпретация:

1) На основе скалярного произведения. i,j элемент скалярное произведение i - строчки A, j - столбца B

2) На основе сложения столбцов матрицы A - представим, что это p умножений столбцов матрицы B на матрицу A

3) На основе сложения строчек матрицы B - представим, что это m умножений строчек матрицы A на матрицу B

In [92]:
# рассмотрим векторизацию
def matrix_matrix_prod(A, B):
    assert A.shape[1] == B.shape[0]
    m, n = A.shape
    _, p = B.shape
    res = np.zeros((m, p))
    
    for i in range(m):
        for j in range(p):
            for k in range(n):
                res[i, j] += A[i, k] * B[k, j]
    return res

In [101]:
A = np.random.rand(100, 200)
B = np.random.rand(200, 400)

%time z1 = matrix_matrix_prod(A, B)
%time z2 = A @ B
np.allclose(z1, z2), np.array_equal(z1, z2)

CPU times: user 3.42 s, sys: 0 ns, total: 3.42 s
Wall time: 3.42 s
CPU times: user 586 µs, sys: 0 ns, total: 586 µs
Wall time: 324 µs


(True, False)

умножение матриц не коммутативно
AB != BA

In [102]:
A = np.random.rand(2, 2)
B = np.random.rand(2, 2)

In [103]:
A

array([[0.17962924, 0.59269211],
       [0.24782304, 0.97571854]])

In [104]:
B

array([[0.72598632, 0.77496002],
       [0.28077828, 0.74434024]])

In [105]:
A @ B

array([[0.29682344, 0.58037007],
       [0.45387671, 0.91831953]])

In [106]:
B @ A

array([[0.32246132, 1.18642922],
       [0.23490065, 0.89268165]])

умножение ассоциативно
(AB)C = A(BC)

In [111]:
A = np.random.rand(2, 2)
B = np.random.rand(2, 2)
C = np.random.rand(2, 2)

print((A @ B) @ C)
print()
print(A @ (B @ C))

[[0.92143052 0.4316591 ]
 [1.07611873 0.51268173]]

[[0.92143052 0.4316591 ]
 [1.07611873 0.51268173]]


умножение дистрибутивно
A(B + C) = AB + AC

In [114]:
print(A @ ( B + C))
print()
print(A @ B + A @ C)

[[1.58231025 0.86327805]
 [1.81252331 0.90896226]]

[[1.58231025 0.86327805]
 [1.81252331 0.90896226]]


### Важные матрицы:
единичная матрица -- квадратная матрица у которой на диагонали стоият единицы

In [115]:
np.eye(10)

array([[1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 1., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 1., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 1., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0., 0., 0., 1.]])

диагональная матрица - это матрица у которой ненулевые элементы стоят только на главное диагонали

In [119]:
np.diag([1,2,3])

array([[1, 0, 0],
       [0, 2, 0],
       [0, 0, 3]])

транспонированная матрица - матрица полеченная из исходной заменой строчек на столбцы:

$(A^T)_{ij} = A_{ji}$

In [121]:
A = np.arange(10).reshape(5, 2)
print(A)
print()
print(A.T)

[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]

[[0 2 4 6 8]
 [1 3 5 7 9]]


Симметричная матрица:

$A = A^T$

Антисимметричная матрица:

$A = −A^T$

Любую матрице можно представить как сумма симметричной и антисимметричной:

$A = 0.5 (A + A^T) + 0.5 (A - A^T)$

### Свойства матриц

ранг матрицы - максимальное число линейно независимых столбцов в матрице.

набор вектора называются линейно независимыми - если никакой вектор из этого набора не может быть выражен как линейная комбинация остальных векторов

In [178]:

x = np.array([1,2,3])
y = np.array([3,2,3])
z = np.array([7, 6, 9])
(x + 2*y) == z

array([ True,  True,  True])

In [181]:
A = np.random.rand(10, 10)
print(la.matrix_rank(A))
print(la.matrix_rank(np.array([x,y,z])))

10
2


след матрицы (trace) - сумма диагональных элементов

In [125]:
A = np.random.rand(2, 2)

In [126]:
A

array([[0.13423334, 0.00836608],
       [0.35763931, 0.25447095]])

In [127]:
A.trace()

0.3887042846020753

норма фробениуса: корень квадратный из сумма квадратов всех элементов матрицы

In [132]:
la.norm(A), np.sqrt((A ** 2).sum()), np.sqrt(np.trace(A @ A.T))

(0.45907507242876316, 0.45907507242876316, 0.45907507242876316)

### Обратная матрица

применимо только для квадратных матриц (для не квадратных матриц псевдо обратные матрицы)

$A^{−1}A = I = AA^{−1}$

Обратная матрица существует тогда и только тогда, когда ранк матрицы nxn равен n (или матрица полного ранга).

Свойства:
- обратная матрица единственна
- $(A^{−1})^{−1}=A $
- При умножение матрицы на вектор мы как-то меняем координаты вектора в пространстве. Обратная матрица возвращает исходный вектор
- $(AB)^{−1} = B^{−1}A^{−1}$
-  $(A^{−1}){T} = (A{T}){−1}$


### Сложность вычисления обратной матрицы

|Алгоритм|Сложность|
|---|---|
|Gauss–Jordan elimination|$O(n^3)$|
|Strassen algorithm|$O(n^{2.807})$|
|Coppersmith–Winograd algorithm|$O(n^{2.376})$|
|Optimized CW-like algorithms|$O(n^{2.373})$|


In [135]:
A = np.array([[1.,2], [3, 1]])
A

array([[1., 2.],
       [3., 1.]])

In [168]:
A_inv = la.inv(A) 
print(A_inv)
print()
print(la.inv(A_inv))

[[-0.2  0.4]
 [ 0.6 -0.2]]

[[1. 2.]
 [3. 1.]]


In [146]:
print(A @ A_inv)
print()
print(A_inv @ A)

[[1. 0.]
 [0. 1.]]

[[1. 0.]
 [0. 1.]]


In [147]:
x = [1, 2]

In [143]:
x2 = A.dot(x)
x2

array([5., 5.])

In [149]:
A_inv.dot(x2)

array([1., 2.])

Вектора ортогональны, если их скалярное произведение равно нулю. Вектора нормализированны, если их l2 норма равна единице.

ортогональные/ортонормальная матрица
Матрица у которой столбцы нормализированы и  скалярное произведение разных столбцов равно нулю

$U^TU = I = UU^T$

$U^T=U^{-1}$ для квадратных матриц

In [157]:
ang = 1
U = np.array([[np.cos(ang), -np.sin(ang)], [np.sin(ang), np.cos(ang)]])
U

array([[ 0.54030231, -0.84147098],
       [ 0.84147098,  0.54030231]])

In [159]:
la.norm(U[:, 0]), la.norm(U[:, 1])

(1.0, 1.0)

In [161]:
print(U)
print()
print(U.T)
print()
print(la.inv(U))

[[ 0.54030231 -0.84147098]
 [ 0.84147098  0.54030231]]

[[ 0.54030231  0.84147098]
 [-0.84147098  0.54030231]]

[[ 0.54030231  0.84147098]
 [-0.84147098  0.54030231]]


### Определитель матрицы

Определитель квадратной матрицы. Выразим через рекурсивную формулу

$$ \Delta = \sum_{j=1}^{n}(-1)^{1+j}a_{1j} |A_{\1\j}| $$

где $|A_{\1\j}|$ - дополнительный минор к элементу $a_{1j}$

Дополнительный минор - определитель матрицы, полученной вычеркиванием первой строки и $j$ столбца


Пример:

Найдем определитель матрицы размером $3 \times 3$:

$A = \begin{bmatrix}
  1 & 2 & 3 \\
  4 & 5 & 6 \\
  7 & 8 & 0
\end{bmatrix}$

Применяем формулу:

$det(A) = 1 \times \left | \begin{bmatrix} 5 & 6 \\ 8 & 0 \end{bmatrix} \right |
     - 2 \times \left | \begin{bmatrix} 4 & 6 \\ 7 & 0 \end{bmatrix} \right |
     + 3 \times \left | \begin{bmatrix} 4 & 5 \\ 7 & 8 \end{bmatrix} \right |$

Расчитаем определители каждой из этих матриц размером $2 \times 2$  (**дополнительные миноры**):

$\left | \begin{bmatrix} 5 & 6 \\ 8 & 0 \end{bmatrix} \right | = 5 \times 0 - 6 \times 8 = -48$

$\left | \begin{bmatrix} 4 & 6 \\ 7 & 0 \end{bmatrix} \right | = 4 \times 0 - 6 \times 7 = -42$

$\left | \begin{bmatrix} 4 & 5 \\ 7 & 8 \end{bmatrix} \right | = 4 \times 8 - 5 \times 7 = -3$

Подсчитаем результат:

$det(A) = 1 \times (-48) - 2 \times (-42) + 3 \times (-3) = 27$

Определим присоединенную матрицу к матрице A:

$adj(A)_{ij} = (−1)^{i+j} |A_{\j,\i}$|

Тогда обратная матрица будет равна:
$$A^{-1}=\frac{1}{detA}adj(A)$$


Свойства определителя:
- $|A| = |A^T|$
- $|AB| = |A||B|$ для квадратных AB
- |A| = 0 тогда и только тогда, когда  A сингулярна (нет обратной матрицы).
- $|A^{−1}| = 1/|A|$ (для обратимой матрицы A)

In [169]:
m = np.array([
        [1, 2, 3],
        [4, 5, 6],
        [7, 8, 0]
    ])
la.det(m)

27.0

### Сложность вычисления определителя матрицы

|Алгоритм|Сложность|
|---|---|
|Laplace expansion|$O(n!)$|
|Division-free algorithm|$O(n^4)$|
|LU decomposition|$O(n^3)$|
|Bareiss algorithm|$O(n^3)$|
|Fast matrix multiplication|$O(n^{2.373})$|



Вопрос:
- Геометрическая интерпретация определителя?

## Квадратичные формы и положительно полуопределенные матрицы

#### Квадратичная форма для квадратной матрицы:
$x^TAx= \sum_{i=1}^{n}\sum_{j=1}^{n} A_{ij}x_ix_j$

$x^TAx = (x^TAx)^T = x^TA^Tx = x^T(0.5A + 0.5A^T)x$ -- в квадратичную форму вносит вклад только симметричная часть матрицы

Вопос, почему возможен первый переход в равенстве выше?


Симметричная матрица A:
- положительно определена, если для любого ненулевого x, квадратичная форма больше нуля
- положительно полуопределена, если для любого ненулевого x, квадратичная форма больше либо равна нулю
- отрицательно определена, если для любого ненулевого x, квадратичная форма больше нуля
- отрицательно полуопределена, если для любого ненулевого x, квадратичная форма меньше либо равно нулю
- в остальных случаях матрица неопределена

## Собственные числа и собственные векторы

Ненулевой вектор $x$ в линейном пространстве $\mathcal{L}$ называют **собственным вектором линейного оператора** $A: \mathcal{L} \to\mathcal{L}$, если для некоторого действительного числа $\lambda$ выполняется соотношение $Ax=\lambda x$. При этом число $\lambda$ называют **собственным значением (собственным числом)** оператора $A$.

Рассмотрим матрицу

$$A= \begin{bmatrix} -1 & -6 \\ 2 & 6 \end{bmatrix} $$

Умножим на матрицу

$$\begin{bmatrix} 2 \\ -1 \end{bmatrix}$$

$$\begin{bmatrix} -1 & -6 \\ 2 & 6 \end{bmatrix} \times \begin{bmatrix} 2 \\ -1 \end{bmatrix} = 
\begin{bmatrix} -1 \cdot 2 + 6\cdot 1  \\ 2 \cdot 2 - 6 \cdot 1 \end{bmatrix} = 
\begin{bmatrix} 4  \\ -2  \end{bmatrix} = 2\begin{bmatrix} 2  \\ -1  \end{bmatrix}$$

Смысл этих понятий следующий:

Матрица является оператором, делающим преобразование в пространстве - поворот, сдвиг и пр. 
Для оператора мы вычисляем вектора и числа такие, что при применении к вектору оператора получаем масштабирование вектора.

Свойства:
- След матрицы равен сумме собсвенных числел
- Определитель равен произведению собственных чисел
- Ранг матрицы (максимальное количество линейно независимых элементов) равен количеству ненулевых собственных чисел
- Если матрица несингулярна, то собсвенные числа обратной матрицы равны 1 / $\lambda$ 
- Собственные числа диагональной матрицы это диагональные элементы

Вопрос:
- чему равны равны собсвенные вектора диагональной матрицы?

In [172]:
m = np.array([-1, -6, 2, 6]).reshape(2, 2)
print(la.eig(m))
v = np.array([2, -1])
print(v / la.norm(v))

(array([2., 3.]), array([[-0.89442719,  0.83205029],
       [ 0.4472136 , -0.5547002 ]]))
[ 0.89442719 -0.4472136 ]


Мы можем расписать уравнение на поиск собсвенных значений как:
AX = XΛ
где X - матрица в которой столбцы это собсвенные вектора A, Λ -- диагональная матрица с собсвенными числами на диагонали

Если собственные числа линейно независимы, то мы можем разложить матрицу следующим образом:

$A = XΛX^{−1}$

### Сингулярное разложение (SVD -- singular value decomposition)

Любая матрица $m \times n$ matrix $A$ может быть разложена на матричное произведение 3 матриц:
* матрица поворота $U$ ($m \times m$ ортогональная матрица)
* диагональная матрица с неотрицательными элементами (scaling & projecting matrix) $\Sigma$ ($m \times n$)
* матрица поворота $V^T$ ($n \times n$ ортогональная матрица)

$A = U \cdot \Sigma \cdot V^{T}$

Таким образом мы раскладываем преобразование данной матрицы на 3 компоненты:
- поворот
- масштабирование 
- еще один поворот

In [193]:
A = np.array([
    [1, 1.5],
    [0, 1]
])
U, S_diag, V_T = la.svd(A)
U

array([[ 0.89442719, -0.4472136 ],
       [ 0.4472136 ,  0.89442719]])

In [194]:
S_diag

array([2. , 0.5])

In [195]:
V_T

array([[ 0.4472136 ,  0.89442719],
       [-0.89442719,  0.4472136 ]])

## Производная

Точку $b \in \mathbb R$ называют пределом функции $f(x)$ в точке $a \in \mathbb R$, если, каково бы ни было положительное число $\epsilon$, найдется положительное число $\delta$, такое, что для всех точек проколотой $\delta$-окрестности точки $a$ значения функции принадлежат $\epsilon$-окрестности точки $b$

<img src="limit.png" width=250>

Для произвольной функции $y=f(x)$ с отношение приращений называется **разностным отношением**

$$ \frac{\Delta y}{\Delta x} = \frac{\Delta f(a)}{\Delta x}=\frac{f(a+\Delta x) - f(a)}{\Delta x} = \varphi (\Delta x)$$

Пусть функция $y=f(X)$ определена в точке $x=a$ и некоторой её окрестности.

**Производной** $f'(a)$ **функции** $f(x)$ в фиксированной точке $x=a$ называют предел при $\Delta x \rightarrow 0$ разностного отношения (при условии, что этот предел существует), т.е.

$$ f'(x) = \lim_{\Delta x \rightarrow 0} \frac{\Delta f(a)}{\Delta x}=\lim_{\Delta x \rightarrow 0} \frac{f(a+\Delta x) - f(a)}{\Delta x}$$

Пусть функции $u(x)$ и $v(x)$ дифференцируемы в точке $x$. Тогда в этой точке дифференцируемы их сумма (разность), произведение и частное (последнее при условии $v(x) \neq 0$), причем (опуская в обозначениях аргумент $x$) справедливы равенства:


1. $(u+v)'=u'+v'$
1. $(uv)'=u'v+uv'$
1. $(\frac{u}{v})'=\frac{u'v-uv'}{v^2}$

Производная сложной функции $F(x) = y(u(x))$ по независимому переменному $x$ равна произведению производной функции  $y(u)$ по промежуточному аргементу $u$ и промежуточного аргумента $u(x)$ по $x$, т.е. 

$$F'(x) = y'_u\rvert _{u=u(x)}u'(x)$$

Основные правила дифференцирования

1. $y=Cu\quad (C=const) \hspace{50pt} y'=Cu'$
1. $y=u\pm v  \hspace{93pt} y'=u'\pm v'$
1. $y=uv \hspace{103pt} y'=u'v+uv'$
1. $y=\frac{u}{v}\quad (v\neq 0) \hspace{69pt} y'=\frac{u'v-uv'}{v^2}$
1. $y=f(u),\quad u=u(x)\hspace{52pt} y'_x=f'_uu'$
1. $y=f(x),\quad x=f^{-1}(y) \hspace{45pt} x'_y=\frac{1}{y'_x} \quad (y'_x \neq 0)$
1. $y= \begin{cases} y=y(t), \\ x=x(t) \end{cases} \hspace{65pt} \begin{cases} y'_x=\frac{y'_t}{x'_t} & (x'_t \neq 0) \\ x=x(t) \end{cases}$

**Производные элементарных функций**

1. $(C)'=0 \quad (C=const)$
2. $(u^s)' = su^{s-1}\cdot u'$  
при $s=1/2 \quad (\sqrt{u})'=\frac{1}{2\sqrt{u}}\cdot u'$  
при $s=-1 \quad (\frac{1}{u})'=-\frac{1}{u^2}\cdot u'$
3. $(a^u)'=a^ulna\cdot u' \quad (a>0, a\neq1),$  
$(e^u)'=e^u\cdot u'$
4. $(\log_au)'=\frac{1}{u\ln a}\cdot u' \quad (a>0, a \neq 1)$  
$(\ln u)'=\frac{1}{u}\cdot u'$
5. $(\sin u)'=\cos u \cdot u'$
6. $(\cos u)'=-\sin u \cdot u'$
7. $(tg u)'=\frac{1}{\cos^2u} \cdot u'$
8. $(ctg u)'=-\frac{1}{\sin^2u} \cdot u'$
9. $(\arcsin u)'=\frac{1}{\sqrt{1-u^2}} \cdot u'$
10. $(\arccos u)'=-\frac{1}{\sqrt{1-u^2}} \cdot u'$
11. $(arctg u)'=\frac{1}{1+u^2} \cdot u'$
12. $(arcctg u)'=-\frac{1}{1+u^2} \cdot u'$
13. $(sh u)'=ch u \cdot u'$
14. $(ch u)'=sh u \cdot u'$
15. $(th u)'=\frac{1}{ch^2 u} \cdot u'$
16. $(cth u)'=-\frac{1}{sh^2 u} \cdot u'$

Вопросы:
- Как в математике используют производные?

## Неопределенный интеграл

функцию $F(x)$ называют первообразной функции $f(x)$ в промежутке $X$, если $F(x)$ дифференцируема в этом промежутке и для любого $x \in X$ значение производной $F'(x)$ совпадает со значением функции $f(x)$.

Множество всех первообразных функции $f(x)$ в некотором промежутке называют неопределенным интегралом от этой функции в данном промежутке и обозначают $\int f(x)dx$. При этом символ $\int$ именуют знаком интеграла, $f(x)$ - подынтегральной функцией, $f(x)dx$ - подынтегральным выражением, а $x$ - переменным интегрирования.

$$\int f(x)dx=F(x) + C$$

**Свойства**

1. $$\left(\int{f(x)dx}\right)' = (F(x)+C)' = f(x)$$
2. $$\int{F'(x)dx} = F(x)+C$$
3. Если $\lambda \in \mathbb R \backslash \{0\}$, то
$$\int \lambda f(x)dx=\lambda \int f(x)dx$$
4. $$\int (\lambda_1 f_1(x)+\lambda_2 f_2(x))dx=\lambda_1 \int f_1(x)dx + \lambda_2 \int f_2(x)dx$$




**Основные неопределенные интегралы**

1. $\int u^sdu=\frac{u^{s+1}}{s+1} \quad s \neq -1$
2. $\int \frac{du}{u}=ln|u|+C$
3. $\int a^udu=\frac{a^u}{\ln a}+C, a > 0, a \neq 1$
4. $\int e^u du = e^u+C$
5. $ \int \sin u du = -\cos u + C$
6. $\int \cos udu = \sin u + C$
7. $\int \frac{du}{\cos^2u}=tg u + C$
8. $\int \frac{du}{\sin^2u}=-ctgu + C$
9. $\int shudu=chu+c$
10. $\int ch udu=shu+C$
11. $\int \frac{du}{ch^2u}=thu+C$
12. $\int \frac{du}{sh^2u}=-cthu+C$
13. $\int \frac{du}{u^2+a^2}=\frac{1}{a}arctg \frac{u}{a}+C=-\frac{1}{a}arcctg \frac{u}{a}+C_1, a \neq 0$
14. $\int \frac{du}{u^2-a^2}=\frac{1}{2a}\ln |\frac{u-a}{u+a}|+C$
15. $\int \frac{du}{\sqrt{a^2-u^2}}=arcsin \frac{u}{a}+C=-arccos \frac{u}{a}+C_1, a \neq 0$
16. $\int \frac{du}{\sqrt{u^2+A}}=\ln|{u+\sqrt{u^2+A}}| + C$

# Определенный интеграл

### Функция одной переменной
площадь под кривой
$I = \sum_{i=0}^n f(x_{i}) \Delta x_{i}$  

$\Delta x_{i}$ -> 0
<img src="integral.png" width=500>

### Функция двух переменных
объем под поверхностью
<img src="integral2.png" width=500>

# Градиент
обощение производной
## Градиент относительно вектора
Пусть функция f выглядит следующим образом (переводит вектор в скаляр):

$f : R^{n} → R$

Например: $f(x) = x_1^2 + 3*x_2^3$


$ \nabla_x f(x) = \begin{bmatrix} \frac{\delta f(x)}{\delta x_1} \\ ...\\ \frac{\delta f(x)}{\delta x_n} \end{bmatrix}$

$ \nabla_x f(x) = \begin{bmatrix} 2x_1 \\ 9x_2^2 \end{bmatrix}$

## Градиент относительно матрицы
$f : R^{m x n} → R$

$ \nabla_A f(A) = \begin{bmatrix} \frac{\delta f(A)}{\delta A_{11}} & ...& \frac{\delta f(A)}{\delta A_{1n}}  \\ &...&\\ \frac{\delta f(A)}{\delta A_{m1}} & ... &  \frac{\delta f(A)}{\delta A_{mn}}\end{bmatrix}$

# Гессиан 
матрица вторых производных
$ \nabla_x^2 f(x) = \begin{bmatrix} \frac{\delta^2 f(x)}{\delta x_1^2} & \frac{\delta^2 f(x)}{\delta x_1 \delta x_2}& ...
 \frac{\delta^2 f(x)}{\delta x_1 \delta x_n}  \\ &...&\\ \frac{\delta^2 f(x)}{\delta x_n^2} & \frac{\delta^2 f(x)}{\delta x_n \delta x_2}& ...
 \frac{\delta^2 f(x)}{\delta x_n^2}\end{bmatrix}$
 
 пример:
 
$f(x) = x_1^2 + 3*x_2^3 + 10x_1 x_2$

$ \nabla_x^2 f(x) = \begin{bmatrix} 2 & 10 \\ 10 & 18x_2\end{bmatrix}$


Гессиан всегда симметричен