# Базовый курс по методам анализа данных и машинного обучения

## Практическое занятие 1:  Линейная алгебра. Интерполяция
<br><br><br><br>
__Аксентьев Артем (akseart@ya.ru)__

__Ксемидов Борис (nstalker.anonim@yandex.ru)__
<br>

# Линейная алгебра

In [None]:
import numpy as np

# Создание матриц

In [None]:
np.matrix('1 2; 3 4')

In [None]:
np.matrix([[1, 2], [3, 4]])

In [None]:
np.matrix([1, 2])

In [None]:
np.matrix(np.zeros((3, 2)))

In [None]:
a = np.empty((3, 2))
b = np.empty((3, 2))
a, b, a+b

## Сложение двух матриц

In [None]:
import numpy as np
A = np.matrix([
    [3, 5],
    [1, 0]
])
B = np.matrix([
    [2, -3],
    [10, 20]
])
print(A + B)

In [None]:
A + 2

## Умножение матриц

In [None]:
import numpy as np
A = np.matrix([
    [3, 5],
    [1, 0]
])

print(A * 2)

In [None]:
import numpy as np
A = np.matrix([
    [3, 5],
    [1, 0]
])
B = np.matrix([
    [2, -3],
    [10, 20]
])
print(A * B)

In [None]:
A = np.array([
    [3, 5],
    [1, 0]
])
B = np.array([
    [2, -3],
    [10, 20]
])
print(A*B)

In [None]:
print(A.dot(B))

In [None]:
print(B.dot(A))

In [None]:
A @ B

## Деление матриц

In [None]:
A = np.array([
    [3, 5],
    [1, 0]
])
B = np.array([
    [2, -3],
    [10, 20]
])

A/B

## Транспонирование матриц

In [None]:
A = np.array([
    [3, 5],
    [1, 0]
])

print(A.T)

## Определитель матрицы

In [None]:
A = np.array([
    [3, 2],
    [1, 6]
])

np.linalg.det(A)

## Обратная матрица

In [None]:
A = np.matrix([
    [4, 9],
    [5, 4]
])
print(np.linalg.inv(A))

In [None]:
A @ np.linalg.inv(A)

## Работа с матрично-векторными выражениями

In [None]:
A = np.matrix([
    [4, 3],
    [5, 4]
])
B = np.array([1, 2])
A+B

In [None]:
A = np.array([
    [4, 3],
    [5, 4]
])
B = np.array([1, 2])


In [None]:
A@B

In [None]:
A.dot(B)

# Интерполяция

$f(x)$ действительного аргумента на отрезке $[a,b]$ — нахождение коэффициентов многочлена $P_n(x)$ степени меньшей или равной
$n$, принимающего при значениях аргумента $x_0,\ x_1,\ \ldots,\ x_n$ значения

$f(x_{i})$, множество $x_0,\ x_1,\ \ldots,\ x_n$ называют узлами интерполяции:
$$P_{n}(x_{i})=f(x_{i}),\quad i=0,\ 1,\ ...,\ n.$$

Система линейных алгебраических уравнений, определяющих коэффициенты $a_{i}$ такого многочлена, имеет вид:

$$P_{n}(x_{i})=a_{0}+a_{1}x_{i}+a_{2}x_{i}^{2}+\ldots +a_{n}x_{i}^{n}=f(x_{i}),\quad i=0,\ 1,\ \ldots ,\ n.$$

In [None]:
import plotly.graph_objs as go
import numpy as np

In [None]:
x = [0, 1, 2, 3]
y = [0, 3, 5, 4]

In [None]:
x, y

In [None]:
x = [0, 1, 2, 2.5, 3, 4]
y = np.sin(x)

In [None]:
fig = go.Figure()
x1 = np.linspace(0, 4, 400)
fig.add_trace(go.Scatter(x=x1, y=np.sin(x1)))
fig.add_trace(go.Scatter(x=x, y =y, mode='markers', name="2"))
fig.show()

In [None]:
M1 = np.array([[xi**i for i in range(len(y))]  for xi in x]) # Матрица (левая часть системы)
v1 = y

In [None]:
interpolate_X = np.linalg.solve(M1, v1)
interpolate_X

In [None]:
def get_n_polynom(X, x):
    return sum(x**i * item for i, item in enumerate(X))


In [None]:
fig = go.Figure()
x1 = np.linspace(0, 4, 400)
fig.add_trace(go.Scatter(x=x1, y=np.sin(x1)))
fig.add_trace(go.Scatter(x=x, y =y, mode='markers'))
fig.add_trace(go.Scatter(x=x, y =[get_n_polynom(interpolate_X, i ) for i in  x]))
fig.show()

## Линейная интерполяция

Геометрически это означает замену графика функции $f(x)$ прямой, проходящей через точки $\left[x_{0}, f\left(x_{0}\right)\right]$ и $\left[x_{1}, f\left(x_{1}\right)\right]$.
Уравнение такой прямой имеет вид:
$$
\frac{y-f\left(x_{0}\right)}{f\left(x_{1}\right)-f\left(x_{0}\right)}=\frac{x-x_{0}}{x_{1}-x_{0}}
$$
отсюда для $x \in\left[x_{0}, x_{1}\right]$ :
$$
\begin{aligned}
&f(x) \approx y=P_{1}(x)= \\
&=f\left(x_{0}\right)+\frac{f\left(x_{1}\right)-f\left(x_{0}\right)}{x_{1}-x_{0}}\left(x-x_{0}\right)
\end{aligned}
$$

In [None]:
def lineal_interpolation(X, Y, x):
    for i in range(len(X)-1):
        if  X[i] <= x < X[i+1]:
            return Y[i] + (Y[i+1] - Y[i]) / (X[i+1] - X[i])  * (x - X[i])


In [None]:
x, y

In [None]:
fig = go.Figure()
x1 = np.linspace(0, 4, 400)
fig.add_trace(go.Scatter(x=x1, y=np.sin(x1)))
fig.add_trace(go.Scatter(x=x, y =y, mode='markers'))
fig.add_trace(go.Scatter(x=x1, y =[lineal_interpolation(x, y, i) for i in  x1]))
fig.show()

## Интерполяционный полином Лагранжа

Пусть задана $n+1$ пара чисел $ (x_{0},y_{0}),(x_{1},y_{1}),\ldots ,(x_{n},y_{n}),$ где все
$x_{j}$ различны. Требуется построить многочлен $L(x)$ степени не более $n$, для которого
$ L(x_{j})=y_{j}$.

Ж. Л. Лагранж предложил следующий способ вычисления таких многочленов:

$$ L(x)=\sum _{i=0}^{n}y_{i}l_{i}(x),$$
где базисные полиномы $l_{i}$ определяются по формуле
$$ l_{i}(x)=\prod _{j=0,j\neq i}^{n}{\frac {x-x_{j}}{x_{i}-x_{j}}}={\frac {x-x_{0}}{x_{i}-x_{0}}}\cdots {\frac {x-x_{i-1}}{x_{i}-x_{i-1}}}\cdot {\frac {x-x_{i+1}}{x_{i}-x_{i+1}}}\cdots {\frac {x-x_{n}}{x_{i}-x_{n}}}$$

In [None]:
X = np.array([0, 0.2, 0.3, 0.55, 0.7, 0.8])
Y = np.sin(X)

In [None]:
class Lagrangian:
    def __init__(self, X, Y):
        self.X = X
        self.Y = Y

    def __lagrangian(self, x):
        result = 0
        for i, y in enumerate(self.Y):
            multiplicity = 1
            for j, _ in enumerate(self.X):
                if j == i:
                    continue
                multiplicity *= (x - self.X[j]) / (self.X[i] - self.X[j])
            result += y * multiplicity
        return result

    def __call__(self, x):
        return self.__lagrangian(x)


In [None]:
lag = Lagrangian(X, Y)

In [None]:
X, Y

In [None]:
lag(0.55)

In [None]:
fig = go.Figure()
x1 = np.linspace(0, 4, 400)
fig.add_trace(go.Scatter(x=X, y=Y, mode='markers', name="Interpolations point"))
fig.add_trace(go.Scatter(x=x1, y =[lag(x) for x in x1], name="Interpolations line"))
fig.add_trace(go.Scatter(x=x1, y=np.sin(x1), name="original function"))
fig.show()

## Интерполяционный полином Ньютона

$$
P_{\mathrm{n}}(x)=\mathrm{a}_{0}+\mathrm{a}_{1}\left(x-x_{0}\right)+\mathrm{a}_{2}\left(x-x_{0}\right)\left(x-x_{1}\right)+\ldots+\mathrm{a}_{\mathrm{n}}\left(x-x_{0}\right)\ldots\left(x-x_{n-1}\right)
$$
$$
a_{k}=\frac{\Delta^{k} y_{0}}{k ! h^{k}} \quad, \quad k=1 . . n .
$$
Конечные разности первого порядка
$$\Delta y_{0}=y_{1}-y_{0}$$
$$\Delta y_{1}=y_{2}-y_{1}$$
$$\ldots$$
$$\Delta y_{n-1}=y_{n}-y_{n-1} .$$
Конечные разности второго порядка
$$\Delta^{2} y_{0}=\Delta y_{1}-\Delta y_{0}$$
$$\Delta^{2} y_{1}=\Delta y_{2}-\Delta y_{1}$$
$$\Delta y_{n-2}={\Delta y_{n-1}}-{\Delta y_{n-2}}$$
Аналогично определяются конечные разности высших порядков:
$$
\begin{aligned}
&\Delta^{k} y_{0}=\Delta^{k-1} y_{1}-\Delta^{k-1} y_{0} \\
&\Delta^{k} y_{1}=\Delta^{k-1} y_{2}-\Delta^{k-1} y_{1}
\end{aligned}
$$
Подставляя эти выражения в формулу полинома, получаем:
$$
\begin{gathered}
P_{n}(X)=y_{0}+\frac{\Delta y_{0}}{1 ! \cdot h}\left(x-x_{0}\right)+\frac{\Delta^{2} y_{0}}{2 ! \cdot h^{2}}\left(x-x_{0}\right)\left(x-x_{1}\right)+\ldots \\
\ldots+\frac{\Delta^{n} y_{0}}{n ! \cdot h^{n}}\left(x-x_{0}\right) \ldots\left(x-x_{n-1}\right),
\end{gathered}
$$
- h-- разность между узлами интерполяции. Величина постоянная, т.е. узлы интерполяции равноотстоят друг от друга.

In [None]:
diff = np.zeros((len(Y), len(Y)))
diff

In [None]:
import math

def newton(X, Y, x):
    h = X[1] - X[0]
    res = 0
    diff = np.zeros((len(Y), len(Y)))
    diff[:,0] = Y
    for i in range(1, len(Y)):
        for j in range(len(Y) - i):
            diff[j, i] = diff[j+1, i-1] - diff[j, i-1]
    for y_num, y_i in enumerate(Y):
        item = diff[0, y_num]/(math.factorial(y_num) * h**y_num)
        for x_i in X[:y_num]:
            item *= (x - x_i)
        res += item

    return res

In [None]:
X = np.linspace(0, 2, 5)
Y = np.sin(X)

In [None]:
X, Y

In [None]:
newton(X, Y, 0.5)

In [None]:
fig = go.Figure()
x1 = np.linspace(0, 6, 400)
fig.add_trace(go.Scatter(x=X, y=Y, mode='markers'))
fig.add_trace(go.Scatter(x=x1, y =[newton(X, Y, x) for x in x1]))
fig.add_trace(go.Scatter(x=x1, y=np.sin(x1)))
fig.show()

In [None]:
class Newton:
    def __init__(self, X, Y):
        self.X = X
        self.Y = Y
        self.h = X[1] - X[0]
        self.diff = np.zeros((len(Y), len(Y)))
        self.diff[:,0] = Y
        for i in range(1, len(Y)):
            for j in range(len(Y) - i):
                self.diff[j, i] = self.diff[j+1, i-1] - self.diff[j, i-1]

    def __call__(self, x):
        res = 0
        for y_num, y_i in enumerate(Y):
            item = self.diff[0, y_num]/(math.factorial(y_num) * self.h**y_num)
            for x_i in self.X[:y_num]:
                item *= (x - x_i)
            res += item
        return res

In [None]:
X = np.linspace(0, 5, 10)
Y = np.sin(X)

In [None]:
newt = Newton(X, Y)

In [None]:
X, Y

In [None]:
newt(0.5)

In [None]:
fig = go.Figure()
x1 = np.linspace(0, 10, 400)
fig.add_trace(go.Scatter(x=X, y=Y, mode='markers'))
fig.add_trace(go.Scatter(x=x1, y =[newt(x) for x in x1]))
fig.add_trace(go.Scatter(x=x1, y=np.sin(x1)))
fig.show()

# Домашнее задание(к субботе):
1. Решить следующие примеры "руками", а затем проверить на Python:
    - Вычислить определитель $
        \left|\begin{array}{ccc}
        -4 & -1 & 1 \\
        1 & 5 & -2 \\
        1 & -3 & 1
        \end{array}\right|
    $
    - Вычислить произведение матриц: $\left(\begin{array}{lll}1 & -3 & 2 \\ 3 & -4 & 1 \\ 2 & -5 & 3\end{array}\right) \cdot\left(\begin{array}{lll}2 & 5 & 6 \\ 1 & 2 & 5 \\ 1 & 3 & 2\end{array}\right)$
    - Вычислить произведение матриц: $\left(\begin{array}{ll}4 & 3 \\ 7 & 5\end{array}\right) \cdot\left(\begin{array}{cc}-28 & 93 \\ 38 & -126\end{array}\right) \cdot\left(\begin{array}{ll}7 & 3 \\ 2 & 1\end{array}\right)$
    - Вычислить произведение матриц: $\left(\begin{array}{lll}1 & -3 & 2 \\ 3 & -4 & 1 \\ 2 & -5 & 3\end{array}\right) \cdot\left(\begin{array}{lll}2 & 5 & 6 \\ 1 & 2 & 5 \\ 1 & 3 & 2 \\ 24 & 22 & 13\end{array}\right)$
2. Разобраться в обратном алгоритме Ньютона и реализовать его на Python
3. Для предыдущего задания реализовать возможность передавать последовательность для получения данных интерполяции *

# Рекомендуемая литература:
- http://cs.mipt.ru/advanced_python/lessons/lab16.html#section-3
- http://www.myshared.ru/slide/616612/