# NumPy: векторы и операции над ними
---

In [2]:
import numpy as np

## 1.Создание векторов

In [5]:
a = np.array([1, 2, 3, 4])
print('Вектор:\n', a)

Вектор:
 [1 2 3 4]


In [6]:
b = np.array([1, 2, 3, 4, 5], dtype=float)
print('Вещественный вектор:\n', b)

Вещественный вектор:
 [1. 2. 3. 4. 5.]


In [7]:
c = np.array([True, False, True], dtype=bool)
print('Булевский вектор:\n', c)

Булевский вектор:
 [ True False  True]


In [9]:
print('Тип булевоского вектора:\n', c.dtype)

Тип булевоского вектора:
 bool


In [11]:
d = np.arange(start=10, stop=20, step=2)
print('Вектор чисел от 10 до 20 с шагом 2:\n', d)

Вектор чисел от 10 до 20 с шагом 2:
 [10 12 14 16 18]


In [12]:
f = np.arange(start=0, stop=1, step=0.3, dtype=float)
print('Вещественный вектор чисел от 0 до 1 с шагом 0.3:\n', f)

Вещественный вектор чисел от 0 до 1 с шагом 0.3:
 [0.  0.3 0.6 0.9]


In [13]:
print(c.ndim) # размерность

1


In [21]:
print(c.shape) # shape фактически задает длину вектора

(3,)


## Операции над векторами

In [16]:
a = np.array([1, 2, 3])
b = np.array([6, 5, 4])
k = 2

print('Вектор a:', a)
print('Вектор b:', b)
print('Число k:', k)

Вектор a: [1 2 3]
Вектор b: [6 5 4]
Число k: 2


In [17]:
print('Сумма a и b:\n', a+b)

Сумма a и b:
 [7 7 7]


In [18]:
print('Разность a и b:\n', a - b)

Разность a и b:
 [-5 -3 -1]


In [19]:
print('Покоординатное умножение a и b:\n', a * b)

Покоординатное умножение a и b:
 [ 6 10 12]


In [20]:
print('Умножение вектора на число (осуществляется покоординатно):\n', k * a)

Умножение вектора на число (осуществляется покоординатно):
 [2 4 6]


## 3.Нормы векторов

### p-норма

p-норма (норма Гёльдера) для вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ вычисляется по формуле:

$$
\left\Vert x \right\Vert_{p} = \left( \sum_{i=1}^n \left| x_{i} \right|^{p} \right)^{1 / p},~p \geq 1.
$$

В частных случаях при:
* $p = 1$ получаем $\ell_{1}$ норму
* $p = 2$ получаем $\ell_{2}$ норму

In [24]:
from numpy.linalg import norm

### $\ell_{1}$ норма

$\ell_{1}$ норма 
(также известная как манхэттенское расстояние)
для вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ вычисляется по формуле:

$$
 \left\Vert x \right\Vert_{1} = \sum_{i=1}^n \left| x_{i} \right|.
$$

Ей в функции __`numpy.linalg.norm(x, ord=None, ...)`__ соответствует параметр __`ord=1`__.

In [25]:
a = np.array([1, 2, -3])
print('Вектор a:', a)


Вектор a: [ 1  2 -3]


In [26]:
print('L1 норма вектора a:\n', norm(a, ord=1))

L1 норма вектора a:
 6.0


### $\ell_{2}$ норма

$\ell_{2}$ норма (также известная как евклидова норма)
для вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ вычисляется по формуле:

$$
 \left\Vert x \right\Vert_{2} = \sqrt{\sum_{i=1}^n \left( x_{i} \right)^2}.
$$

Ей в функции __`numpy.linalg.norm(x, ord=None, ...)`__ соответствует параметр __`ord=2`__.

In [27]:
print('L2 норма вектора a:\n', norm(a, ord=2))

L2 норма вектора a:
 3.7416573867739413


## 4.Расстояние между векторами

Для двух векторов $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ и $y = (y_{1}, \dots, y_{n}) \in \mathbb{R}^{n}$ $\ell_{1}$ и $\ell_{2}$ раccтояния вычисляются по следующим формулам соответственно:

$$
 \rho_{1}\left( x, y \right) = \left\Vert x - y \right\Vert_{1} = \sum_{i=1}^n \left| x_{i} - y_{i} \right|
$$

$$
 \rho_{2}\left( x, y \right) = \left\Vert x - y \right\Vert_{2} = 
 \sqrt{\sum_{i=1}^n \left( x_{i} - y_{i} \right)^2}.
$$

In [29]:
a = np.array([1, 2, -3])
b = np.array([-4, 3, 8])
print('Вектор a:', a)
print('Вектор b:', b)

Вектор a: [ 1  2 -3]
Вектор b: [-4  3  8]


In [30]:
print('L1 расстояние между векторами a и b:\n', norm(a - b, ord=1))

L1 расстояние между векторами a и b:
 17.0


In [31]:
print('L2 расстояние между векторами a и b:\n', norm(b - a, ord=2))

L2 расстояние между векторами a и b:
 12.12435565298214


Также расстояние между векторами можно посчитать с помощью функции __`scipy.spatial.distance.cdist(XA, XB, metric='euclidean', p=2, ...)`__ из модуля `SciPy`, предназначенного для выполнения научных и инженерных расчётов. 

In [32]:
from scipy.spatial.distance import cdist

__`scipy.spatial.distance.cdist(...)`__ требует, чтобы размерность __`XA`__ и __`XB`__ была как минимум двумерная. По этой причине для использования этой функции необходимо преобразовать _векторы_ к _вектор-строкам_. 

In [33]:
a = np.array([6, 3, -5])
b = np.array([-1, 0, 7])
print('Вектор a:', a)
print('Его размерность:', a.shape)
print('Вектор a:', b)
print('Его размерность:', b.shape)

Вектор a: [ 6  3 -5]
Его размерность: (3,)
Вектор a: [-1  0  7]
Его размерность: (3,)


In [35]:
a = a.reshape((1,3))
b = b.reshape((1,3))
print('После применения метода reshape:\n')
print('Вектор-строка a:', a)
print('Его размерность:', a.shape)
print('Вектор-строка a:', b)
print('Его размерность:', b.shape)

После применения метода reshape:

Вектор-строка a: [[ 6  3 -5]]
Его размерность: (1, 3)
Вектор-строка a: [[-1  0  7]]
Его размерность: (1, 3)


In [38]:
print('Манхэттенское расстояние между a и b (через cdist):', cdist(a,  b, metric='cityblock'))

Манхэттенское расстояние между a и b (через cdist): [[22.]]


In [39]:
d = np.array([3, 0, 8, 9, -10])
print('Вектор d:', d)
print('Его размерность:', d.shape)

Вектор d: [  3   0   8   9 -10]
Его размерность: (5,)


In [41]:
# Добавление фиктивных осей
print('Вектор d с newaxis --> вектор-строка:\n', d[np.newaxis, :])
print('Полученная размерность:', d[np.newaxis, :].shape)

print('Вектор d с newaxis --> веткор-столбец:\n', d[:, np.newaxis])
print('Полученная размерность:', d[:, np.newaxis].shape)

Вектор d с newaxis --> вектор-строка:
 [[  3   0   8   9 -10]]
Полученная размерность: (1, 5)
Вектор d с newaxis --> веткор-столбец:
 [[  3]
 [  0]
 [  8]
 [  9]
 [-10]]
Полученная размерность: (5, 1)


In [42]:
# Теперь считаем расстояния
a = np.array([6, 3, -5])
b = np.array([-1, 0, 7])
print('Евклидово расстоние между a и b (через cdist):', cdist(a[np.newaxis, :], b[np.newaxis, :], metric='euclidean'))

Евклидово расстоние между a и b (через cdist): [[14.2126704]]


Эта функция также позволяет вычислять попарные расстояния между множествами векторов. Например, пусть у нас имеется матрица размера $m_{A} \times n$. Мы можем рассматривать ее как описание некоторых $m_{A}$ наблюдений в $n$-мерном пространстве. Пусть также имеется еще одна аналогичная матрица размера $m_{B} \times n$, где  $m_{B}$ векторов в том же $n$-мерном пространстве. Часто необходимо посчитать попарные расстояния между векторами первого и второго множеств. В этом случае можно пользоваться функцией __`scipy.spatial.distance.cdist(XA, XB, metric='euclidean', p=2, ...)`__, где в качестве __`XA, XB`__ необходимо передать две описанные матрицы. Функция возвращает матрицу попарных расстояний размера $m_{A} \times m_{B}$, где элемент матрицы на $[i, j]$-ой позиции равен расстоянию между $i$-тым вектором первого множества и $j$-ым вектором второго множества. 

В данном случае эта функция предподчительнее __`numpy.linalg.norm(...)`__, так как она вычисляет попарные расстояния быстрее и эффективнее. 

## 5.Скалярное произведение и угол между векторами

In [46]:
a = np.array([0, 5, -1])
b = np.array([-4, 9, 3])
print('Вектор a:', a)
print('Вектор b:', b)

Вектор a: [ 0  5 -1]
Вектор b: [-4  9  3]


Длиной вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ называется квадратный корень из скалярного произведения, то есть длина равна евклидовой норме вектора:

$$
\left| x \right| = \sqrt{\langle x, x \rangle} = \sqrt{\sum_{i=1}^n x_{i}^2} =  \left\Vert x \right\Vert_{2}.
$$

Теперь, когда мы знаем расстояние между двумя ненулевыми векторами и их длины, мы можем вычислить угол между ними через скалярное произведение:

$$
\langle x, y \rangle = \left| x \right| | y | \cos(\alpha)
\implies \cos(\alpha) = \frac{\langle x, y \rangle}{\left|| x |\right| || y ||},
$$

где $\alpha \in [0, \pi]$ — угол между векторами $x$ и $y$.

In [47]:
cos_angle = np.dot(a, b) / norm(a) / norm(b)
print('Косинус угла между a и b:', cos_angle)
print('Сам угол:', np.arccos(cos_angle))

Косинус угла между a и b: 0.8000362836474323
Сам угол: 0.6434406336093618
