### NumPy Векторные операции 

In [1]:
import numpy as np

### Создание векторов
Самый простой способ создать вектор в `NumPy` — задать его явно с помощью __`numpy.array(list, dtype=None, ...)`__.

Параметр __`list`__ задает итерируемый объект, из которого можно создать вектор. Например, в качестве этого параметра можно задать список чисел. Параметр __`dtype`__ задает тип значений вектора, например, __`float`__ — для вещественных значений и __`int`__ — для целочисленных. Если этот параметр не задан, то тип данных будет определен из типа элементов первого аргумента. 

In [3]:
a = np.array([1, 2, 3, 4])
print('Вектор:\n', a)

Вектор:
 [1 2 3 4]


Тип значений вектора можно узнать с помощью __`numpy.ndarray.dtype`__:

In [4]:
a.dtype

dtype('int32')

Другим способом задания вектора является функция __`numpy.arange(([start, ]stop, [step, ]...)`__, которая задает последовательность чисел заданного типа из промежутка __[`start`, `stop`)__ через шаг __`step`__

Шаг может быть и нецелочисленным

In [7]:
a = np.arange(10,20,0.1)
print(a)

[10.  10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 10.9 11.  11.1 11.2 11.3
 11.4 11.5 11.6 11.7 11.8 11.9 12.  12.1 12.2 12.3 12.4 12.5 12.6 12.7
 12.8 12.9 13.  13.1 13.2 13.3 13.4 13.5 13.6 13.7 13.8 13.9 14.  14.1
 14.2 14.3 14.4 14.5 14.6 14.7 14.8 14.9 15.  15.1 15.2 15.3 15.4 15.5
 15.6 15.7 15.8 15.9 16.  16.1 16.2 16.3 16.4 16.5 16.6 16.7 16.8 16.9
 17.  17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8 17.9 18.  18.1 18.2 18.3
 18.4 18.5 18.6 18.7 18.8 18.9 19.  19.1 19.2 19.3 19.4 19.5 19.6 19.7
 19.8 19.9]


Вектора имеют размерность 1, а их shape отражает число элементов в нем или размерность вектора. Также необходимо помнить о **векторе строке и векторе столбце**, такие векторы уже имеют размерность равную 2.

In [9]:
print('Vector Dimension: ', a.ndim)
print('Vector Length: ', a.shape)

Vector Dimension:  1
Vector Length:  (100,)


### Основные операции над векторами
Векторы в `NumPy` можно
- Складывать
- Вычитать
- Умножать на число и умножать на другой вектор (поэлементно)

In [14]:
a = np.array([1,10,5])
b = np.array([4,20,5])
k = 2

print('Vector a: ', a)
print('Vector b: ', b)
print('Constant: ', k)

Vector a:  [ 1 10  5]
Vector b:  [ 4 20  5]
Constant:  2


In [16]:
print('Vectors Sum:', a + b)
print('Vector Difference: ', a - b)
print('Multiplication on constant: ', a*k)
print('Vectors Multiplication: ', a*b)

Vectors Sum: [ 5 30 10]
Vector Difference:  [ -3 -10   0]
Multiplication on constant:  [ 2 20 10]
Vectors Multiplication:  [  4 200  25]


## 2. Операции над векторами

Векторы в `NumPy` можно складывать, вычитать, умножать на число и умножать на другой вектор (покоординатно):

In [44]:
a = np.array([1, 2, 3])
b = np.array([6, 5, 4])
k = 2

print('Вектор a:', a)
print('Вектор b:', b)
print('Число k:', k)

Вектор a: [1 2 3]
Вектор b: [6 5 4]
Число k: 2


## Нормы векторов
Вспомним некоторые нормы, которые можно ввести в пространстве $\mathbb{R}^{n}$, и рассмотрим, с помощью каких библиотек и функций их можно вычислять в `NumPy`.

### p-норма

p-норма (норма Гёльдера) для вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ вычисляется по формуле:

$$
\left\Vert x \right\Vert_{p} = \left( \sum_{i=1}^n \left| x_{i} \right|^{p} \right)^{1 / p},~p \geq 1.
$$

В частных случаях при:
* $p = 1$ получаем $\ell_{1}$ норму
* $p = 2$ получаем $\ell_{2}$ норму

Далее нам понабится модуль ``numpy.linalg``, реализующий некоторые приложения линейной алгебры. Для вычисления различных норм мы используем функцию ``numpy.linalg.norm(x, ord=None, ...)``, где ``x`` — исходный вектор, ``ord`` — параметр, определяющий норму (мы рассмотрим два варианта его значений — 1 и 2). Импортируем эту функцию:

In [21]:
from numpy.linalg import norm

### $\ell_{1}$ норма

$\ell_{1}$ норма 
(также известная как манхэттенское расстояние)
для вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ вычисляется по формуле:

$$
 \left\Vert x \right\Vert_{1} = \sum_{i=1}^n \left| x_{i} \right|.
$$

Ей в функции ``numpy.linalg.norm(x, ord=None, ...)`` соответствует параметр ``ord=1``

In [19]:
print('L1-Norm: ', norm(a, ord=1))

L1-Norm:  16.0


### $\ell_{2}$ норма
$\ell_{2}$ норма (также известная как евклидова норма)
для вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ вычисляется по формуле:

$$
 \left\Vert x \right\Vert_{2} = \sqrt{\sum_{i=1}^n \left( x_{i} \right)^2}.
$$

Ей в функции ``numpy.linalg.norm(x, ord=None, ...)`` соответствует параметр ``ord=2``

In [20]:
print('L2-Norm: ', norm(a, ord=2))

L2-Norm:  11.224972160321824


Более подробно о том, какие еще нормы (в том числе матричные) можно вычислить, см. [документацию](http://docs.scipy.org/doc/numpy-1.10.0/reference/generated/numpy.linalg.norm.html)

### 4. Расстояния между векторами
Для двух векторов $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ и $y = (y_{1}, \dots, y_{n}) \in \mathbb{R}^{n}$ $\ell_{1}$ и $\ell_{2}$ раccтояния вычисляются по следующим формулам соответственно:

$$
 \rho_{1}\left( x, y \right) = \left\Vert x - y \right\Vert_{1} = \sum_{i=1}^n \left| x_{i} - y_{i} \right|
$$

$$
 \rho_{2}\left( x, y \right) = \left\Vert x - y \right\Vert_{2} = 
 \sqrt{\sum_{i=1}^n \left( x_{i} - y_{i} \right)^2}.
$$

In [23]:
print('L1-Metric: ', norm(a-b, ord=1))
print('L2-Metric: ', norm(a-b, ord=2))

L1-Metric:  13.0
L2-Metric:  10.44030650891055


Также расстояние между векторами можно посчитать с помощью функции:
- __`scipy.spatial.distance.cdist(XA, XB, metric='euclidean', p=2, ...)`__ 

однако требуется, чтобы размерность __`XA`__ и __`XB`__ была как минимум двумерная. По этой причине для использования этой функции необходимо преобразовать _векторы_ к _вектор-строкам_.

In [26]:
from scipy.spatial.distance import cdist

Первый способ из _вектора_ сделать _вектор-строку / вектор-столбец_ — это использовать _метод_ __`array.reshape(shape)`__, где параметр __`shape`__ задает размерность вектора.

In [28]:
a = a.reshape((1,3))
b = b.reshape((1, 3))

print(a)
print('Vector a dimension: ', a.ndim)

[[ 1 10  5]]
Vector a dimension:  2


In [29]:
print('Manhattan Distance between a and b: ', cdist(a, b, metric='cityblock'))

Manhattan Distance between a and b:  [[13.]]


В `NumPy` к размерностям объектов можно добавлять фиктивные оси с помощью __`np.newaxis`__. Важно, что __`np.newaxis`__ добавляет к размерности ось, длина которой равна 1 (это и логично, так как количество элементов должно сохраняться). Таким образом, надо вставлять новую ось там, где нужна единица в размерности. 

In [36]:
a = np.array([1, 2, 3])
b = np.array([6, 5, 4])

print('Row-Vector: ', a[np.newaxis, :])
print('Column-Vector: ', b[:, np.newaxis])

Row-Vector:  [[1 2 3]]
Column-Vector:  [[6]
 [5]
 [4]]


Теперь посчитаем расстояния с помощью __`scipy.spatial.distance.cdist(...)`__, используя __`np.newaxis`__ для преобразования векторов:

In [38]:
print('Euclidian Distance: ', cdist(a[np.newaxis, :], b[np.newaxis, :], metric='euclidean'))

Euclidian Distance:  [[5.91607978]]


### Скаляроне произведение векторов
Скалярное произведение в пространстве $\mathbb{R}^{n}$ для двух векторов $x = (x_{1}, \dots, x_{n})$ и $y = (y_{1}, \dots, y_{n})$ определяется как:

$$
\langle x, y \rangle = \sum_{i=1}^n x_{i} y_{i}.
$$

Скалярное произведение двух векторов можно вычислять:
- ``numpy.dot(a, b, ...)``
- ``vec_a.dot(vec_b)``

Также данные функции необходимы **при использовании матричного умножения**

In [45]:
print('Dot Product: ', np.dot(a,b))
print('Dot Product: ', a.dot(b))

Dot Product:  28
Dot Product:  28


Длиной вектора $x = (x_{1}, \dots, x_{n}) \in \mathbb{R}^{n}$ называется квадратный корень из скалярного произведения, то есть длина равна евклидовой норме вектора:

$$
\left| x \right| = \sqrt{\langle x, x \rangle} = \sqrt{\sum_{i=1}^n x_{i}^2} =  \left\Vert x \right\Vert_{2}.
$$

Теперь, когда мы знаем расстояние между двумя ненулевыми векторами и их длины, мы можем вычислить угол между ними через скалярное произведение:

$$
\langle x, y \rangle = \left| x \right| | y | \cos(\alpha)
\implies \cos(\alpha) = \frac{\langle x, y \rangle}{\left|| x |\right| || y ||},
$$

где $\alpha \in [0, \pi]$ — угол между векторами $x$ и $y$.

In [48]:
def calculate_cos_alpha(vec_a, vec_b):
    return np.dot(vec_a, vec_b)/(norm(vec_a)*norm(vec_b))

cos_alpha = calculate_cos_alpha(a,b)
print('Cos Alpha: %.4f' %cos_alpha)
print('Alpha: %.4f' %np.arccos(cos_alpha))

Cos Alpha: 0.8528
Alpha: 0.5495


В случае полной идентичности векторов

In [51]:
a = np.array([1,0,3])
b = np.array([1,0,3])

cos_alpha = calculate_cos_alpha(a,b)
print('Cos Alpha: %.4f' %cos_alpha)
print('Alpha: %.4f' %np.arccos(cos_alpha))

Cos Alpha: 1.0000
Alpha: 0.0000
