## Операции в векторных пространствах

В этой главе мы поговорим о том, какие ещё операции можно ввести в векторных пространствах. Дело в том, что пока мы умеем только складывать векторы и умножать на числа, но этого мало. Мы не можем измерять расстояние между векторами, не можем измерять их сходство, а это очень важно в машинном обучении. Поэтому мы поговорим о том, что ещё нам может понадобиться.

## Двумерный случай

Давайте начнём с примера в двумерном пространстве, с которым мы все умеем работать. Пусть есть некоторый вектор с координатами 1 и 2:

<img src="img/vector1.png">

Все мы знаем, что вектор изображается как некоторая точка со стрелочкой, которая идёт к этой точке из нуля. 

* Вектор - точка и стрелка, идущая к точке из нуля

У нашего вектора можно измерить длину. Это делается по [теореме Пифагора](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%9F%D0%B8%D1%84%D0%B0%D0%B3%D0%BE%D1%80%D0%B0). Нужно возвести в квадрат каждую координату, сложить и извлечь корень. У нас получается аналогичная длина равная $ \sqrt{5} $.

* Длина вектора: $ \sqrt{1^2 + 2^2} = \sqrt{5} $

In [112]:
from math import sqrt

print('Длина вектора равна: {} или тоже самое, что и корень из 5: {}'.format(sqrt(1**2 + 2**2), sqrt(5)))

Длина вектора равна: 2.23606797749979 или тоже самое, что и корень из 5: 2.23606797749979


Добавим ещё один вектор с координатами −2 и 1:

<img src="img/vector2.png">

Можно измерить угол между ним и первым вектором с помощью, например, транспортира. Он будет равен 90°. То есть угол прямой.

* Угол между векторами: 90°

Также, можно измерить расстояние между этими двумя векторами. Для этого нужно найти разности по каждой координате, возвести в квадрат, сложить и извлечь корень. Если мы посчитаем по этой формуле, то расстояние получится равным $ \sqrt{10}$:

* Расстояние между точками: $ \sqrt{(1 - (-2)^2 + (2 - 1)^2)} = \sqrt{10} $



In [123]:
from math import sqrt

v1 = {'x': 1, 'y': 2}
v2 = {'x': -2, 'y': 1}

print(sqrt((v1['x'] - v1['y'])**2 + (v2['x'] - v2['y'])**2))
print(sqrt(10))

3.1622776601683795
3.1622776601683795


## Норма

* Обобщение понятия длины вектора

Давайте теперь попробуем обобщить все эти понятия на многомерные Евклидовы пространства. Начнём с длины вектора. Она вычисляется с помощью нормы. Норма — это некоторая функция от вектора, которая обозначается как `x`, а слева и справа от которого рисуются по две палочки:

* Функция $ ||x|| $ от вектора

Итак, норма — это функция, которая должна удовлетворять трем требованиям:

1. Норма должна быть равна нулю тогда и только тогда, когда сам вектор равен нулю:
  * Если $ ||x|| = 0 $, то $ x = 0 $
2. Должно иметь место неравенство треугольника. Норма суммы двух векторов должна быть меньше или равна, чем сумма норм двух векторов:
  * $ ||x + y|| \leq ||x|| + ||y|| $
3. Норма произведения числа $\alpha$ на вектор $x$ должна равняться произведению модуля $\alpha$ на норму вектора $x$:
  * $ ||\alpha * x|| = |\alpha| * ||x|| $

Векторное пространство, в котором введено понятие нормы, называется нормированным пространством.

 * Векторное пространство с нормой - нормированное пространство

### Евклидова норма

Самый распространённый пример нормы — это евклидова. Она вычисляется как сумма квадратов координат, из чего потом извлекается корень:

$$ ||x||_2 = \sqrt{\sum\limits_{i=1}^n x_i^2} $$

### Манхеттенская норма

Второй пример — это манхэттенская норма. Она вычисляется как сумма модулей координат вектора:

$$ ||x||_1 = \sum\limits_{i=1}^n |x_i| $$

## Метрика

* Обобщение понятия расстояния

Обобщим понятие расстояния. Для него можно тоже ввести строгое определение, там будет несколько требований, но можно поступить проще. В евклидовом пространстве, зная норму, можно ввести расстояние между векторами `x` и `y`.  По сути, это будет разность между вектором `x` и вектором `y`, у которой вычисляется норма:

* $ p(x, y) = ||x - y|| $

Расстояние иногда ещё называют метрикой.

По сути, то, как мы вводим метрику или расстояние через норму, соответствует геометрическим представлениям. В двумерном пространстве, как нас учили, чтобы посчитать расстояние, нужно тоже найти вектор разности между двумя векторами и вычислить его длину. Ровно это мы здесь и делаем.

<img src="img/vector3.png">

### Евклидова метрика

Если мы знаем **евклидову норму**, то можем ввести **евклидову метрику**. Это будет сумма квадратов разностей координат этих векторов, из которой в конце извлекается корень:

$$ p(x,y) = \sqrt{\sum\limits_{i=1}^n (x_i - y_i)^2} $$

### Манхеттенская метрика

Также можно ввести манхэттенскую метрику. Это сумма модулей отклонений двух векторов:

$$ p(x,y) = \sum\limits_{i=1}^n |x_i - y_i| $$

Кстати, манхэттенская метрика имеет интересную интерпретацию. В Манхэттене улицы выстраиваются в сетку, и поэтому если вы едете на машине, то можете путешествовать только параллельно осям координат. Поэтому манхэттенская метрика показывает, сколько минимум вам придётся проехать, чтобы попасть в Манхэттене из одной точки в другую.

## Как искать углы?

Теперь попробуем обобщить понятие угла. Это немного сложнее. Давайте рассмотрим пример, в котором есть два вектора:

<img src="img/vector4.png">

Первый имеет координаты (1, 2), второй — координаты (−1, 1). Между ними можно найти расстояние, можно посчитать их нормы, можно найти угол. А теперь умножим оба вектора на 2 и получим векторы (−2, 2) и (2, 4):

<img src="img/vector5.png">

У них изменятся нормы, увеличится расстояние между ними, но угол останется таким же. Этот пример подсказывает, что нормы и расстояния не достаточно, чтобы измерять углы. Нужно что-то ещё.

## Скалярное произведение

Чтобы ввести понятие угла, нам понадобится скалярное произведение векторов `x` и `y`. В евклидовых пространствах оно вычисляется как сумма произведений координат. То есть, как сумма по `i` от `1` до `n` и $x_i$ умножить на $y_i$:

$$ \langle x, y \rangle = \sum\limits_{i=1}^n x_i y_i $$

Через скалярное произведение можно вычислить норму. Норма `x` определяется как квадратный корень из скалярного произведения `x` на самого себя:

* Норма $ ||x|| = \sqrt{\langle x, x \rangle}$

Можно показать, что если подставить сюда определение скалярного произведения, то получите евклидову норму.

Также можно ввести расстояние. Поскольку расстояние между `x` и `y` равняется норме их отклонения, то получаем, что расстояние равняется квадратному корню из скалярного произведения `x − y` на `x − y`:

* Расстояние: $ p(x,y) = ||x - y|| = \sqrt{\langle x - y, x - y \rangle} $

Как же ввести угол? 

$$ \langle x,y \rangle = \sum\limits{i=1}^n x_i y_i $$

Для этого нам понадобится одно важное соотношение. Оказывается, в евклидовых пространствах скалярное произведение `x` на `y` можно вычислить как произведение нормы `x` на норму `y` и на косинус угла между ними:

* Важное соотношение: $ \langle x,y \rangle = ||x|| * ||y|| * \cos (\widehat{x,y}) $

Отсюда можно получить, что косинус угла между векторам `x` и `y` вычисляется как отношение скалярного произведения к произведению их норм. То есть норма `x` на норму `y`:

* Косинус угла - мера сонаправленности векторов: $$ \cos (\widehat{x,y}) = \frac{\langle x,y \rangle}{||x|| * ||y||} $$

Заметим, что косинус угла — это, по сути, мера сонаправленности векторов. Если векторы параллельны, то косинус угла будет равен 1. Если же векторы перпендикулярны или ортогональны, как называется в общем случае, то угол между ними равен 90°, а косинус 90° равен 0:

* Для параллельных векторов: $ \cos (x,y) = 1 $
* Для перпендикулярных векторов: $ \cos (x,y) = 0 $

Мы очень часто будем использовать косинусное расстояние в машинном обучении. Например, при анализе текстов.

## Резюме

Итак, что мы узнали?

* Норма - обобщение длины
* Через нее можно ввести расстояние
* Скалярное произведение позволяет ввести и расстояние, и угол
* Косинус угла - важная мера сходства векторов

Длина обобщается на произвольных евклидовых пространствах с помощью нормы. Расстояние же обобщается с помощью метрики, причем метрика легко определяется через норму. Более общая операция — скалярное произведение. Через неё можно ввести и расстояние, и углы. Косинус угла — это очень важная мера сходства векторов, мы будем часто ей пользоваться.