## Векторы и матрицы

### Массив Numpy (Numpy array)

In [1]:
import numpy as np

In [5]:
# предположим мы записали наши данные
# роста, веса и обхвата шеи одного человека в список
data = [[1.72, 54, 36.2], [21.92, 54, 36.2]]

In [6]:
# убедимся, что это список с помощью функции type()
type(data)

list

In [7]:
# преобразуем список в массив Numpy
data_Numpy = np.array(data)
data_Numpy

array([[ 1.72, 54.  , 36.2 ],
       [21.92, 54.  , 36.2 ]])

In [8]:
# если у нас несколько наблюдений, то нужна матрица, т.е.
# по сути, несколько векторов
data_matrix = np.array([[1.72, 54, 36.2], [1.74, 58, 36.3], [1.68, 52, 32.9]])
data_matrix

array([[ 1.72, 54.  , 36.2 ],
       [ 1.74, 58.  , 36.3 ],
       [ 1.68, 52.  , 32.9 ]])

In [9]:
# мы можем посмотреть размерность матрицы (количество строк и столбцов)
data_matrix.shape

(3, 3)

### Скалярное произведение векторов (dot product)

Напомню формулу:

  $$\textbf{a}=(a_{1}, a_{2})$$
  $$\textbf{w}=(w_{1}, w_{2})$$
  $$\textbf{a}\cdot\textbf{w}=a_{1}w_{1}+a_{2}w_{2}$$

In [None]:
# даны два вектора в виде массивов Numpy

a = np.array([1.72, 54]) # вектор данных
w = np.array([19.86, 0.05]) # вектор весов

In [None]:
# перемножим их вручную
1.72 * 19.86 + 54 * 0.05

36.8592

In [None]:
# используем скалярное произведение векторов
np.dot(a, w)

36.8592

### Косинусное сходство между векторами

Первый шаг: найдем косинус угла по формуле $$ \cos \theta ={\mathbf {b} \cdot \mathbf {c} \over \|\mathbf {b} \|\|\mathbf {c} \|} $$

In [12]:
b = np.array([1.72, 54, 36.2])
c = np.array([1.56, 47, 30.0])

In [13]:
numerator = np.dot(b, c)

In [14]:
bLen = np.linalg.norm(b)
cLen = np.linalg.norm(c)

# (2) перемножим их
denominator = bLen * cLen

In [15]:
# посмотрим, чему равен косинус угла между векторами
cosine = numerator/denominator
cosine

0.9997468709497721

Второй шаг: найдем угол в градусах по его косинусу

In [16]:
# для этого вначале вычислим угол в радианах
angle_radians = np.arccos(cosine)

# затем в градусах
angle_degrees = angle_radians * 360/2/np.pi

In [None]:
angle_degrees

1.2891925481394304

### Упражнения

In [31]:
# даны два вектора
v1 = np.array([37, 84, 110.2, 18.6])
v2 = np.array([39, 14, 112.2, 58.6])

#### Основы работы с массивами

**Задание 1**. Посмотрите с помощью Питона на тип данных любого из двух векторов.

In [29]:
print(type(v1))

<class 'numpy.ndarray'>


**Задание 2**. Какая размерность у этих векторов?

In [30]:
v1.shape

(2, 4)

#### Скалярное произведение векторов

**Задание 3**. Перемножьте векторы `v1` и `v2` вручную.

In [36]:
print(np.dot(v1,v2))

16073.400000000001


**Задание 4**. Используйте функцию **dot()**.

In [39]:
numerator = np.dot(v1,v2)

v1Len = np.linalg.norm(v1)
v2Len = np.linalg.norm(v2)
denominator = v1Len * v2Len
print(numerator/denominator)

0.8344579537217223


#### Косинусное сходство между векторами

**Задание 5**. Найдите угол в градусах между векторами `v1` и `v2`.