# Что сегодня сделаем
Рекомендательный алгоритм сопутствующих товаров для пользователя

### Повторим списки и словари
Статистика взята с сайта http://www.bodycounters.com

Дана статистика погибших в серии фильмов "Пираты Карибского моря". Посчитайте среднее число погибших людей в каждом фильме. Пиратов зомби за людей не считайте.

In [None]:
stats = [
    {
        'movie': 'На странных берегах',
        'bodycount': {'люди': 56, 'русалки': 2, 'ядовитые жабы': 3, 'пираты-зомби': 2}
    },
    {
        'movie': 'На краю света',
        'bodycount': {'люди': 88}
    },
    {
        'movie': 'Сундук мертвеца',
        'bodycount': {'люди': 56, 'крабы отшельники': 1}
    },
    {
        'movie': 'Проклятие Черной жемчужины',
        'bodycount': {'люди': 17}
    },
]

Что можно сделать:
1. Пройтись по списку stats
2. В каждом элементе взять словарь по ключу 'bodycount'
3. В словаре по ключу 'bodycount' взять значение ключа 'люди'
4. Просуммировать количество людей во всех шагах
5. Поделить сумму людей на количество фильмов

# Numpy и матричная алгебра

In [None]:
import numpy as np

In [None]:
x = np.array([1, 2, 3])
y = np.array( [4, 5, 6] )

In [None]:
# у переменной x тип, отличный от list
type(x)

In [None]:
# дополнительные методы
x.mean()

### Поэлементные операции

In [None]:
x + y

In [None]:
x - y

In [None]:
x * y

In [None]:
x / y

In [None]:
# элементы массива x возводятся в соответствующие степени элементов массива y
x ** y

In [None]:
# остаток от деления
# обратите внимание, что для удобства данного примера x и y идут в другом порядке

y % x

### Автоматическое наполнение массивов

In [None]:
# аналог range

np.arange(0, 10)

In [None]:
# создать массив из 10 чисел, заполненных единицами
np.full(10, 1)

In [None]:
# создать матрицу 2х5 из нулей
np.full([2, 5], 0)

In [None]:
# объединить массивы в один
a = np.arange(10)
b = np.arange(10, 20)

# обратите внимание на двойные скобки
np.concatenate((a, b))

In [None]:
# перемешать элементы массива
import random

nums = np.arange(10)
random.shuffle(nums)

nums

### Упражнение
По мотивам https://thecode.media/choose-life/

По результатам собеседования вам предлагают определенную зарплату. И конверт, который может случайным образом снизить или увеличить эту зарплату вдвое. Т. е. если сначала была сумма Х, то после вскрытия конверта она может стать 0.5Х или 2Х. Как в среднем изменится будущая зарплата, если соискатель решил открыть конверт?

Смоделируйте процесс изменения условной зарплаты в 1000 в случае открытия конверта:
1. Задайте переменную n_samples = 1000
2. Создайте numpy array из n_samples элементов, равных зарплате 0.5Х. И такой же с зарплатой 2Х.
3. Объедините их в один массив
4. Перемешайте значения в получившемся массиве
5. Посчитайте среднее значение зарплаты для объединенного массива

### Изменение размерности

In [None]:
x = np.arange( 0, 10 )
x

In [None]:
# 10 - количество строк

x.shape

In [None]:
# первый аргумент - количество строк
# второй - столбцов

x.reshape(5, 2)

In [None]:
x.reshape(3, 3)

In [None]:
# транспонирование матриц

np.array(
    [
        [1, 2],
        [3, 4],
        [5, 6]
    ]
).T

In [None]:
# склеивание набора списков
[1, 2, 3] + [4, 5, 6]

In [None]:
# склеивание массива из списков

x = np.array( [ [1, 2, 3], [4, 5, 6] ] )
x.ravel()

In [None]:
# можно и так

x.reshape(6)

In [None]:
# результат разный, если добавить 1 в качестве количества строк

x.reshape(1, 6)

### Создание матриц

In [None]:
# нулевой вектор заданной размерности

np.zeros(10)

In [None]:
# единичная матрица

np.eye(5)

In [None]:
# более общий случай диагональной матрицы

np.diag(np.arange(2, 50, 15), k=0)

In [None]:
# матрица со случайными значениями

np.random.random(10)

In [None]:
# более универсальный вариант создания матриц

?np.linspace

In [None]:
np.linspace(5, 25, 30)

### Более сложные распределения

https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.signal.gaussian.html

# Скалярное произведение векторов

\begin{equation*}
\LARGE
\vec{a} \dot{} \vec{b} = |\vec{a}| \space |\vec{b}| \space cos(\vec{a}, \vec{b})
\end{equation*}

Пусть 
\begin{equation*}
\LARGE
\vec{a} = (a_1, a_2, a_3) \\
\LARGE
\vec{b} = (b_1, b_2, b_3)
\end{equation*}

Тогда скалярное произведение векторов равно
\begin{equation*}
\LARGE
\vec{a} \dot{} \vec{b} = a_1 b_1 + a_2 b_2 + a_3 b_3
\end{equation*}

In [None]:
a = np.array( [4, 3] )
b = np.array( [2, 1] )

Пример расчета скалярного произведения векторов

In [None]:
np.dot( a, b )

Можно посчитать и таким образом

In [None]:
# первый шаг

for pair in zip( a, b ):
    print( pair )

In [None]:
# второй шаг

[ pair[0] * pair[1] for pair in zip( a, b ) ]

In [None]:
# итоговый результат

sum( [ pair[0] * pair[1] for pair in zip( a, b ) ] )

# Косинусное сходство между векторами

\begin{equation*}
\LARGE
cos(\vec{a}, \vec{b}) = \frac{\vec{a} \dot{} \vec{b}}{|\vec{a}| \space |\vec{b}|}
\end{equation*}

In [None]:
import matplotlib.pyplot as plt

In [None]:
ax = plt.axes()

plt.xlim( [0, 5] )
plt.ylim( [0, 4] )

ax.arrow( 0, 0, a[0], a[1], head_width=0.1, head_length=0.2, fc='k', ec='k' )
ax.arrow( 0, 0, b[0], b[1], head_width=0.1, head_length=0.2, fc='k', ec='k' )

plt.show()

In [None]:
def cosine( a, b ):
    """
    Подсчет косинуса угла между векторами a, b по их координатам
    """
    
    # длины векторов
    aLength = np.linalg.norm( a )
    bLength = np.linalg.norm( b )
    
    return np.dot( a, b ) / ( aLength * bLength )

In [None]:
# длины векторов можно было посчитать и так

aLength = np.sqrt( (a*a).sum() )
bLength = np.sqrt( (b*b).sum() )

In [None]:
cosine( a, b )

In [None]:
# угол между векторами в радианах

np.arccos( cosine( a, b ) )

In [None]:
# угол между векторами в градусах

np.arccos( cosine( a, b ) ) * 360 / 2 / np.pi

## Задача 4 домашнего задания

Имеется матрица покупок в интернет-магазине. Столбец А - ID пользователя. Остальные столбцы - количество покупок категорий товаров этим пользователем:

In [None]:
from IPython.display import Image
Image("user_matrix.JPG")

Матрица в виде numpy array

In [None]:
users_stats = np.array(
    [
        [2, 1, 0, 0, 0, 0],
        [1, 1, 2, 1, 0, 0],
        [2, 0, 1, 0, 0, 0],
        [1, 1, 2, 1, 0, 1],
        [0, 0, 1, 2, 0, 0],
        [0, 0, 0, 0, 0, 5],
        [1, 0, 0, 0, 0, 0],
        [0, 1, 1, 0, 0, 0],
        [0, 0, 0, 1, 1, 3],
        [1, 0, 0, 2, 1, 4]
    ], 
    np.int32
)

На сайт заходит очередной посетитель, о покупках которого известно следующее:

In [None]:
next_user_stats = np.array([0, 1, 2, 0, 0, 0])

Найдите самого похожего пользователя. Т. е. посчитайте косинусное сходство между этим пользователем и всеми пользователями из массива user_stats

# Перемножение матриц

**Определение**

Пусть даны две матрицы a и b размером l x m и m x n соответственно. l - количество строк, n - количество столбцов.

\begin{equation*}
\LARGE
a = 
\begin{bmatrix}
    a_{11} & a_{12} \dots a_{1m} \\
    a_{21} & a_{22} \dots a_{2m} \\
    \vdots & \vdots \dots \vdots \\
    a_{l1} & a_{l2} \dots a_{lm}
\end{bmatrix}
\end{equation*}

<br>

\begin{equation*}
\LARGE
b = 
\begin{bmatrix}
    b_{11} & b_{12} \dots b_{1n} \\
    b_{21} & b_{22} \dots b_{2n} \\
    \vdots & \vdots \dots \vdots \\
    b_{m1} & b_{m2} \dots b_{mn}
\end{bmatrix}
\end{equation*}

Тогда произведением матриц a и b будет матрица c размерностью l x n:

\begin{equation*}
\LARGE
c = 
\begin{bmatrix}
    c_{11} & c_{12} \dots c_{1n} \\
    c_{21} & c_{22} \dots c_{2n} \\
    \vdots & \vdots \dots \vdots \\
    c_{l1} & c_{l2} \dots c_{ln}
\end{bmatrix}
\end{equation*}

<br>

\begin{equation*}
\LARGE
c_{ij} = \sum_{k=1}^m a_{ik} b_{kj}
\end{equation*}

<img src = 'https://wikimedia.org/api/rest_v1/media/math/render/svg/1f96c71f0a99eac3ee872e7baf22e84324d7b4c9' style="width: 80%"></img>

In [None]:
a = np.array( 
    [
        [1, 2],
        [3, 4]
    ] 
)

In [None]:
b = np.array( 
    [
        [5, 6],
        [7, 8]
    ] 
)

In [None]:
c = np.dot( a, b )
c

В numpy есть специальный тип matrix, который отличается от ndarray

In [None]:
aMatrix = np.matrix( [ [1, 2], [3, 4] ] )
bMatrix = np.matrix( [ [5, 6], [7, 8] ] )

In [None]:
type(aMatrix)

In [None]:
aMatrix * bMatrix

In [None]:
type( aMatrix ), type( a )

In [None]:
np.mat( a ) * np.mat( b )

# Линейные уравнения

Дана система линейных уравнений

\begin{equation*}
\LARGE
x + 3*y = 9 \\
\LARGE
2*x - 4*y = 8
\end{equation*}

In [None]:
# коэффициенты при переменных в левой части уравнения

a = np.array( [ [1, 3], [2, -4] ] )

In [None]:
# значения в правой части уравнения

b = np.array( [9, 8] )

In [None]:
# решение

from numpy import linalg

In [None]:
linalg.solve(a, b)

In [None]:
# проверка верности

np.allclose( np.dot(a, linalg.solve(a, b)), b )