# Задача об оптимальном перемножении матриц

### Постановка задачи
Пусть нам доно произведение нескольких матриц:
$M = M_1 * M_2 * \dots * M_n, M_i$ имеет размер $n_i×n_{i + 1}$.
Поскольку умножение матриц ассоциативно, мы имеем право менять порядох их перемножение. Необходимо найти минимальной количество скалярных операций умножения, что перемножить все матрицы.

### Пример
Пусть нам даны матрицы $M_1, M_2, M_3$ размера $3×4, 4×3, 3×9$ соотвественно. Мы можем перемножить их 2я способами:

$$M = (M_1 * M_2) * M_3$$
$$M' = M_1 * (M_2 * M_3)$$

При перемножении матриц размера $(i×j)$ и $(j×k)$ нам необходимо $ijk$ операций скалярного умножения, таким образом в первом случае мы сделаем $3*4*3 + 3*4*9 = 144$ операций, а во втором $4*3*9 + 3*4*9 = 216$ операций. Наша задача - минимизировать кол-во операций, так что правильный ответ будет $144$.

### Решение
Пусть $M = M_i * M_{i+1} * \dots * M_{j-1} * M_j$, $M_i$ имеет размер $n×m$, $M_j$ имеет размер $k×q$, тогда $M$ будет иметь размер $n×q$.<br>
Пусть $D_{i,j}$ - оптимальной количество операций, необходимых для нахождения произведение всех матриц от $i$-й до $j$-й. $D_{i,j}$ можно представить как $D_{i,k} + D_{k+1,j} + (M_i)_n * (M_k)_m * (M_j)_m$. Простыми словами, мы считаем, что найдем сначало произведение матриц от $i$-й до $k$-й и от $k+1$-й до $j$-й и умножим их. Необходимое количество операций будет равно сумме операций на первом($[i..k]$) и втором($[k+1..i]$) отрезке + перемножение результатов. Т.е. нам необходимо перебрать все возможные разделения на отрезки $(i \leq k < j)$.
Очевидно, найти произведение одной матрицы стоит 0 операций. Запишем это формально:

$$D_{i, j} = 
\left\{
\begin{array}{lr}
0, i = j \\
\min\limits_{i \leq k \le j}\{D_{i,k} + D_{k+1,j} + (M_i)_n * (M_k)_m * (M_j)_m\}
\end{array}
\right.
$$

Очевидно, что ответ будет содержаться в $D_{0, n-1}$.

### Асимптотика
Мы не переберем более $\frac{n(n-1)}{2}$ т.к. будем сохранять результаты вычислений для отрезков. На каждом отрезке мы переберем не более $n$ вариантов разбивение на подотрезки. Асимптотика решения будет $O(n^3)$.

### Реализация

In [14]:
class Matrix:
    n = 0
    m = 0
    
    def __init__(self, n, m):
        self.n = n
        self.m = m
        

def solution(matrices):
    cache = {}
    
    def solve(i, j):
        if (i, j) in cache:
            return cache[(i, j)]
        
        if i == j:
            cache[(i, j)] = 0
            return cache[(i,j)]
        
        results = []
        for k in range(i, j):
            mult_cost = matrices[i].n * matrices[k].m * matrices[j].m
            results.append(solve(i, k) + solve(k + 1, j) + mult_cost)
                
        cache[(i, j)] = min(results)
            
        return cache[(i, j)]
    
    return solve(0, len(matrices) - 1)

In [15]:
matrices = [Matrix(3, 4), Matrix(4, 3), Matrix(3, 9)]
print(solution(matrices))

117


## Оптимизация Кнута (читы)
```diff
- Осторожно, приведенная ниже информация может ударить по самооценке!
```

@ostashev рассказал интересный факт:
Пусть $D_{i,j}(k) = D_{i,k} + D_{k+1,j} + (M_i)_n * (M_k)_m * (M_j)_m$.<br>
Пусть $P_{i,j}$ такое, что $D_{i,j}(P_{i,j})$ минимальное. Простыми словами, это оптимальная точка деления отрезка $[i,j]$. Тогда утверждается что $P_{i-1,j} \le P_{i,j} \le P_{i,j+1}$. 
Это означает, что мы можем оптимизировать поиск оптимального $k$. Давайте перепишем рекурентные отношения:

$$
D_{i, j} = 
\left\{
\begin{array}{lr}
0, i = j \\
\min\limits_{P_{i-1,j} \leq k \le P_{i,j+1}}\{D_{i,k} + D_{k+1,j} + (M_i)_n * (M_k)_m * (M_j)_m\}
\end{array}
\right.
$$

$$
P_{i, j} = 
\left\{
\begin{array}{lr}
i, i = j \\
k: i \le k < j \wedge [D_{i,k} + D_{k+1,j} + (M_i)_n * (M_k)_m * (M_j)_m] → min
\end{array}
\right.
$$

### Доказательство
TODO: Доказать это, буду рад любой помощи в этом деле.

### Асимптотика 
Асимпотика такого алгоритма будет $O(n^2)$. 
TODO: Доказать это...