## Задача E "Радіоактивні банани".  



$\,\,\,\,\,\,$Задача E "Радіоактивні банани" является одной из самых сложных задач областной олимпиады 2018. По ограничениям на входные данные она разбита на восемь независимых подзадач, каждая из которых  тестируются на своей группе тестов. Можно решать каждую подзадачу отдельно, можно искать универсальное решение.  
$\,\,\,\,\,\,$Пройдем путь от решения подзадач к универсальному решению.

### Математическая модель задачи.
  
  $\,\,\,\,\,\,$Математическая модель задачи незамысловата и проста: нужно подсчитать количество последовательностей длины $N$ состоящих из нулей и единиц , у которых подряд идущих единиц может быть не более $C$. Такие последовательности назовем **правильными**. 
    
   Подобные задачи решаются методом динамического программирования.  
   
     
   Напомню, метод динамического программирования заключается в том, что решение "большой" задачи $d(n)$ сводится к решению нескольких "меньших" задач  $d(n - 1), d(n - 2) ... d(n - k)$. В конце концов мы дойдем до задач $d(0), d(1), ...,d(k - 1)$ (начальные условия) , решение которых мы знаем. Зависимость $d(n) = f(d(n - 1), d(n - 2),...,d(n - k))$ называется **рекуррентным соотношением**. 
   
   Классический пример задачи ДП - задача нахождения числа Фибоначчи с номером $n$.  
   1. $F(0) = 0, F(1) = 1$ - начальные условия.
   2. $F(k) = F(k - 1) + F(k - 2)$ - рекуррентное соотношение.
   3. $F(n)$ -  итоговое значение, число Фибоначчи с номером $n$.  
   
В некоторых задачах ДП рекуррентное соотношение задано, но в большинстве задач его нужно найти, сконструировать.   

Вернемся к задаче "Радіоактивні банани".  Определимся со смыслом динамики и сконструируем рекуррентное соотношение.  
  
  1. $d[n]$ - количество **правильных** последовательностей длины $n$ (в последовательности нет $C + 1$ подряд идущих единиц).
  



Начнем писать код.

In [1]:
n, c = map(int, input().split())
mod = 1000000007

12 10


### 1. Первая группа тестов:  $0 < N < C < 200$.

Условие $N < C$ снимает все ограничения на расстановку единичек (раздачу бананов) и задача сводится к простой комбинаторике: каждой из коров мы можем либо дать банан, либо не дать, (два варианта), всего коров $N$.  
  
  Ответ: $2^N$. 
    
    
  Вычислительная сложность решения $O(N)$ или $O(\log N)$, если применить быстрое возведение в степень.  
  Помним, что ответ нужно вывести по модулю $mod = 1000000007$.

In [2]:
def bin_pow(a, k):
    ans = 1
    while k:
        if k % 2:
            ans = (ans * a) % mod
            k -= 1
        else:
            a = (a * a) % mod
            k //= 2
    return ans

In [3]:
# Первая группа тестов, 0 < N < C < 200.
n = 123
c = 199
mod = 1000000007
if 0 < n < c < 200:
    print(bin_pow(2, n))

914988515


### 2. Вторая  группа тестов : $N < 10^6, C = 1$.  
  
  Наша динамика $d[k]$ - количество **правильных** расстановок нулей и единиц длины $k$, где $k = 1, 2,..., n$.  
  Найдем полным перебором решения для маленьких задач, в надежде увидеть закономерность.  
  
  $d[1] = 2$  
  $d[2] = 3$  
  $d[3] = 5$  
  $d[4] = 8$  
  
  Получили числа $F_2, F_3, F_4, F_5$ последовательности Фибоначчи. Можно предположить и проверить, что решения следующих подзадач продолжают ряд чисел Фибоначчи.
  
  Ответ:  $d[n] = F_{n + 2}$  
  
   Чтобы пройти вторую группу тестов, где $n \leq 10^6 $ достаточно применить рекуррентное соотношение  
   $F_n = F_{n - 1} + F_{n - 2}$  
   Вычислительная сложность решения $O(N)$.  

In [4]:
# Вторая группа тестов, С = 1.
n = 10
c = 1
a, b = 2, 3
for i in range(n - 1):
    a, b = b, (a + b) % mod
print(a)

144


### 3. Третья группа тестов: $0 < N < 16, \,\,\, 0 < C < 16$.

Вычислим вручную $d[1], \,\,\, d[2],\,\,\, d[3],\,\,\, d[4],\,\,\, d[5],\,\,\, d[6] \,\,$ для $C =2, C = 3, C = 4$.

Найдем закономерность:  
$d[k] = \sum_{i = k - c - 1}^{k - 1}d[i]$

Для наших ограничений проходит решение "в лоб":

In [5]:
# Третья группа тестов
if 0 < n < 16 and 0 < c < 16:
    d = [0] * (n + 1)
    for i in range(n + 1):
        if i <= c:
            d[i] = (2 ** i) % mod
        else:
            d[i] = (sum(d[i - c - 1:i])) % mod
    print(d[n])

144


Вычислительная сложность решения $O(N \cdot C)$.

Приятный бонус, это решение проходит и четвертую группу тестов, нужно только исправить ограничения на входные данные!  

### 4. Четвертая группа тестов: $0 < N < 10^5, 0 < C < 20$.

In [6]:
# Третья и четвертая группы тестов
n, c = 12345, 17
if 0 < n < 10 ** 5 and 0 < c < 20:
    d = [0] * (n + 1)
    for i in range(n + 1):
        if i <= c:
            d[i] = (2 ** i) % mod
        else:
            d[i] = (sum(d[i - c - 1:i])) % mod
    print(d[n])

805486215


### 5. Пятая группа тестов: $0 < N < 10^6, 0 < C < 200$

Чтобы к пятой группе тестов применить решение четвертой группы, нужно научиться быстро находить сумму последних $N - (C + 1)$ членов динамического массива $d[k]$ для $k > C$.  
  
  $d[k] = \sum_{i = k - c - 1}^{k - 1}d[i]$  
    
   Заметим, что уже найденное $d[k - 1]$ - это сумма 
     
     
  $d[k - 1] = \sum_{i = k - c - 2}^{k - 2}d[i]$  
    
   почти то, что нам нужно, не хватает члена $d[k - 1]$, его нужно прибавить и имеется лишний член $d[k - c - 2]$, его нужно отнять.  
   Получаем $d[k] = 2 \cdot d[k - 1] - d[k - c - 2]$  
     
   Вычислительная сложность решения $O(N)$.  
   


In [7]:
#  Пятая группа тестов, 0 < N < 10 ** 6, 0 < C < 200
n, c = 123456, 197
if 0 < n < 10 ** 6 and 0 < c < 200:
    d = [1] * (n + 1)
    for i in range(n + 1):
        if i <= c:
            d[i] = (2 ** i) % mod
        else:
            d[i] = (2 * d[i - 1] - d[i - c - 2]) % mod
    print(d[n])

814882252


### 6. Шестая группа тестов: $N < 10^{18}, C = 1$.

Снова $C = 1$, снова числа Фибоначчи, но пройти шестую группу тестов способом подсчета $F_n$ с помощью рекуррентной формулы не получится, у нас очень большое $N$: $1 \leq N \leq 10^{18}$.  
   Но мы умеем находить большие числа Фибоначчи с помощью быстрого, за $\log (N)$, возведения в степень $N$ матрицы  
     
$P = \begin{pmatrix}
0 &1 \\ 
1 & 1
\end{pmatrix}$
   

Для решения шестой подзадачи нам нужно написать функцию умножения матрицы $P$ на матрицу $P$, функцию быстрого возведения матрицы $P$ в степень $N$ и функцию матричного вычисления чисел Фибоначчи.

In [8]:
def matrix_mul(a, b):
    return [[
        (a[0][0] * b[0][0] + a[0][1] * b[1][0]) % mod,
        (a[0][0] * b[0][1] + a[0][1] * b[1][1]) % mod
    ], [
        (a[1][0] * b[0][0] + a[1][1] * b[1][0]) % mod,
        (a[1][0] * b[0][1] + a[1][1] * b[1][1]) % mod
    ]]


def pow_(p):
    m = [[1, 1], [1, 0]]
    t = [[1, 0], [0, 1]]
    while p:
        if p % 2:
            t = matrix_mul(t, m)
        m = matrix_mul(m, m)
        p //= 2
    return t


def fib(n):
    return pow_(n)[1][0]

In [9]:
# Шестая группа тестов, С = 1, 0 < N < 10 ** 18.
n = 701003000090000321
c = 1
if c == 1 and 0 < n < 10 ** 18:
    print(fib(n + 2))

67223656


Вычислительная сложность решения $O(C^3 \cdot \log N)$

### Линейные рекуррентые соотношения.

Для того, чтобы пройти дальше в решении нашей задачи, познакомимся с понятием "Линейное рекуррентное соотношение".

#### Определение:  
***Линейным рекуррентным соотношением*** называется функция $f(n)$, начальные значения которой равны $f(0), f(1), f(2),...,f(k)$, а последующие вычисляются по формуле  
  
  $f(n) = c_1 \cdot f(n - 1) + c_2 \cdot f(n - 2) + c_3 \cdot f(n - 3) + ... + c_k \cdot f(n - k)$,  
  
  где $c_1, c_2, ..., c_k$ постоянные коэффициенты.  
    
 Воспользовавшись методом динамического программирования, можно найти значение $f(n)$ за $O(k \cdot n)$.   

Простым примером линейного рекуррентного соотношения является функция, определяющая последовательность чисел Фибоначчи:  
  
  $f(0) = 0$  
  $f(1) = 1$
  $f(n) = f(n - 1) + f(n - 2)$  
    
  В данном случае $k = 2, c_1 = c_2 = 1$.  

Для эффективного вычисления чисел Фибоначчи представим эти формулы в виде умножения квадратной матрицы  $X$ размера $2 \times 2$ на вектор $(f(i), f(i + 1))$ и  должно выполнятся следующее соотношение:

$X \cdot \begin{pmatrix}
f(i)\\ 
f(i + 1)
\end{pmatrix} = \begin{pmatrix}
f(i + 1)\\ 
f(i + 2)
\end{pmatrix}$

Значения $f(i)$ и $f(i + 1)$ подаются на "вход" $X$, и $X$ вычисляет по ним $f(i + 1)$ и $f(i + 2)$. Оказывается, матрица $X$ равна  
  
  $X = \begin{pmatrix}
0 &1 \\ 
1 &1
\end{pmatrix}$

Таким образом, $f(n)$ можно вычислить по формуле  
  
  $\begin{pmatrix}
f(n)\\ 
f(n + 1)
\end{pmatrix} = X^n \cdot \begin{pmatrix}
f(0)\\ 
f(1)
\end{pmatrix} = \begin{pmatrix}
0 &1 \\ 
1 &1
\end{pmatrix}^n \cdot \begin{pmatrix}
0\\ 
1
\end{pmatrix}$

Значение $X^n$ вычисляеся за время $O(\log n)$, поэтому $f(n)$ тоже можно вычислить за время $O(\log n)$.

**Общий случай**.

Расмотрим теперь произвольное линейное рекуррентное соотношение $f(n)$. Наша цель - построить матрицу $X$, для которой  
  
  $X \cdot \begin{pmatrix}
f(i)\\ 
f(i + 1)\\ 
\cdot \\ 
\cdot \\ 
\cdot \\ 
f(i + k - 1)
\end{pmatrix} = \begin{pmatrix}
f(i + 1)\\ 
f(i + 2)\\ 
\cdot\\ 
\cdot\\ 
\cdot\\ 
f(i + k)
\end{pmatrix}$

Такая матрица для $k = 6$ имеет вид

$X = \begin{pmatrix}
 0&  1&  0&  0&  0& 0\\ 
 0&  0&  1&  0&  0& 0\\ 
 0&  0&  0&  1&  0& 0\\ 
 0&  0&  0&  0&  1& 0\\ 
 0&  0&  0&  0&  0& 1\\ 
 c_6&  c_5&  c_4&  c_3&  c_2& c_1 
\end{pmatrix}$

Теперь $f(n)$ можно вычислять за время $O(k^3\cdot \log n)$ по формуле  

$\begin{pmatrix}
f(n)\\ 
f(n + 1)\\ 
\cdot \\ 
\cdot \\ 
\cdot \\ 
f(n + k - 1)
\end{pmatrix} = X^n \cdot \begin{pmatrix}
f(0)\\ 
f(1)\\ 
\cdot\\ 
\cdot\\ 
\cdot\\ 
f(k - 1)
\end{pmatrix}$

### 7. Седьмая группа тестов: $0 < N < 10^{18}, 0 < C < 50$. 

Применительно к нашей задаче, матрица $X$ будет иметь размер $(C + 1) \cdot (C + 1)$ и $c_k = 1$.  
Пример для $C = 5$:  
  
$X = \begin{pmatrix}
 0&  1&  0&  0&  0& 0\\ 
 0&  0&  1&  0&  0& 0\\ 
 0&  0&  0&  1&  0& 0\\ 
 0&  0&  0&  0&  1& 0\\ 
 0&  0&  0&  0&  0& 1\\ 
 1&  1&  1&  1&  1& 1 
\end{pmatrix}$

**План решения**.  
  
  1. Написать функцию, которая строит матрицу $X$ размера $k \times k$, где   $k = C + 1$.
  2. Написать функцию, которая возвращает результат умножения квадратной матрицы $A$ на квадратную матрицу $B$.
  3. Написать функцию быстрого возведения в степень $N$ матрицы $X$.
  4. Провести исследование: для маленьких $C = 3$ и $N = 25$ вручную подсчитать $f(k)$ для $k = 1, 2,...25$, затем получить цепочку матриц $X, X^2, X^3, X^4,..., X^{25}$ и определить, в какой ячейке матрицы $X^k$ находится ответ $f(k)$.
  5. Собрать решение для седьмой группы тестов, сдать в проверяющую систему. 

$1$. Постороим матрицу $X$:

In [24]:
def mat(k):
    x = [[0] * k for i in range(k)]
    for j in range(k):
        x[k - 1][j] = 1
    for j in range(k - 1):
        x[j][j + 1] = 1
    return x

In [25]:
x = mat(4)
for i in x:
    print(i)

[0, 1, 0, 0]
[0, 0, 1, 0]
[0, 0, 0, 1]
[1, 1, 1, 1]


$2$. Напишем функцию перемножения двух квадратных матриц:

In [26]:
def matrix_mul_2(d, b, m):
    x = [[0] * m for i in range(m)]
    for i in range(m):
        for j in range(m):
            for r in range(m):
                x[i][j] += (d[i][r] * b[r][j])
            x[i][j] %= mod
    return x

$3$. Напишем функцию быстрого возведения в степень $N$ матрицы $X$:

In [27]:
def pow_2(p, a):
    m = a
    t = [[0] * k for i in range(k)]
    for i in range(k):
        t[i][i] = 1

    while p:
        if p % 2:
            t = matrix_mul_2(t, m, k)
        m = matrix_mul_2(m, m, k)
        p //= 2
    return t

$4$. Решим задачу для $C = 3, N = 25$:

In [28]:
f = [1] * 26
f[1] = 2
f[2] = 4
f[3] = 8
for i in range(4, 26):
    f[i] = sum(f[i - 4: i])
    print(f'f({i}) = {f[i]}')

f(4) = 15
f(5) = 29
f(6) = 56
f(7) = 108
f(8) = 208
f(9) = 401
f(10) = 773
f(11) = 1490
f(12) = 2872
f(13) = 5536
f(14) = 10671
f(15) = 20569
f(16) = 39648
f(17) = 76424
f(18) = 147312
f(19) = 283953
f(20) = 547337
f(21) = 1055026
f(22) = 2033628
f(23) = 3919944
f(24) = 7555935
f(25) = 14564533


Получим цепочку матриц $X^k$

In [29]:
x = mat(4)
for i in x:
    print(i)

[0, 1, 0, 0]
[0, 0, 1, 0]
[0, 0, 0, 1]
[1, 1, 1, 1]


In [30]:
b = mat(4)

In [17]:
mod = 1000000007
for i in range(25):
    b = matrix_mul_2(b, x, 4)
    print(f'k = {i + 1}')
    for j in b:
        print(j)
    print()

k = 1
[0, 0, 1, 0]
[0, 0, 0, 1]
[1, 1, 1, 1]
[1, 2, 2, 2]

k = 2
[0, 0, 0, 1]
[1, 1, 1, 1]
[1, 2, 2, 2]
[2, 3, 4, 4]

k = 3
[1, 1, 1, 1]
[1, 2, 2, 2]
[2, 3, 4, 4]
[4, 6, 7, 8]

k = 4
[1, 2, 2, 2]
[2, 3, 4, 4]
[4, 6, 7, 8]
[8, 12, 14, 15]

k = 5
[2, 3, 4, 4]
[4, 6, 7, 8]
[8, 12, 14, 15]
[15, 23, 27, 29]

k = 6
[4, 6, 7, 8]
[8, 12, 14, 15]
[15, 23, 27, 29]
[29, 44, 52, 56]

k = 7
[8, 12, 14, 15]
[15, 23, 27, 29]
[29, 44, 52, 56]
[56, 85, 100, 108]

k = 8
[15, 23, 27, 29]
[29, 44, 52, 56]
[56, 85, 100, 108]
[108, 164, 193, 208]

k = 9
[29, 44, 52, 56]
[56, 85, 100, 108]
[108, 164, 193, 208]
[208, 316, 372, 401]

k = 10
[56, 85, 100, 108]
[108, 164, 193, 208]
[208, 316, 372, 401]
[401, 609, 717, 773]

k = 11
[108, 164, 193, 208]
[208, 316, 372, 401]
[401, 609, 717, 773]
[773, 1174, 1382, 1490]

k = 12
[208, 316, 372, 401]
[401, 609, 717, 773]
[773, 1174, 1382, 1490]
[1490, 2263, 2664, 2872]

k = 13
[401, 609, 717, 773]
[773, 1174, 1382, 1490]
[1490, 2263, 2664, 2872]
[2872, 4362, 5135, 553

$5$. Получим значение $f(25)$ возведением матрицы $X$ в степень $25$.  
Ответ лежит в $x[3][3]$.

In [102]:
k = 4
g = [[1], [2], [4], [8]]
x = pow_2(25, x)
print(x[3][3])
ans = x[0][0] * g[0][0] + x[0][1] * g[1][0] + x[0][2] * g[2][0] + x[0][3] * g[3][0]
print(ans)

7555935
14564533


Высислительная сложность решения

### $C^3 \cdot \log N$  
  
  При $C = 200$ и $N = 10^{18}$ количество операций составит:

In [38]:
from math import log2
x = 200 ** 3 * int(1 + log2(10 ** 18))
print(x)

480000000


Четыреста восемьдесят миллионов операций! Такое сложно пробить кодом на $C++$, код на Python обязательно получит несколько TL.

При $C = 50 $ и $N = 10^{18}$ количество операций составит:

In [39]:
y = 50 ** 3 * int(1 + log2(10 ** 18))
print(y)

7500000


Семь с половиной миллионов операций за 300 миллисекунд - это легко для $C$++ и
на границе прохода для Python, многое зависит от быстродействия сервера с проверяющей системой.

Испытания кода показали, что из десяти тестов седьмой группы проходим шесть, а на четырех получаем TL. Что неплохо для нас, хотя дополнительных баллов мы не получили. Решение, написанное на $C$++, проходит седьмую группу тестов, а на восьмой группе получает  семь OK и три TL.  
Решение нужно как-то проталкивать, но это выходит за рамки нашего курса.

### Итоги:  
  
  С помощью перемножения матриц мы научились быстро находить большие числа Фибоначчи и быстро подсчитывать сумму $C$ подряд идущих членов линейных рекуррентных выражений. Эти знания и умения могут пригодиться на областных олимпиадах.