# Практическая работа №1: Исследование алгоритмов формирования аддитивных цепочек


Выполнил студент гр. 0304 Черепанов Роман, вариант 48.

## Цель работы

Формирование представления о аддитивных цепочках, выработать умение составлять и применять алгоритмы для нахождения минимальных аддитивных цепочек для заданного числа, привить навык использования систем компьютерной математики для реализации алгоритмов.

## Основные теоретические положения

**Аддитивная цепочка** - последовательность натуральных чисел:
$$1 = a_0, a_1, ..., a_r = n,$$
где каждый элемент - сумма двух некоторых предыдущих: $a_i = a_j + a_k, k \leq j < i, i = 1, 2, ..., r.$

Пусть $l(n)$ - длина миниальной АЦ для $n$.
Для разных методов вычислений выполняются следующие неравенства:
* Метод множителей: $l(mn) \leq l(m) + l(n)$
* Бинарный метод: $l(n) \leq \lambda(n) + \nu(n) - 1,$
где $\lambda(n) = \lceil lb(n)\rceil, \nu(n)$* - вес Хэмминга.
* $m$-арный метод: $l(n) \leq m - 2 + (k + 1)t$, где  $m = 2^k, n = \sum_{j=0}^td_jm^{t-j}$.

Полгаем, что АЦ - возрастающие.

Пара $(j, k), 0 \leq k \leq j < i$ - шаг $i$. Если существует несколько пар, полагаем $j$ наибольшим.

**Виды шагов**:
* удвоение: $j = k = i-1$,
* звёздный шаг: $j = i - 1$,
* малый шаг: $\lambda(a_i) = \lambda(a_{i-1})$.

**Свойства шагов**:
* первый шаг - всегда удвоение;
* удвоение - звёздный шаг, но никогда не малый;
* за удвоением - всегда звёздный шаг;
* если $i$-ый шаг не малый, то $i+1$-ый шаг либо малый, либо звёздный, либо и то, и другое;
* если $i+1$-ый шаг ни звёздный, ни малый, то $i$-ый шаг - малый.

**Теорема**:

Если аддитивная цепочка содержит $d$ удвоений и $f = r - d$ неудвоений, то $n \leq 2^{d-1}F_{r+3}$, где $F_j$ - $j$-тое число Фиббоначи.

**Следствие**:

Если АЦ включает $f$ неудвоений и $s$ малых шагов, то $s \leq f \leq \frac{s}{1 - lb \phi}, \phi = \frac{1 + \sqrt{5}}{2}$.


### Алгоритм Брауэра
$l_B(n) = \lambda(n) + \frac{\lambda(n)}{\lambda\lambda(n)} + O(\frac{\lambda(n)\lambda\lambda\lambda(n)}{(\lambda\lambda(n))^2})$

* Самая короткая АЦ для $n$ имеет длину не более $\lambda(n)$
* Доказано, что для всех $n$ минимальная АЦ имеет длину $l_B(n)$.

Для заданного $k$ можно построить АЦ для $n$ по рекуррентной формуле:
$$l_B(n) = 
\begin{cases}
1, 2, ..., 2^k - 1; n < 2 \\
B_k(q), 2q, ..., 2^kq, n;  n \geq 2^k, q = [n/2^k]
\end{cases}$$

Данная цепочка будет иметь длину $l_B(n) = j(k+1) + 2^k - 2$, при условии, что $jk \leq \lambda(n) < (j + 1)^k$.

### Алгоритм Яо
Обладает той же сложностью.
* Число раскладывается в $2^k$ системе счисления.
* Вводится функция $d(z) = \sum_{i:a_i = z}2^{ik}$.
* Базовая последовательность: $1, 2, ..., 2^{\lambda(n)}$.
* Вычисляется $zd(z)$ для всех $z$.
* n = \sum_{z = 1}^{2^k - 1}zd(z).

### Алгоритм дробления вектора индексов
Поиск минимальной звездной цепочки.

Сложность прямого перебора: $\sum(m-1)!$

Рассмотрим вектор ${r_1, r_2, ..., r_q} \cup {\rho_{q_1}, ..., \rho_m}$.

Пусть левая часть - фиксированная, правая - меняющаяся.

Таких наборов: $\frac{m!}{q!}$.

$a_{min} = a_{q+1} + m - q$ при ${r_1, r_2, ..., r_q} \cup {1, ..., 1}$.

$a_{max} = a_{q+1} * 2^{m-q}$ при ${r_1, r_2, ..., r_q} \cup {q+1, ..., m}$.

Происходит перебор по длинам цепочек в отрезке $[\lceil lb n \rceil; \lambda(n) + \nu(n) - 1]$.

## Постановка задачи

Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной математики SageMath, провести анализ алгоритмов. Полученные результаты содержательно проинтерпретировать.


## Порядок выполнения работы
1. Вручную (т.е. не реализовывая алгоритм на Sage) построить последовательность вычислений бинарным методом и методом множителей для 2-3 значений  (значение  выбираются студентом самостоятельно). Сравнить количество операций для каждого метода, сделать выводы.

2. Реализовать алгоритм Брауэра (для нечётных вариантов) и алгоритм Яо (для чётных вариантов) для вычисления приближённых аддитивных цепочек для различных чисел при варьировании параметра , сопоставить длины полученных аддитивных цепочек с минимальной аддитивной цепочкой для заданного числа. Сделать выводы.

3. Реализовать алгоритм дробления вектора индексов для нахождения минимальной звёздной цепочки для заданного числа. Протестировать алгоритм минимум для 5 значений . Указать, сколько времени потребовалось на поиск цепочки и какая цепочка получилась. Сравнить с предыдущими методами, сделать выводы.

4. Проверить гипотезу Шольца–Брауэра для всех натуральных  на алгоритме дробления вектора индексов. Результаты оформить в виде таблицы. Сделать выводы.

5. Найти или предложить собственные модификации алгоритмов и привести описание модификаций. Реализовать модифицированные алгоритмы и сравнить их мощность.

## Выполнение работы

### Бинарный метод

Для $n = 42:$

| i 	|  N 	|   Y  	|   Z  	|
|:-:	|:--:	|:----:	|:----:	|
| 0 	| 42 	|   1  	|   x  	|
| 1 	| 21 	|   1  	|  x^2 	|
| 2 	| 10 	|  x^2 	|  x^4 	|
| 3 	|  5 	|  x^2 	|  x^8 	|
| 4 	|  2 	| x^10 	| x^16 	|
| 5 	|  1 	| x^10 	| x^32 	|
| 6 	|  0 	| x^42 	| x^32 	|

Всего было выполнено 3 (для $Y$) + 5 (для $Z$) = 8 операций умножения.


Для $n = 69:$

| i 	|  N 	|   Y  	|   Z  	|
|:-:	|:--:	|:----:	|:----:	|
| 0 	| 69 	|   1  	|   x  	|
| 1 	| 34 	|   x  	|  x^2 	|
| 2 	| 17 	|   x  	|  x^4 	|
| 3 	|  8 	|  x^5 	|  x^8 	|
| 4 	|  4 	|  x^5 	| x^16 	|
| 5 	|  2 	|  x^5 	| x^32 	|
| 6 	|  1 	|  x^5 	| x^64 	|
| 7 	| 0  	| x^69 	| x^64 	|

Всего было выполнено 3 (для $Y$) + 6 (для $Z$) = 9 операций умножения.

### Метод множителей

Для $n = 42:$
$$42 = p * q = 2 * 21 \\
y = x ^ 2, i = 1\\
y ^ {21} = {y ^ 3} ^ 7 \\
z = y ^ 3 = y ^ 2 * y, i = 3 \\
z ^ 7 = z^6 * z, i = 4 \\
z ^ 6 = {z ^ 2} ^ 3 \\
t = z ^ 2, i = 5 \\
t ^ 3 = t ^ 2 * t, i = 7$$

Для $n = 69:$
$$69 = p * q = 3 * 23 \\
y = x ^ 2 * x, i = 2\\
y ^ {23} = y ^ {22} * y, i = 3 \\
y ^ {22} = {y ^ 2} ^ {11}\\
z = y ^ 2, i = 4 \\
z ^ {11} = {z ^ {10}} * z, i = 5 \\
z ^ {10} = {z ^ 2} ^ 5 \\
t = z ^ 2, i = 6 \\
t ^ 5 = t ^ 4 * t, i = 7 \\
t ^ 4 = {t ^ 2} ^ 2 \\
u = t ^ 2, i = 8 \\
u ^ 2 = u ^ 2, i = 9$$

### Сравнение
На примере $n = 42$ показано, что бинарный метод в некоторых случаях работает медленнее, чем метод множителей. Попробуем объяснить это.

Количество шагов, используемых в бинарном методе $l(n)$ ограничено сверху выражением $\lambda(n) + \nu(n) - 1$, где $\nu(n)$ - это количество не нулей среди цифр числа $n$. Таким образом, количество шагов в бинарном методе зависит от числа единиц в записи.

В это же время метод множителей никак не связан с конкретными системами счисления. Поэтому для чисел, в двоичной записи которых много единиц, метод множителей оказывается эффективнее.

### Алгоритм Яо


In [46]:
from time import perf_counter_ns

def transfer_2_to_k(n, k):
# Перевод в 2^k систему счисления
    digits = []
    divisor = 2**k
    while n > 0:
        digits.append(n % divisor)
        n //= divisor
    return digits[::-1]

def compute_d(z, k, digits, chain):
# Вычисление функции d(z) с добавлением новых элементов в цепочку
    d = 0
    for i in range(len(digits)):
        if digits[i] == z:
            digit = 2 ** ((len(digits) - i - 1)*k)
            # степень, соответствующая i-той цифре
            d += digit
            if d not in chain:
                chain.append(d)
    return d

def compute_zd(z, d, chain):
    # Вычисление zd(z) бинарным методом справа-налево
    y = 0
    while z:
        if d not in chain:
            chain.append(d)
        if z % 2:
            y += d
            if y not in chain:
                chain.append(y)
        d *= 2
        z //= 2
    return y

def yao(n, k):
    # базовая последовательность
    add_chain = [2**power for power in range(0, floor(log(n, 2)) + 1)]
    digits = transfer_2_to_k(n, k)
    d = {}
    for digit in set(digits):
        if digit:
            # исключаем нули и повторы
            d[digit] = compute_d(digit, k, digits, add_chain)

    zd = []
    for key, value in d.items():
        # находим все zd
        zd.append(compute_zd(key, value, add_chain))
    n = zd[0]
    for elem in zd[1:]:
        n += elem
        add_chain.append(n)
    return add_chain

def test(nums, ks):
    for num in nums:
        print(f'\nTesting for num {num}, min_len = {ceil(log(num, 2))}')
        for k in ks:
            start = perf_counter_ns()
            chain = yao(num, k)
            print(f'k = {k}, time = {float((perf_counter_ns() - start) / 10**6)} ms, len = {len(chain)}')
                  
nums = [1050, 1348, 2202, 2022, 1986]
ks = [2, 3, 5, 7, 14]
test(nums, ks)



Testing for num 1050, min_len = 11
k = 2, time = 0.0641 ms, len = 15
k = 3, time = 0.082 ms, len = 15
k = 5, time = 0.0749 ms, len = 14
k = 7, time = 0.0786 ms, len = 14
k = 14, time = 0.0655 ms, len = 14

Testing for num 1348, min_len = 11
k = 2, time = 0.0671 ms, len = 14
k = 3, time = 0.0444 ms, len = 14
k = 5, time = 0.0408 ms, len = 14
k = 7, time = 0.039 ms, len = 14
k = 14, time = 0.0232 ms, len = 14

Testing for num 2202, min_len = 12
k = 2, time = 0.0534 ms, len = 17
k = 3, time = 0.0282 ms, len = 17
k = 5, time = 0.046 ms, len = 16
k = 7, time = 0.0391 ms, len = 16
k = 14, time = 0.0426 ms, len = 16

Testing for num 2022, min_len = 11
k = 2, time = 0.0306 ms, len = 19
k = 3, time = 0.0438 ms, len = 18
k = 5, time = 0.0259 ms, len = 18
k = 7, time = 0.0245 ms, len = 18
k = 14, time = 0.0412 ms, len = 18

Testing for num 1986, min_len = 11
k = 2, time = 0.0319 ms, len = 16
k = 3, time = 0.0282 ms, len = 16
k = 5, time = 0.0272 ms, len = 16
k = 7, time = 0.0255 ms, len = 16
k =

Для всех проверенных $k$ и $n$ время работы алгоритма составляет примерно ${10^{-4}}$ секунд или меньше. При этом длина цепочки превосходит минимальную (оцененную как $\lceil lb(n) \rceil)$ на 3-5 элементов.
При увеличении $k$ длина цепочки не изменяется или уменьшается.

Самая длинная цепочка получилась для $n = 2022$ - вероятнее всего, это связано с тем, что его бинарное представление содержит достаточно много единиц.

### Алгоритм дробления вектора

In [124]:
def max_len(n):
    return floor(log(n, 2)) + str(bin(n)).count('1') - 1

def next_vector(vec):
    for i in range(len(vec) - 1, 0, -1):
        if vec[i] > 1:
            vec[i] -= 1
            for j in range(i + 1, len(vec)):
                vec[j] = j + 1
            return vec
    return None

def compute_chain(vec):
    chain = [1]
    for ind in vec:
        chain.append(chain[-1] + chain[ind - 1])
    return chain

def fractured_indices_vector(n):
    answers = [[], [1], [1, 1]]
    if n < 4:
        return answers[n-1]
    for m in range(ceil(log(n, 2)), max_len(n) + 1):
        q = m//2
        fixed_part = [i for i in range(1, q+1)]
        various_part = [i for i in range(q+1, m+1)]
        while fixed_part:   
            chain = compute_chain(fixed_part+various_part)
            a_min = chain[q] + m - q
            a_max = chain[q]*2**(m-q)
            if a_min <= n <= a_max:
                while various_part:      
                    chain = compute_chain(fixed_part+various_part)
                    if chain[-1] == n:
                        return fixed_part+various_part
                    various_part = next_vector(various_part)
            fixed_part = next_vector(fixed_part)
            various_part = [i for i in range(q+1, m+1)]
            

            
            

def test(nums):
    for num in nums:
        print(f'\nTesting for num {num}, min_len = {ceil(log(num, 2))}')
        start = perf_counter_ns()
        vec = fractured_indices_vector(num)
        chain = compute_chain(vec)
        print(f'time = {float((perf_counter_ns() - start) / 10**9)} s, chain = {chain}, len = {len(chain)}')
        

nums = [1050, 1348, 2202, 2022, 1986]
test(nums)


Testing for num 1050, min_len = 11
time = 12.5025928 s, chain = [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 1040, 1048, 1050], len = 14

Testing for num 1348, min_len = 11
time = 7.5330597 s, chain = [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 1280, 1284, 1348], len = 14

Testing for num 2202, min_len = 12
time = 132.9659684 s, chain = [1, 2, 4, 8, 16, 24, 26, 34, 68, 136, 272, 544, 1088, 2176, 2202], len = 15

Testing for num 2022, min_len = 11
time = 438.2256764 s, chain = [1, 2, 4, 6, 12, 24, 36, 42, 84, 168, 336, 672, 1344, 2016, 2022], len = 15

Testing for num 1986, min_len = 11
time = 137.0967256 s, chain = [1, 2, 4, 8, 16, 32, 64, 96, 192, 384, 768, 1536, 1920, 1922, 1986], len = 15


Для тех же значений $n$ алгоритм дробления вектора индексов дает гарантированно кратчайшие ассоциативные цепочки, но при этом время работы многократно (вплоть до нескольких порядков) превышает время работы алгоритма Яо. Это объясняется факториальной сложностью алгоритма.

Длина полученных цепочек превышает минимальную оцененную, но всегда оказывается меньше или равной длине цепочек, полученных с помощью алгоритма Яо.

In [None]:
for i in range (1, 13):
    chain1 = fractured_indices_vector(2**i - 1)
    chain2 = fractured_indices_vector(i)
    print(f'n = {i}, l(2^n - 1) = {len(chain1)}, l(n) + n - 1 = {len(chain2) + i - 1}, {len(chain1) <= len(chain2) + i - 1}')

n = 1, l(2^n - 1) = 0, l(n) + n - 1 = 0, True
n = 2, l(2^n - 1) = 2, l(n) + n - 1 = 2, True
n = 3, l(2^n - 1) = 4, l(n) + n - 1 = 4, True
n = 4, l(2^n - 1) = 5, l(n) + n - 1 = 5, True
n = 5, l(2^n - 1) = 7, l(n) + n - 1 = 7, True
n = 6, l(2^n - 1) = 8, l(n) + n - 1 = 8, True
n = 7, l(2^n - 1) = 10, l(n) + n - 1 = 10, True
n = 8, l(2^n - 1) = 10, l(n) + n - 1 = 10, True
n = 9, l(2^n - 1) = 12, l(n) + n - 1 = 12, True
n = 10, l(2^n - 1) = 13, l(n) + n - 1 = 13, True


Гипотеза Шольца-Брауэра проверяется неравенством: $l(2^n - 1) \leq l(n) + n - 1$.

Для чисел от 1 до 12 она выполняется, что было проверено в ячейке выше. Результаты выполнения кода можно зафиксировать в таблице:


|  i 	| l(2^n - 1) 	| l(n) + n - 1 	| Выполнение гипотезы 	|
|:--:	|:----------:	|:------------:	|:-------------------:	|
|  1 	|      0     	|       0      	|          Да         	|
|  2 	|      2     	|       2      	|          Да         	|
|  3 	|      4     	|       4      	|          Да         	|
|  4 	|      5     	|       5      	|          Да         	|
|  5 	|      7     	|       7      	|          Да         	|
|  6 	|      8     	|       8      	|          Да         	|
|  7 	|     10     	|      10      	|          Да         	|
|  8 	|     10     	|      10      	|          Да         	|
|  9 	|     12     	|      12      	|          Да         	|
| 10 	|     13     	|      13      	|          Да         	|
| 11 	|     15     	|      15      	|          Да         	|
| 12 	|     15     	|      15      	|          Да         	|

## Выводы
Таким образом, в рамках данной работы были исследованы различные методы построения аддитивных цепочек. Было построено несколько приближенных аддитивных цепочек алгоритмом Яо и точные звездные цепочки для тех же значений $n$ алгоритмом дробления вектора индексов.

Выяснено, что алгоритм дробления строит более эффективные цепочки, однако время его выполнения значительно больше. С его помощью была проверена гипотеза Шольца-Брауэра для чисел от 1 до 12.