# Практическая работа №1: Исследование алгоритмов формирования аддитивных цепочек

Выполнил студент гр. 0391 Пушков Константин, вариант 62.

## Цель работы

Сформировать представления о аддитивных цепочках, выработать умение составлять и применять алгоритмы для нахождения минимальных аддитивных цепочек для заданного числа, привить навык использования систем компьютерной математики для реализации алгоритмов.

## Основные теоретические положения

Аддитивной цепочкой для $ n \in ℕ $ называется последовательность натуральных чисел
$$ 1 = a_0, a_1, ..., a_r = n, $$
где каждый элемент последователньости равен сумме каких-то двух предыдущих:
$$ a_i = a_j + a_k, \quad k \le j \le i, \quad i = 1, 2, ..., r $$

$l(n) = r$ - наименьшая длина аддитивной цепочки для $ n \in ℕ $.

Для метода наименьших множителей: $ \quad l(mn) \le l(m) + l(n) $

Для m-арного метода: $ \quad l(n) \le m - 2 + (k + 1)t \quad [m = 2^k, n = \sum_{j = 0}^t d_j m^{t-j}] $

Для SX-метода: $ \quad l(n) \le \lambda (n) + \nu (n) - 1 $


### Свойства аддитивных цепочек:
* Полагается строгое возрастание элементов цепочки:
$ 1 = a_0 < a_1 < a_2 < ... < a_n = n $
* Одинаковые числа в цепочке можно опустить
* Пара $ (j, k), 0 \le k \le j < i $ называется шагом $i$
* Если $\exists$ более чем 1 пара $ (j, k) $, полагаем $ max \hspace{0.2cm} j $

### Виды шагов:
* удвоение: $ j = k = i - 1 $
* звёздный шаг: $ j = i - 1 $ (линейный шаг)
* малый шаг: $ \lambda (a_i) = \lambda (a_i - 1) $, где $ \lambda (n) = \lfloor lb(n) \rfloor$

### Свойства видов шагов:
* шаг 1 - всегда удвоение
* удвоение - звёздный шаг, но никогда не малый
* если $i$-ый шаг не малый, то $(i+1)$-ый шаг либо малый, либо звёздный, либо оба
* за удвоением всегда следует звёздный шаг
* если $(i+1)$-ый шаг не звёздный и не малый, то $i$-ый шаг должен быть малым

### Теорема:

Если аддитивная цепочка содержит $d$ и $f = r - d$ неудвоений, то $n \le 2^{d-1} F_{f+3}$, где $F_j$ - число Фиббоначи

### Следствие:

Если аддитивная цепочка содержит $f$ удвоений и $S$ малых шагов, то

${S \le f \le} {S \over {1 - lb(\varphi)}}$, где $\varphi = {{\sqrt{5} + 1} \over 2} $ - золотое сечение


### Алгоритм Яо:

* Обладает такой же вычислительной мощностью, что и алгоритм Брауэра
* Начало похоже: $k \ge 2$, $n$ раскладывается в $2^k$-ой системе счисления:
$$ n = \sum_{i = 0}^j a_i 2^{ik} , a_j \ne 0 $$
* Введём функцию d:
$$ d(z) = \sum_{i: a_i = z} 2^{ik} $$

**Ход алгоритма:**

* Базовая последовательность: $1, 2, 4, ..., 2^{\lambda(n)}$
* Вычисление значений $d(z)$ для всех $z \in \{ 1, 2, ..., 2^k - 1\}, \quad d(z) \ne 0$
* Вычисление $zd(z)$ для всех $z$
* n раскладывается в виде
$$ n = \sum_{z = 1}^{2^k - 1} zd(z) $$

## Постановка задачи

Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной математики SageMath, провести анализ алгоритмов. Полученные результаты содержательно проинтерпретировать.

## Выполнение работы

1. Вручную (т.е. не реализовывая алгоритм на Sage) построить последовательность вычислений бинарным методом и методом множителей для $x^n$ для 2-3 значений $n$ ($n \ge 30$). Сравнить количество операций для каждого метода, сделать выводы.

**n = 125:**<br>
Двоичный метод:<br>

N | Y | Z
--- | --- | ---
125 | 1 | x
62 | x | x^2
31 | x | x^4
15 | x^5 | x^8
7 | x^13 | x^16
3 | x^29 | x^32
1 | x^61 | x^64
0 | x^125 | x^128

Метод множителей:<br>

$$ 
   x^{125}=(((((x^2)^2\cdot x)^2)^2\cdot x)^2)^2\cdot x
$$
   
**n = 126:**<br>
Двоичный метод:<br>

N | Y | Z
--- | --- | ---
126 | 1 | x
63 | 1 | x^2
31 | x^2 | x^4
15 | x^6 | x^8
7 | x^14 | x^16
3 | x^30 | x^32
1 | x^62 | x^64
0 | x^126 | x^128

Метод множителей:<br>


$$  
    x^{126} = (((((x^2)^2 \cdot x) ^ 2 \cdot ((x^2)^2 \cdot x)) ^ 2 \cdot x) ^ 2 \cdot x) ^ 2
$$

Количество операций:<br>

n | двоичный метод | метод множителей
--- | --- | ---
125 | 11 | 9
126 | 11 | 13

Видно, что для чисел с небольшим количеством единиц в двоичной записи двоичный метод работает практически за одну операцию меньше, чем метод множителей (было проверено также для $ n = 98, 69 $). Для чисел с большим количество единиц в двоичной записи двоичный метод завершает свою работу примерно за столько же операций, за сколько завершается метод множителей. Скорее всего, метод множителей работает лучше на числах, для которых $p > 2$, а время работы двоичного метода близко к максимальному ($p$ близко к $2^k - 1$ по количеству единиц в двоичной записи).

2. Реализовать алгоритм Яо для вычисления приближённых аддитивных цепочек для различных чисел при варьировании параметра k, сопоставить длины полученных аддитивных цепочек с минимальной аддитивной цепочкой для заданного числа. Сделать выводы.

In [14]:
import time
from math import log, ceil

# разложение числа n в 2^k
def new_base_num(n, k):
    new_base = []
    div = 1 << k
    while n > 0:
        new_base.append(n % div)
        n //= div
    return new_base

# реализация функции d(z) и пополнение цепочки
def d_fun(z, k, new_base, chain):
    d = 0
    for i in range(len(new_base)):
        if new_base[i] == z:
            s = 1 << (i*k)
            if d != 0:
                chain.append(d+s)
            d += s
    return d

# высчитывание z*d(z), при помощи бинарного алгоритма, и добавление значения в цепочку
def yao_zdz(z, dz, chain):
    y, old_dz = 0, dz
    while z != 0:
        if dz not in chain:
            chain.append(dz)
        if z % 2 != 0:
            if y != 0:
                chain.append(y+dz)
            y += dz
        dz *= 2
        z //= 2
    return y

# сам алгоритм Яо
def yao_chain(n, k):
    new_base = new_base_num(n, k)
    # базовая последовательноть от 2^0 до 2^jk, где j - max индекс цифры в 2^k-чной с.с.
    chain = Sequence(1<<i for i in range((len(new_base)-1)*k+1))
    # вычисление d(z) для всех (кроме 0) цифр числа n в новой базе
    d_z = {z:d_fun(z, k, new_base, chain) for z in set(filter(lambda x: x != 0, new_base))}
    # вычисление z*d(z)
    zd_z = Sequence(yao_zdz(i, d_z[i], chain) for i in d_z)
    # сумма всех z*d(z) с добавлением в цепочку
    n = zd_z[0]
    for i in range(1, len(zd_z)):
        n += zd_z[i]
        chain.append(n)
    return chain




# тест
test = [1337, 1488, 2048, 3228]
for i in test:
    print("Проверка алгоритма Яо на числе ", i)
    for k in range(3, 6):
        begin = time.time()
        chain = yao_chain(i, k)
        end = time.time()
        print("k = ", k, "\t цепочка: ", *chain)
        print("l(n) = ", len(chain)-1, "\t Время = ",
              round(end-begin, 5), "c\tМинимальная длина = ", ceil(log(i, 2)))
    print("\n\n")

Проверка алгоритма Яо на числе  1337
k =  3 	 цепочка:  1 2 4 8 16 32 64 128 256 512 1024 24 56 1025 1281 1337
l(n) =  15 	 Время =  0.00019 c	Минимальная длина =  11
k =  4 	 цепочка:  1 2 4 8 16 32 64 128 256 9 48 512 1024 1280 57 1337
l(n) =  15 	 Время =  0.0001 c	Минимальная длина =  11
k =  5 	 цепочка:  1 2 4 8 16 32 64 128 256 512 1024 9 25 288 313 1337
l(n) =  15 	 Время =  8e-05 c	Минимальная длина =  11



Проверка алгоритма Яо на числе  1488
k =  3 	 цепочка:  1 2 4 8 16 32 64 128 256 512 520 1040 192 448 1488
l(n) =  14 	 Время =  6e-05 c	Минимальная длина =  11
k =  4 	 цепочка:  1 2 4 8 16 32 64 128 256 512 1024 1280 80 208 1488
l(n) =  14 	 Время =  9e-05 c	Минимальная длина =  11
k =  5 	 цепочка:  1 2 4 8 16 32 64 128 256 512 1024 192 448 1040 1488
l(n) =  14 	 Время =  9e-05 c	Минимальная длина =  11



Проверка алгоритма Яо на числе  2048
k =  3 	 цепочка:  1 2 4 8 16 32 64 128 256 512 1024 2048
l(n) =  11 	 Время =  6e-05 c	Минимальная длина =  11
k =  4 	 цепочка:

Работа алгоритма Яо была протестирована для чисел, больших 1000, при разных значениях параметра $k$. Алгоритм занял около $10^{-4}$ секунды во всех тестах. При этом при разных $k$ длина цепочки была практически одинаковой,

Длина цепочки превышала минимальную оценку в среднем на 1-2 элемента. За минимальную оценку было взято значение $\lceil log_{2}n \rceil$, полученное с помощью бинарного метода.

3. Реализовать алгоритм дробления вектора индексов для нахождения минимальной звёздной цепочки для заданного числа. Протестировать алгоритм минимум для 5 значений n > 1000. Указать, сколько времени потребовалось на поиск цепочки и какая цепочка получилась. Сравнить с предыдущими методами, сделать выводы.

In [1]:
import time
from math import log, ceil, floor
# получение следующего вектора индексов
# или части [r_start; r_end] (для перебора половины вектора)
# возвращает True, если вектор получен;
#            False, если был передан вектор из единиц
def next_vector(vec, start_v, end_v):
    i = end_v
    # найти самую старшую позицию с r_i > 1 и уменьшить r_i на 1
    while vec[i] == 1 and i >= start_v:
        i -= 1
    if i < start_v:
        return False
    vec[i] -= 1
    # выставить все следующие индексы в max
    for j in range(i+1, end_v+1):
        vec[j] = j+1
    return True

# вычислить аддитивную цепочку по вектору индексов
def get_chain(vec):
    chain = [1]
    for i in vec:
        chain.append(chain[-1] + chain[i-1])
    return chain

# алгоритм дробления вектора индексов
def index_vector_chain(n):
    if n < 3:
        return list(range(1, n+1))
    for m in range(ceil(log(n, 2)), floor(log(n, 2))+bin(n).count('1')):
        vec = list(range(1, m+1))
        q = m//2
        vec[q-1] += 1 # увеличить на 1, чтобы в цикле получить нужное значение
        while next_vector(vec, 0, q-1):
            a = get_chain(vec)
            if a[m] == n:
                return a
            elif a[m] >= a[q] + m - q and a[m] <= a[q] * 2**(m-q):
                while next_vector(vec, q, len(vec)-1):
                    a = get_chain(vec)
                    if a[m] == n:
                        return a
                # снова выставить правую часть в максимум и перебирать левую половину
                for i in range(q, len(vec)):
                    vec[i] = i+1

# тестирование
test_set = [1337, 1488, 2048]
for val in test_set:
    print("Тест на ", val)
    begin = time.time()
    chain = index_vector_chain(val)
    end = time.time()
    print("Цепочка: ", *chain)
    print("l(n) = ", len(chain)-1, "\t Время = ", round(end-begin, 5),
    " с\tМинимальная длина = ", ceil(log(val, 2)))
    print("\n")

Тест на  1337
Цепочка:  1 2 4 8 16 32 40 41 81 162 324 648 1296 1337
l(n) =  13 	 Время =  8710.85894  с	Минимальная длина =  11


Тест на  1488
Цепочка:  1 2 4 8 16 32 64 128 256 320 576 1152 1472 1488
l(n) =  13 	 Время =  4360.07074  с	Минимальная длина =  11


Тест на  2048
Цепочка:  1 2 4 8 16 32 64 128 256 512 1024 2048
l(n) =  11 	 Время =  0.00051  с	Минимальная длина =  11




Алгоритм был протестирован для тех же чисел, что и алгоритм Яо. Длины полученных звёздных цепочек получились такими же, как для алгоритма Яо. Однако алгоритм дробления вектора индексов работает намного дольше: несколько десятков минут для каждого числа. Такое долгое время работы объясняется тем, что в алгоритме происходит перебор различных векторов индексов, отчего алгоритм имеет факториальную сложность: $O(\sum (m-1)!)$.

4. Проверим гипотезу Шольца-Брауэра для чисел $1 \leq n \leq 12$ с помощью алгоритма дробления вектора индексов.

Гипотеза Шольца-Брауэра представляется следующим неравенством:

$$l(2^n-1) \leq l(n)+n-1.$$

Она была доказана только для звёздных цепочек.

Код для проверки:

In [2]:

from math import log, ceil, floor
# получение следующего вектора индексов
# или части [r_start; r_end] (для перебора половины вектора)
# возвращает True, если вектор получен;
#            False, если был передан вектор из единиц
def next_vector(vec, start_v, end_v):
    i = end_v
    # найти самую старшую позицию с r_i > 1 и уменьшить r_i на 1
    while vec[i] == 1 and i >= start_v:
        i -= 1
    if i < start_v:
        return False
    vec[i] -= 1
    # выставить все следующие индексы в max
    for j in range(i+1, end_v+1):
        vec[j] = j+1
    return True

# вычислить аддитивную цепочку по вектору индексов
def get_chain(vec):
    chain = [1]
    for i in vec:
        chain.append(chain[-1] + chain[i-1])
    return chain

# алгоритм дробления вектора индексов
def index_vector_chain(n):
    if n < 3:
        return list(range(1, n+1))
    for m in range(ceil(log(n, 2)), floor(log(n, 2))+bin(n).count('1')):
        vec = list(range(1, m+1))
        q = m//2
        vec[q-1] += 1 # увеличить на 1, чтобы в цикле получить нужное значение
        while next_vector(vec, 0, q-1):
            a = get_chain(vec)
            if a[m] == n:
                return a
            elif a[m] >= a[q] + m - q and a[m] <= a[q] * 2**(m-q):
                while next_vector(vec, q, len(vec)-1):
                    a = get_chain(vec)
                    if a[m] == n:
                        return a
                # снова выставить правую часть в максимум и перебирать левую половину
                for i in range(q, len(vec)):
                    vec[i] = i+1
print("l*(2^n-1) <= l*(n) +  n - 1")
for n in range(2, 13):
    a = Integer(n)
    b = Integer(2**n-1)
    chain_a = index_vector_chain(a)
    chain_b = index_vector_chain(b)
    len_a = len(chain_a)
    len_b = len(chain_b)
    print(f"n={n}, l(n) = {len_a}, l(2^n-1) = {len_b}")
    print(f"l(2^n - 1) <= l(n) + n - 1: {len_b <= n - 1 + len_a}")
    print()

l*(2^n-1) <= l*(n) +  n - 1
n=2, l(n) = 2, l(2^n-1) = 3
l(2^n - 1) <= l(n) + n - 1: True

n=3, l(n) = 3, l(2^n-1) = 5
l(2^n - 1) <= l(n) + n - 1: True

n=4, l(n) = 3, l(2^n-1) = 6
l(2^n - 1) <= l(n) + n - 1: True

n=5, l(n) = 4, l(2^n-1) = 8
l(2^n - 1) <= l(n) + n - 1: True

n=6, l(n) = 4, l(2^n-1) = 9
l(2^n - 1) <= l(n) + n - 1: True

n=7, l(n) = 5, l(2^n-1) = 11
l(2^n - 1) <= l(n) + n - 1: True

n=8, l(n) = 4, l(2^n-1) = 11
l(2^n - 1) <= l(n) + n - 1: True

n=9, l(n) = 5, l(2^n-1) = 13
l(2^n - 1) <= l(n) + n - 1: True

n=10, l(n) = 5, l(2^n-1) = 14
l(2^n - 1) <= l(n) + n - 1: True

n=11, l(n) = 6, l(2^n-1) = 16
l(2^n - 1) <= l(n) + n - 1: True

n=12, l(n) = 5, l(2^n-1) = 16
l(2^n - 1) <= l(n) + n - 1: True



Результаты проверки гипотезы Шольца-Брауэра для звёздных цепочек предоставлены в следующей таблице:

$l^*(2^n - 1)$| $l^*(n)$ | $n$ | $l^*(2^n - 1) \le l^*(n) + n - 1$
--- | --- | --- | ---
3 | 2 | 2 | +
5 | 3 | 3 | +
6 | 3 | 4 | +
8 | 4 | 5 | +
9 | 4 | 6 | +
11 | 5 | 7 | +
11 | 4 | 8 | +
13 | 5 | 9 | +
14 | 5 | 10 | +
16 | 6 | 11 | +
16 | 5 | 12 | +

Таким образом, было подтверждено, что гипотеза Шольца-Брауэра для звёздных цепочек верна для $2 \le n \le 12$ (для $1$ очевидно $1 \le 1 + 1 - 1$)

### Выводы
В ходе выполнения данной практической работы были сформированы представления об аддитивных цепочках, были выработаны умения реализовывать и применять алгоритмы для нахождения минимальных аддитивных цепочек, был сформирован навык использования системы компьютерной математики SageMath для реализации таких алгоритмов.

На практике была проверена гиптоеза Шольца-Брауэра, были проанализированы алгоритм Брауэра и алгоритм дробления векторов индексов.