# Практическая работа №1: Исследование алгоритмов формирования аддитивных цепочек

Выполнил студент гр. 0304 Решоткин Артем, вариант 45.

## Цель работы

Сформировать представления о аддитивных цепочках, выработать умение составлять и применять алгоритмы для нахождения минимальных аддитивных цепочек для заданного числа, привить навык использования систем компьютерной математики для реализации алгоритмов.

## Основные теоретические положения

Аддитивной цепочкой для $ n \in ℕ $ называется последовательность натуральных чисел
$$ 1 = a_0, a_1, ..., a_r = n, $$
где каждый элемент последователньости равен сумме каких-то двух предыдущих:
$$ a_i = a_j + a_k, \quad k \le j \le i, \quad i = 1, 2, ..., r $$

где $l(n) = r$ - наименьшая длина аддитивной цепочки для $ n \in ℕ $.

Для метода наименьших множителей: $$ \quad l(mn) \le l(m) + l(n) $$

Для m-арного метода: $$ \quad l(n) \le m - 2 + (k + 1)t \quad [m = 2^k, n = \sum_{j = 0}^t d_j m^{t-j}] $$

Для SX-метода: $$ \quad l(n) \le \lambda (n) + \nu (n) - 1 $$


### Свойства аддитивных цепочек:
* Полагается строгое возрастание элементов цепочки:
$ 1 = a_0 < a_1 < a_2 < ... < a_n = n $
* Одинаковые числа в цепочке можно опустить
* Пара $ (j, k), 0 \le k \le j < i $ называется шагом $i$
* Если $\exists$ более чем 1 пара $ (j, k) $, полагаем $ max \hspace{0.2cm} j $

### Виды шагов:
* удвоение: $ j = k = i - 1 $
* звёздный шаг: $ j = i - 1 $ (линейный шаг)
* малый шаг: $ \lambda (a_i) = \lambda (a_i - 1) $, где $ \lambda (n) = \lfloor lb(n) \rfloor$

### Свойства видов шагов:
* шаг 1 - всегда удвоение
* удвоение - звёздный шаг, но никогда не малый
* если $i$-ый шаг не малый, то $(i+1)$-ый шаг либо малый, либо звёздный, либо оба
* за удвоением всегда следует звёздный шаг
* если $(i+1)$-ый шаг не звёздный и не малый, то $i$-ый шаг должен быть малым

### Теорема:

Если аддитивная цепочка содержит $d$ и $f = r - d$ неудвоений, то $n \le 2^{d-1} F_{f+3}$, где $F_j$ - число Фиббоначи

### Следствие:

Если аддитивная цепочка содержит $f$ удвоений и $S$ малых шагов, то

${S \le f \le} {S \over {1 - lb(\varphi)}}$, где $\varphi = {{\sqrt{5} + 1} \over 2} $ - золотое сечение

### Алгоритм Брауэра:

Для $n \in ℕ$ при заданном $k \in ℕ$ можно построить цепочку Брауэра с помощью рекуррентной формулы:

$$ B_k (n) =
\begin{cases}
1, 2, 3, ..., 2^k - 1, \quad n < 2^k \\
B_k (q), 2q, 4q, ..., 2^k q, n, \quad n \ge 2^k
\end{cases} \\
q = \lfloor {n \over 2^k} \rfloor
$$

Данная цепочка имеет длину
$$l_B (n) = j(k + 1) + 2^k - 2,$$
при условии что $jk \le \lambda (n) \le (j+1)k$

Длина будет минимализирована для больших $n$, если положить $k = \lambda \lambda (n) - 2 \lambda \lambda \lambda (n)$

**Ход алгоритма:**

* Задаётся некий параметр $k$ для $n$.
Выполняется вычисление вспомогательных чисел:
$$
d = 2^k, \hspace{0.2cm} q_1 = [ {n \over d} ], \hspace{0.2cm} r_1 = n \hspace{0.2cm} mod \hspace{0.2cm} d => n = q_1 d + r_1 \quad (0 \le r_1 < d) \\
q_2 = [ {q_1 \over d} ], \hspace{0.2cm} r_2 = q_1 \hspace{0.2cm} mod \hspace{0.2cm} d => q_1 = q_2 d + r_2 \quad (0 \le r_2 < d)
$$
* Данная процедура продолжается, пока не появится $q_s < d,$ следовательно $q_{s-1} = q_s d + r_s$
* Таким образом, n имеет вид
$$ n = 2^k q_1 + r_1 = 2^k (2^k q_2 + r_2) + r_1 = ...\\
... = 2^k (2^k (... (2^k q_s + r_s ) ... ) + r_2 ) + r_1 . $$

$$B_n (n): 1, 2, 3, ..., 2^k - 1, \\
2q_s, 4q_s, 8q_s, ..., 2^k q_s, 2^k q_s + r_s, \\
2q_{s-1}, 4q_{s-1}, 8q_{s-1}, ..., 2^k q_{s-1}, 2^k q_{s-1} + r_{s-1}, \\
..., \\
..., 2^k q_1, 2^k q_1 + r_1 = n.$$

### Алгоритм Яо:

* Обладает такой же вычислительной мощностью, что и алгоритм Брауэра
* Начало похоже: $k \ge 2$, $n$ раскладывается в $2^k$-ой системе счисления:
$$ n = \sum_{i = 0}^j a_i 2^{ik} , a_j \ne 0 $$
* Введём функцию d:
$$ d(z) = \sum_{i: a_i = z} 2^{ik} $$

**Ход алгоритма:**

* Базовая последовательность: $1, 2, 4, ..., 2^{\lambda(n)}$
* Вычисление значений $d(z)$ для всех $z \in \{ 1, 2, ..., 2^k - 1\}, \quad d(z) \ne 0$
* Вычисление $zd(z)$ для всех $z$
* n раскладывается в виде
$$ n = \sum_{z = 1}^{2^k - 1} zd(z) $$

## Постановка задачи

Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной математики SageMath, провести анализ алгоритмов. Полученные результаты содержательно проинтерпретировать.

## Выполнение работы

1. Вручную (т.е. не реализовывая алгоритм на Sage) построить последовательность вычислений бинарным методом и методом множителей для $x^n$ для 2-3 значений $n$ ($n \ge 30$). Сравнить количество операций для каждого метода, сделать выводы.

**n = 60:**<br>
Бинарный метод:<br>

#op | N | Y | Z
---| --- | --- | ---
0 | 60 | 1 | x
1 | 30 | 1 | x^2
2 | 15 | 1 | x^4
3 | 7 | x^4 | x^8
4 | 3 | x^12 | x^16
5 | 1 | x^28 | x^32
6 | 0 | x^60 | x^32

Метод множителей:<br>

$$ 60 = pq = 2 \cdot 30 $$
$$ y = x^2\\
   y^{30} = (y^5)^6 = ((y^2 \cdot y^2 \cdot y)^2)^2 \cdot (y^2 \cdot y^2 \cdot y)^2
$$
   
**n = 100:**<br>
Бинарный метод:<br>

#op | N | Y | Z
---| --- | --- | ---
0 | 100 | 1 | x
1 | 50 | 1 | x^2
2 | 25 | 1 | x^4
3 | 12 | x^4 | x^8
4 | 6 | x^4 | x^16
5 | 3 | x^4 | x^32
6 | 1 | x^36 | x^64
7 | 0 | x^100 | x^64

Метод множителей:<br>

$$ 100 = pq = 2 \cdot 50 $$
$$ y = x^2\ $$
$$ y^{50} = (y^2)25 = ((((y^2)^2)^2)^2)^2 \cdot (((y^2)^2)^2)^2 \cdot (y^2) $$
  


Количество операций:<br>

n | бинарный метод | метод множителей
--- | --- | ---
60| 6 | 9
100 | 7 | 10

Исходя из вычислений можно увидеть, что бинарному методу требуется меньшее количество операций, чем методу множителей. Однако не стоит забывать, что бинарный метод работает хуже для чисел, в двоичной записи которых много единиц, так как количество операций зависит от веса Хэмминга числа **n : l(n) =  λ(n) +  ν(n) - 1**

2. Реализовать алгоритм Брауэра для вычисления приближённых аддитивных цепочек для различных чисел при варьировании параметра k, сопоставить длины полученных аддитивных цепочек с минимальной аддитивной цепочкой для заданного числа. Сделать выводы.

Для начала реализуем несколько вспомогательных функций, выполняющих подсчет минимальной длины цепочки (minimal_length), функцию
для удаления повторяющихся чисел в цепочке (remove_repeats) и функцию преобразования цепочки к строке (chain_to_str). Далее реализуем сам алгоритм.

In [1]:
def _lambda(n):
    n = Integer(n)
    return n.nbits() - 1

def minimal_length(n):
    return int(_lambda(n) + _lambda(n) / _lambda(_lambda(n)) + (_lambda(n) * _lambda(_lambda(_lambda(n)))) / (_lambda(_lambda(n)) ** 2))


def remove_repeats(chain):
    ret = list(dict.fromkeys(chain))
    if ret[-1] == 0:
        del ret[-1]
    return ret

def chain_to_str(chain):
    return " ".join(map(str, chain[:min(len(chain), 17)])) + (" ..." if len(chain) > 17 else "")


def brouwer(n, k):
    if type(n) != int and type(n) != Integer:
        raise(TypeError("n должно быть целым числом"))
    if type(k) != int and type(k) != Integer:
        raise(TypeError("k должно быть целым числом"))
    n = Integer(n)

    d = 2 ** k

    rarr = [] # массив цифр числа в d- ичной системе счисления
    q = n.quo_rem(d)[0] #оставшееся часть числа(целая)
    rarr.append(n.quo_rem(d)[1]) #записываем остаток от деления n/d
    sqmax = rarr[0] # максимальная цифра

    i = 0
    while q >= d:
        rarr.append(q.quo_rem(d)[1])
        q = q.quo_rem(d)[0]
        if rarr[i] > sqmax:
            sqmax = rarr[i]
        i += 1
    rarr.append(q)
    sqmax = max(q, sqmax)

    chain = [0] * (sqmax + (len(rarr) - 1) * (k + 1)) # выделяем место под цепочку
    for i in range(1, sqmax + 1):
        chain[i-1] = i # последовательность от 1 до b , где b максиальная цифра

    chain[sqmax - 1] = q #временно заменяем последнее число в начальной цепочке на q для первой итерации цикла
    for i in range(0, len(rarr) - 1): # i - digit number
        for j in range(0, k): # j - текущий номер удвоения
            chain[sqmax + i * (k + 1) + j] = chain[sqmax + i * (k + 1) + j - 1] * 2 #удваиваем текущее число в цепочке
        chain[sqmax + i * (k + 1) + k] = chain[sqmax + i * (k + 1) + k - 1] + rarr[len(rarr) - 2 - i] #прибавляем след.цифру числа
    chain[sqmax - 1] = sqmax 

    return remove_repeats(chain)


set_random_seed(641202498)
n_set = []
for i in range(0, 5):
    n_set.append(randint(10, 300))
for i in range(0, 5):
    n_set.append(randint(300, 50000))

for k in [1, 2, 3, 5, 9, 15]:
    print("for k = ", k, ":", sep = "")
    for n in n_set:
        chain = brouwer(n, k)
        print("\t n = {:6}; l_B(n) = {:6}; l(n) = {:6}; \n\tChain: [{}]".format(n, len(chain), minimal_length(n), chain_to_str(chain)))


for k = 1:
	 n =     16; l_B(n) =      5; l(n) =      7; 
	Chain: [1 2 4 8 16]
	 n =    141; l_B(n) =     11; l(n) =     12; 
	Chain: [1 2 4 8 16 17 34 35 70 140 141]
	 n =    193; l_B(n) =     10; l(n) =     12; 
	Chain: [1 2 3 6 12 24 48 96 192 193]
	 n =    288; l_B(n) =     10; l(n) =     11; 
	Chain: [1 2 4 8 9 18 36 72 144 288]
	 n =    288; l_B(n) =     10; l(n) =     11; 
	Chain: [1 2 4 8 9 18 36 72 144 288]
	 n =  36244; l_B(n) =     22; l(n) =     21; 
	Chain: [1 2 4 8 16 17 34 35 70 140 141 282 283 566 1132 2264 2265 ...]
	 n =   3042; l_B(n) =     18; l(n) =     15; 
	Chain: [1 2 4 5 10 11 22 23 46 47 94 95 190 380 760 1520 1521 ...]
	 n =   6501; l_B(n) =     19; l(n) =     17; 
	Chain: [1 2 3 6 12 24 25 50 100 101 202 203 406 812 1624 1625 3250 ...]
	 n =  21813; l_B(n) =     22; l(n) =     20; 
	Chain: [1 2 4 5 10 20 21 42 84 85 170 340 680 681 1362 1363 2726 ...]
	 n =  23690; l_B(n) =     21; l(n) =     20; 
	Chain: [1 2 4 5 10 11 22 23 46 92 184 185 370 740 1480 2960 

Исходя из результатов вывода программы можно сделать вывод, что с увеличениям параметра **k** длина аддитивной цепочки увеличивается

3. Реализовать алгоритм дробления вектора индексов для нахождения минимальной звёздной цепочки для заданного числа. Протестировать алгоритм минимум для 5 значений n > 1000. Указать, сколько времени потребовалось на поиск цепочки и какая цепочка получилась. Сравнить с предыдущими методами, сделать выводы.

In [None]:
import math
import random

def _lambda(n):
    n = Integer(n)
    return n.nbits() - 1

def _nu(n):
    n = Integer(n)
    return n.popcount()


def minimal_length(n):
    return _lambda(n) + 1

def chain_from_indvec(indvec):
    indvec_len = len(indvec)
    nums = [0] * (indvec_len + 1)
    nums[0] = 1

    for i in range(0, indvec_len):
        nums[i + 1] = nums[i] + nums[indvec[i] - 1]
    return nums

def chain_to_str(chain):
    return " ".join(map(str, chain[:min(len(chain), 40)])) + (" ..." if len(chain) > 40 else "")


def generate(n, start = 1): #генерируем максимальный вектор индексов
    indvec = [0] * n
    for i in range(0, n):
        indvec[i] = i + start
    return indvec

def indvec_is_min(indvec): #является ли вектор минимальным
    for i in indvec:
        if i > 1:
            return False
    return True

def indvec_dec(indvec): #уменьшение вектор индексов на еденицу( доходим до самого правого эл-та не равного 1, уменьшаем его на 1, заменяем элементы справа на максимальные)
    indvec_len = len(indvec)

    for i in range(0, indvec_len):
        if indvec[indvec_len - 1 - i] > 1:
            indvec[len(indvec) - 1 - i] -= 1
            for j in range(indvec_len - i, indvec_len):
                indvec[j] = j + 1
            return

def indvec_get_last_num(indvec): #проходим по вектор индексов и преобразуем его в аддитивную звездную цепочку и извлекаем последний элемент
    indvec_len = len(indvec)
    nums = [0] * (indvec_len + 1)
    nums[0] = 1

    for i in range(0, indvec_len):
        nums[i + 1] = nums[i] + nums[indvec[i] - 1]
    return nums[indvec_len]


def indvec_crush(n):
    tries = [1, 1]

    lmin = math.ceil(math.log(n, 2)) #вычисляем мин макс длину цепочки
    lmax = _lambda(n) + _nu(n) - 1

    for m in range(lmin, lmax + 1):
        q = int(m / 2)
        iv_fix = generate(q) #фиксированная часть

        while True: #обрабатываем все фиксированные части
            iv_mut = generate(m - q, q + 1) #изменяемая часть

            iv_fix.append(iv_mut[0]) #временно добавляем к фиксированному первый элемент изменяемого вектора 
            aq = indvec_get_last_num(iv_fix)
            del iv_fix[-1] 
            amin = 1 + m - q 		# a_{q+1} + m - q, минимальное число которое можно получить изменяя изменяемую часть (1,1,1...) 
            amax = aq * 2 ** (m - q) 	# a_{q+1} * 2^{m-q} максимальное число которое можно получить изменяя изм. часть (3,4,5...)

            if n > amax or n < amin:	# n не в  [a_min, a_max],то не подходит фиксированная часть
                if indvec_is_min(iv_fix):
                    break
                indvec_dec(iv_fix)
                continue

            while True: #обрабатываем все изменяемые части
                if indvec_get_last_num(iv_fix + iv_mut) == n: #склеиваем цепочку и смотрим последнее число
                    return (iv_fix + iv_mut, tries)

                if indvec_is_min(iv_mut): #если прошли все изменяемые цепочки
                    break
                indvec_dec(iv_mut)
                tries[1] += 1

            if indvec_is_min(iv_fix): #если прошли все фиксированные цепочки для какого-то m
                break
            indvec_dec(iv_fix)
            tries[0] += 1


random.seed(215217579)
n_set = []
for i in range(0, 5):
    n_set.append(random.randint(1001, 1300))
print("{}\n".format(n_set))
for n in n_set:
    res = indvec_crush(n)
    print("n = {:4}   l*(n) = {:4}   l(n) = {:4}  # of fixed parts tried: {:6}  # of changable parts tried: {:6} \n{}\n".format(n, len(res[0]), minimal_length(n), res[1][0], res[1][1], chain_to_str(chain_from_indvec(res[0]))))


[1091, 1251, 1145, 1264, 1043]

n = 1091   l*(n) =   13   l(n) =   11  # of fixed parts tried:    821  # of changable parts tried: 6544749 
1 2 4 8 16 32 64 128 256 512 1024 1088 1090 1091



По результатам видно, что чем ближе число к степени двойки (начиная с младших разрядов), тем меньше необходимо перебрать векторов индексов. Например, для числа с наименьшим количеством перебранных как фиксированных, так и изменяемых частей $n = 1091_{10} = 10001000011$. Для числа с наибольшим количеством перебранных векторов индексов $n = 1145_{10} = 1001100101$, что довольно далеко от степени двойки и тем более имеет нули во 2 и 3 старших разрядах.

По сравнению с методом Брауэра отношение длин цепочек к числам получаются примерно одинаковыми, и разумеется большими чем минимальные длины цепочек $l(n) = \lceil lb(n) \rceil$ .

Также видно, что алгоритм имеет среднюю сложность $O(\sum(m-1)!)$, где $m$ - длина минимальной звёздной цепочки.

In [None]:
Теперь проверим гипотезу Штольца-Брауэра, используя при этом код выше,но изменив вывод программы.

In [None]:
print("l*(2^n-1) <= l*(n) +  n - 1")
for n in range(2, 13):
    res = indvec_crush(n)
    resb = indvec_crush(2 ** n - 1)
    print("{:9} <= {:5} + {:2} - 1\n{}".format(len(resb[0]), len(res[0]), n, len(resb[0]) <= len(res[0]) + n - 1))


Результаты проверки гипотезы Шольца-Брауэра для звёздных цепочек предоставлены в следующей таблице:

l^*(2^n - 1) | l^*(n) | n | l^*(2^n - 1) <= l^*(n) + n - 1
--- | --- | --- | ---
3 | 2 | 2 | True
5 | 3 | 3 | True
6 | 3 | 4 | True
8 | 4 | 5 | True
9 | 4 | 6 | True
11 | 5 | 7 | True
11 | 4 | 8 | True
13 | 5 | 9 | True
14 | 5 | 10 | True
16 | 6 | 11 | True
16 | 5 | 12 | True

Таким образом, было подтверждено, что гипотеза Шольца-Брауэра для звёздных цепочек верна для $2 \le n \le 12$ (для $1$ очевидно $1 \le 1 + 1 - 1$)

### Выводы
В ходе выполнения данной практической работы была изучена информация об аддитивных цепочках, были реализованы и применены на практике алгоритмы для нахождения минимальных аддитивных цепочек,а также был сформирован навык использования системы компьютерной математики SageMath для реализации таких алгоритмов.

Также была проверена гипотеза Шольца-Брауэра с помощью построенного алгоритма проверки, были проанализированы алгоритм Брауэра и алгоритм дробления векторов индексов.