# Практическая работа №1: Исследование алгоритмов формирования аддитивных цепочек

Выполнила студентка гр. 0392 Сидорина Дарья, вариант 85.


## Цель работы

Формирование представления о аддитивных цепочках, выработать умение составлять и применять алгоритмы для нахождения минимальных
аддитивных цепочек для заданного числа, привить навык использования
систем компьютерной математики для реализации алгоритмов.

## Основные теоретические положения

#### Бинарный метод 
   Алгоритм:  
    1) Записать число $n$ в бинарном виде  
    2) Отбросить старший бит  
    3) Произвести замену: если бит равен единице, то заменить его на SX иначе заменить на S  
    4) Выполнить вычисление, где S - возведение в квадрат, а X - умножение на $x$   
#### Метод множителей
   1) $n = pq$, где $p$ - наименьший простой множитель $n$. Таким образом, $x^n$ можно найти, вычислив $(x^p)^q$

2) Если n - простое, то можно сначала вычислить $x^{n - 1}$ и умножить на $x$
 и умножить его на x
 
3) При $n = 1$ получим $x^{n}$ без вычислений.


#### Аддитивные цепочки 
Аддитивной цепочкой для $ n \in ℕ $ называется последовательность натуральных чисел
$$ 1 = a_0, a_1, ..., a_r = n, $$
где каждый элемент последователньости равен сумме каких-то двух предыдущих:
$$ a_i = a_j + a_k, \quad k \le j \le i, \quad i = 1, 2, ..., r $$

* $l(n) = r$ - наименьшая длина аддитивной цепочки для $ n \in ℕ $.

* $\lambda(n) =  \lfloor\log_2(n)\rfloor $

* $\nu(n)$ - вес Хэмминга (число единиц в двоичной записи числа)


Неравенство для метода множителей: $ \quad l(mn) \leq l(m) + l(n) $

Неравенство для m-арного метода $ [m = 2^k, n = \sum_{j=0}^{k} d_{j}m^{t-j}] $: $ \quad l(n) = m - 2 + (k+1)t $

Неравенство для бинарного алгоритма "SX": $ \quad l(n) = \lambda(n) + \nu(n) - 1 $

#### Свойства аддитивных цепочек:
* Полагается строгое возрастание элементов цепочки:
$ 1 = a_0 < a_1 < a_2 < ... < a_n = n $
* Одинаковые числа в цепочке можно опустить
* Пара $ (j, k), 0 \le k \le j < i $ называется шагом $i$
* Если $\exists$ более чем 1 пара $ (j, k) $, полагаем $ max \hspace{0.2cm} j $

#### Виды шагов:
* удвоение: $ j = k = i - 1 $
* звёздный шаг: $ j = i - 1 $ (линейный шаг)
* малый шаг: $ \lambda (a_i) = \lambda (a_i - 1) $, где $ \lambda (n) = \lfloor lb(n) \rfloor$

#### Свойства видов шагов:
* шаг 1 - всегда удвоение
* удвоение - звёздный шаг, но никогда не малый
* если $i$-ый шаг не малый, то $(i+1)$-ый шаг либо малый, либо звёздный, либо оба
* за удвоением всегда следует звёздный шаг
* если $(i+1)$-ый шаг не звёздный и не малый, то $i$-ый шаг должен быть малым

#### Теорема:

Если аддитивная цепочка содержит $d$ и $f = r - d$ неудвоений, то $n \le 2^{d-1} F_{f+3}$, где $F_j$ - число Фиббоначи

#### Следствие:

Если аддитивная цепочка содержит $f$ удвоений и $S$ малых шагов, то

${S \le f \le} {S \over {1 - lb(\varphi)}}$, где $\varphi = {{\sqrt{5} + 1} \over 2} $ - золотое сечение

#### Алгоритм Яо
Метод нахождения аддитивной цепочки для натурального числа $n$.
    Алгоритм:
    Задаём некоторое целое $k >= 2$ и число $n$ раскладывается в $2^k$-й системе счисления:
    \\[ n = \sum\limits_{i=0}^j a_i*2^{i*k} \; a_j \neq 0 \\]
    Введём функцию d: 
    \\[d(z) = \sum_{i:a_i = z} 2^{i*k}\\]  
     1) Базовая последовательность:
    \\[1,2,4,8,...,2^{\lambda(n)}, \; где \; \lambda(n) - уменьшенная \; на \; единицу \; длина \; бинарной \; записи \; числа \; n \\]  
    2) Вычисление $d(z)$ для всех $z \in \{1,2,3,...,2^k-1\}, \; d(z) \neq 0$  
    3) Вычисление $z*d(z)$ для всех $z$  
    4) В конечном итоге, $n$ представляет собой разложение вида:
    \\[ n = \sum\limits_{z = 1}^{2^{k-1}} z*d(z) \\]  
    **Звёздной цепочкой** называется аддитивная цепочка включающая в себя только звёздные шаги.  
    Пара $(j,k), 0 \leq k \leq j < i \;$ называется  **шагом**  $i $. Тогда при $j = i-1$ пара называется **звёздным шагом**.
    
#### Алгоритм Брауэра:

Для $n \in ℕ$ при заданном $k \in ℕ$ можно построить цепочку Брауэра с помощью рекуррентной формулы:

$$ B_k (n) =
\begin{cases}
1, 2, 3, ..., 2^k - 1, \quad n < 2^k \\
B_k (q), 2q, 4q, ..., 2^k q, n, \quad n \ge 2^k
\end{cases} \\
q = \lfloor {n \over 2^k} \rfloor
$$

Данная цепочка имеет длину
$$l_B (n) = j(k + 1) + 2^k - 2,$$
при условии что $jk \le \lambda (n) \le (j+1)k$

Длина будет минимализирована для больших $n$, если положить $k = \lambda \lambda (n) - 2 \lambda \lambda \lambda (n)$

**Ход алгоритма:**

* Задаётся некий параметр $k$ для $n$.
Выполняется вычисление вспомогательных чисел:
$$
d = 2^k, \hspace{0.2cm} q_1 = [ {n \over d} ], \hspace{0.2cm} r_1 = n \hspace{0.2cm} mod \hspace{0.2cm} d => n = q_1 d + r_1 \quad (0 \le r_1 < d) \\
q_2 = [ {q_1 \over d} ], \hspace{0.2cm} r_2 = q_1 \hspace{0.2cm} mod \hspace{0.2cm} d => q_1 = q_2 d + r_2 \quad (0 \le r_2 < d)
$$
* Данная процедура продолжается, пока не появится $q_s < d,$ следовательно $q_{s-1} = q_s d + r_s$
* Таким образом, n имеет вид
$$ n = 2^k q_1 + r_1 = 2^k (2^k q_2 + r_2) + r_1 = ...\\
... = 2^k (2^k (... (2^k q_s + r_s ) ... ) + r_2 ) + r_1 . $$

$$B_n (n): 1, 2, 3, ..., 2^k - 1, \\
2q_s, 4q_s, 8q_s, ..., 2^k q_s, 2^k q_s + r_s, \\
2q_{s-1}, 4q_{s-1}, 8q_{s-1}, ..., 2^k q_{s-1}, 2^k q_{s-1} + r_{s-1}, \\
..., \\
..., 2^k q_1, 2^k q_1 + r_1 = n.$$


#### Вектор индексов
Пусть задана звездная цепочка длины $m-1$ вида $1 = a_{1}, a_{2}, ..., a_{m} = n$. Для каждой звездной цепочки существует вектор индексов $r = (r_{1}, r_{2}, ..., r_{m})$ длины $m-1$, такой что:
\\[r_{i} = z: 1 \leq z \leq i, \,\,\, a_{i} = a_{i-1} + a_{r-1}, \,\, 2 \leq i \leq m-1 \\]
1. Первый элемент всегда равен 1, второй либо 1, либо 2, третий либо 1, либо 2, либо 3 и тд.
2. Наибольшая звездная цепочка: $a = 1, 2, 4, ..., 2^{m-1}$ при $r = (1, 2, 3, ..., m-1)$
3. Наименьшая звездная цепочка $a = 1, 2, 3,..., m-1$ при $r = (1, 1, 1, ..., 1)$

#### Алгоритм дробления вектора индексов
1. Внешний цикл по длинам цепочек $\underline{l(n)} \leq m \leq \overline{l(n)}$. Выбираем $q \in N$.
2. Внутренний цикл перебора всех $(r_{1}, r_{2}, ..., r_{q})$ (q! шагов). На каждом шаге:
  1. Если $a_{m} = n$ - решено.
  2. Если $n \notin [a_{min}, a_{max}]$, то переходим к следующему набору $(r_{1}, r_{2}, ..., r_{q-1})\cup (p_{q})$
  3. Если $n \in [a_{min}, a_{max}]$, то организуем внутренний цикл перебора меняющейся части $(p_{q+1}, p_{q+2}, ..., p_{m})$ ($\frac {m!}{q!}$ шагов)
    1. Если $a_{m} = n$ - решено.
    2. Если решение не нашлось и вектор имеет вид $(...) \cup (1, 1, ..., 1)$, то переходим к следующей фиксированной части.
3. Если наборы фиксированной длины исчерпаны, то увеличиваем иx длину во внешнем цикле.







## Постановка задачи

Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной математики SageMath, провести анализ алгоритмов. Полученные результаты
содержательно проинтерпретировать.


## Выполнение работы

**1) Вручную (т.е. не реализовывая алгоритм на Sage) построить последовательность вычислений бинарным методом и методом множителей для $𝑥^𝑛$ для 2-3 значений 𝑛 (значение 𝑛 > 30 выбираются студентом самостоятельно). Сравнить количество операций для каждого метода, сделать выводы.**


a) $n=33$

* Бинарный метод: 
$n = 33 = 32 + 1 = 100001_2$
<pre>
| (x^1)^2 * x^0 = x^2   | ---> 1 операция |
| (x^2)^2 * x^0 = x^4   | ---> 1 операция |
| (x^4)^2 * x^0 = x^8   | ---> 1 операция |
| (x^8)^2 * x^0 = x^16  | ---> 1 операция |
| (x^16)^2 * x^1 = x^33 | ---> 2 операции |
|-----------------------------------------|
|Всего: 6 операций|
</pre>


* Метод множителей: 
$n = 33 = 3*11$
следовательно, x^33 = (x^3)^11

<pre>
| x, x^2, x^3(=y)                | ---> 2 операции |
| y, y^2, y^4, y^5, y^10, y^11   | ---> 5 операций |
|--------------------------------------------------|
|Всего: 2+5=7 операций|
</pre>

Получили, что бинарный метод возводит в степень за меньшее число операций, чем метод множителей.

<br>
<br>
<br>


б) $n=64$

* Бинарный метод: 
$n = 64 = 1000000_2$
<pre>
| (x^1)^2 * x^0 = x^2   | ---> 1 операция |
| (x^2)^2 * x^0 = x^4   | ---> 1 операция |
| (x^4)^2 * x^0 = x^8   | ---> 1 операция |
| (x^8)^2 * x^0 = x^16  | ---> 1 операция |
| (x^16)^2 * x^0 = x^32 | ---> 1 операция |
| (x^32)^2 * x^0 = x^64 | ---> 1 операция |
|-----------------------------------------|
|Всего: 6 операций|
</pre>


* Метод множителей: 
$n = 64 = 2*32$
следовательно, x^64 = (x^2)^32

<pre>
| x, x^2(=y)                     | ---> 1 операция |
| y, y^2, y^4, y^8, y^16, y^32   | ---> 5 операций |
|--------------------------------------------------|
|Всего: 1+5=6 операций|
</pre>

Получили, что оба метода возводят в степень за одинаковое число операций.

<br>
<br>
<br>
<br>
в) $n=63$

* Бинарный метод: 
$n = 63 = 111111_2$
<pre>
| (x^1)^2 * x^1 = x^3   | ---> 2 операции |
| (x^3)^2 * x^1 = x^7   | ---> 2 операции |
| (x^7)^2 * x^1 = x^15  | ---> 2 операции |
| (x^15)^2 * x^1 = x^31 | ---> 2 операции |
| (x^31)^2 * x^1 = x^63 | ---> 2 операции |
|-----------------------------------------|
|Всего: 10 операций|
</pre>


* Метод множителей: 
$n = 63 = 3*21$
следовательно, x^63 = (x^3)^21

<pre>
| x, x^2, x^3(=y)                      | ---> 2 операции |
| y, y^2, y^4, y^5, y^10, y^20, y^21   | ---> 6 операций |
|--------------------------------------------------------|
|Всего: 2+6=8 операций|
</pre>

Получили, что метод множителей возводит в степень за меньшее число операций, чем бинарный метод, так как 63 в своей двоичной записи имеет максимальное число единиц.

<br>


Анализ:
Получается, что для чисел с небольшим количеством единиц в двоичной записи бинарный метод работает эффективнее, чем метод множителей. Однако в среднем метод множителей показываем результат лучше, чем бинарный метод. Метод множителей показывает свой наилучший результат при $n = 2^k -1 $
<br>
<br>

**2) Реализовать алгоритм Брауэра для вычисления приближённых аддитивных цепочек для различных чисел при варьировании параметра 𝑘, сопоставить длины полученных аддитивных цепочек с минимальной аддитивной цепочкой для заданного числа. Сделать выводы.**

In [25]:
# Алгоритм Брауэра
def Brauer(n,k):
    chain = [] #цепочка
    remainder = [] #остатки
    N = n
    d = 2**k # вспомогательные числа
    q = N // d
    r = N % d
    
    #раскладываем n по модулю 2^k
    remainder.append([n, 0])
    while(q >= 1):
        remainder.append([q, r])
        r = q % d
        q //= d
    remainder = remainder[::-1]
    print(remainder)
    #записываем первые элементы цепочки от 1 до qs < d
    for i in range(1, remainder[0][0]+1):
        chain.append(i)
    
    p = 1
    while(chain[-1] != n):
        #Удваиваем последний элемент цепочки, если результат не будет превосходить qn
        if(chain[-1] + chain[-1] <= remainder[p][0]):
            chain.append(chain[-1] + chain[-1])
            #либо прибавляем к последнему элементу остаток по модулю rn
        else:
            chain.append(chain[-1] + remainder[p - 1][1])
            p += 1
            
    return chain

In [58]:
#на проверку
n = 512
k = 2
check = Brauer(n, k)
print(check)
print("Длина цепочки равна: ", len(check))

[[2, 0], [8, 0], [32, 0], [128, 0], [512, 0]]
[1, 2, 4, 8, 8, 16, 32, 32, 64, 128, 128, 256, 512]
Длина цепочки равна:  13


In [40]:
n = 31415
check = []
for i in range(2, 30):
    check.append(len(Brauer(n, i)))
print("Минимальная длина: ", min(check), " | при k = ", check.index(min(check)) + 2)

[[1, 3], [7, 2], [30, 2], [122, 2], [490, 3], [1963, 1], [7853, 3], [31415, 0]]
[[7, 5], [61, 2], [490, 6], [3926, 7], [31415, 0]]
[[7, 10], [122, 11], [1963, 7], [31415, 0]]
[[30, 21], [981, 23], [31415, 0]]
[[7, 42], [490, 55], [31415, 0]]
[[1, 117], [245, 55], [31415, 0]]
[[122, 183], [31415, 0]]
[[61, 183], [31415, 0]]
[[30, 695], [31415, 0]]
[[15, 695], [31415, 0]]
[[7, 2743], [31415, 0]]
[[3, 6839], [31415, 0]]
[[1, 15031], [31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
[[31415, 0]]
Минимальная длина:  16  | при k =  14


In [None]:
n = 16186
kk = math.log2(math.log2(n)) - math.log2(math.log2(math.log2(n))) #оптимальное значение k в теории
check = []
for i in range(2, 10):
    check.append(len(Brauer(n, i)))
print("Минимальная длина: ", min(check), " | при k = ", check.index(min(check)) + 2)
print("оптимальное значение k в теории = ", kk)


In [None]:
for k in range(2, 14):
    lst = []
    for i in range(5000, 50000):
        lst.append(len(Brauer(i, k)))
    print("k = ", k, " | Минимальная длина: ", min(lst), " | Среднее значение =", sum(lst)/len(lst))

Анализ:
Cлишком большое $k$ ведёт к деградированию цепочек, построенных алгоритмом Брауэра, до рядов натуральных чисел. Это можно проследить в первую очередь на меньших числах. Очевидно, полное совпадение цепочки метода Брауэра с рядом натуральных чисел происходит при таком $k$, что $2^k \ge n$. 
<br>

В результате исследований замечено, что длина цепочки сильно зависит от выбранного $k$. Можно сделать вывод, что с увеличением параметра $k$ длина аддитивной цепочки увеличается.Чтобы алгоритм Брауэра строил аддитивные цепочки адекватной длины, $k$ должно быть куда меньше $n$ и для достаточно больших $n$ вычисляться по формуле $ k = \lambda \lambda (n) - 2 \lambda \lambda \lambda (n) $, а для небольших $n$ быть положено равным $1$ или $2$ (разница должна быть не очень заметной).
<br>


**3) Реализовать алгоритм дробления вектора индексов для нахождения минимальной звёздной цепочки для заданного числа. Протестировать алгоритм минимум для 5 значений 𝑛 > 1000. Указать, сколько времени потребовалось на поиск цепочки и какая цепочка получилась. Сравнить с предыдущими методами, сделать выводы.**


In [41]:
import time
def lambd(n):
    c = 0
    while n != 0:
        c += 1
        n //= 2
    return c - 1

def nu(n):
    c = 0
    while n != 0:
        if n % 2 == 1:
            c += 1
        n //= 2
    return c

def makeChain(vec):
    chain = [1]
    for i in vec:
        chain.append(chain[-1] + chain[i - 1])
    return chain

def makeVector(length):
    return [i for i in range(1, length + 1)]

def reduceVector(vector, q):
    i = 1
    l = len(vector)
    while vector[-i] == 1:
        if i != l:
            vector[-i] = l - i + 1 + q
            i += 1
        else:
            break
    if i != l or vector[-i] != 1:
        vector[-i] -= 1

def algorithm(n):
    m_min = lambd(n)
    m_max = lambd(n) + nu(n) - 1
    for m in range(m_min, m_max+1):
        vec = makeVector(m)
        q = m//2
        fix, chang = vec[:q], vec[q:]
        chain = makeChain(vec)
        a_min = chain[q] + m - q
        a_max = chain[q] * 2 ** (m - q)
        count = factorial(q)
        while count > 0:
            if n < a_min or n > a_max:
                if q > 1:
                    q -= 1
                    count = factorial(q)
                    fix = vec[:q]
                    chang = vec[q:]
                    chain = makeChain(fix + chang)
                    a_min = chain[q] + m - q
                    a_max = chain[q] * 2 ** (m - q)
                else:
                    count = 0
                continue
            else:
                count2 = factorial(m) / factorial(q)
                chain2 = makeChain(fix + chang)
                while count2 > 0:
                    if chain2[-1] == n:
                        return fix + chang
                    if chain2[-1] < n:
                        count2 -= (chang[-1])
                        chang[-1] = 1
                        if chang.count(1) != len(chang):
                            reduceVector(chang, q)
                    else:
                        reduceVector(chang, q)
                        count2 -= 1
                    chain2 = makeChain(fix+chang)
            reduceVector(fix, 0)
            chang = vec[q:]
            count -= 1

def fullAlgorithm(n):
    start_time = time.time()
    vec = algorithm(n)
    ch = makeChain(vec)
    print("n =", n)
    print("Вектор: ", vec, " | Длина = ", len(vec) - 1)
    print("Цепочка: ", ch, " | Длина = ", len(ch) - 1)
    print("    %s секунд " % (time.time() - start_time))

In [50]:
fullAlgorithm(1000)

n = 1000
Вектор:  [1, 2, 3, 4, 5, 6, 7, 7, 4, 10, 11, 10]  | Длина =  11
Цепочка:  [1, 2, 4, 8, 16, 32, 64, 128, 192, 200, 400, 800, 1000]  | Длина =  12
    30.87403106689453 секунд 


In [51]:
fullAlgorithm(415)

n = 415
Вектор:  [1, 2, 3, 4, 1, 5, 7, 6, 9, 10, 9]  | Длина =  10
Цепочка:  [1, 2, 4, 8, 16, 17, 33, 66, 83, 166, 332, 415]  | Длина =  11
    4.504396200180054 секунд 


In [52]:
fullAlgorithm(669)

n = 669
Вектор:  [1, 2, 3, 4, 5, 6, 7, 1, 4, 9, 11, 10]  | Длина =  11
Цепочка:  [1, 2, 4, 8, 16, 32, 64, 128, 129, 137, 266, 532, 669]  | Длина =  12
    33.80532908439636 секунд 


In [53]:
fullAlgorithm(898)

n = 898
Вектор:  [1, 2, 3, 4, 5, 6, 7, 8, 9, 9, 8, 2]  | Длина =  11
Цепочка:  [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 768, 896, 898]  | Длина =  12
    31.228928565979004 секунд 


In [54]:
fullAlgorithm(1001)

n = 1001
Вектор:  [1, 2, 3, 4, 5, 6, 7, 7, 4, 10, 11, 10, 1]  | Длина =  12
Цепочка:  [1, 2, 4, 8, 16, 32, 64, 128, 192, 200, 400, 800, 1000, 1001]  | Длина =  13
    355.57763624191284 секунд 


Исходя из результатов работы программы можно сделать вывод о том, что для чисел $n$ кратных степеням двойки алгоритм находит цепочку достаточно быстро, в то время как поиск звёздных цепочек для остальных чисел занимае приличное время. Это связано с тем, что алгоритм основан на переборе всех возможных вариантов вектора, по которому строится цепочка.

**4) Проверить гипотезу Шольца–Брауэра для всех натуральных 1<= 𝑛 <=10 на алгоритме дробления вектора индексов. Сделать выводы.**

|  n | \\[2^n - 1\\] | \\[l^*(2^n - 1)\\] | \\[l^*(n) + n - 1\\] |
|:--:|:-------------:|:------------------:|:--------------------:|
|  1 |       1       |          0         |           0          |
|  2 |       3       |          2         |           2          |
|  3 |       7       |          4         |           4          |
|  4 |       15      |          5         |           5          |
|  5 |       31      |          7         |           7          |
|  6 |       63      |          8         |           8          |
|  7 |      127      |         10         |          10          |
|  8 |      255      |         10         |          10          |
|  9 |      511      |         12         |          12          |
| 10 |      1023     |         13         |          13          |
| 11 |      2047     |         15         |          15          |
| 12 |      4095     |         15         |          15          |


Из результатов таблицы видно, что гипотеза Шольца-Брауэра верна для всех $n \in [1,12]$


## Выводы

В ходе выполнения данной практической работы были сформированы представления об аддитивных цепочках, были выработаны умения реализовывать и применять алгоритмы для нахождения минимальных аддитивных цепочек, был сформирован навык использования системы компьютерной математики SageMath для реализации таких алгоритмов.

На практике были проанализированы алгоритм Брауэра, бинарный метод и метод множителей.