# Практическая работа №1: Исследование алгоритмов формирования аддитивных цепочек

Выполнил студент гр.0303 Смирнов Артем, вариант 21.

## Цель работы

Формирование представления о аддитивных цепочках, выработать умение составлять и применять алгоритмы для нахождения минимальных
аддитивных цепочек для заданного числа, привить навык использования
систем компьютерной математики для реализации алгоритмов.

## Основные теоретические положения
Данная работа посвящена задаче вычисления степени числа за минимальное кол-во операций. Для ее решения существуют определенные алгоритмы.  
__Бинарный алгоритм SX__  
Задача: нахождение $x^{n}$. Последовательность действий алгоритма:  
1. Запись n в бинарном виде
\\[n = (a_{m}, a_{m-1}, ..., a_{2}, a_{1})_{2}, \, a_{m} = 1\\]
2. Отбрасывание старшего бита.
\\[(a_{m-1}, a_{m-2}, ..., a_{2}, a_{1})_{2},\\]
3. Замена
\\[a_{i} = 1 \Rightarrow a_{i} = \,'SX', \, a_{i} = 0 \Rightarrow a_{i} = \, 'S'\\]
\\[1\leq i\leq m-1\\]
4. Процесс вычисления,где 'S' - возведение в квадрат (умножение на себя), 'X' - умножение на x.
Число операций для бинарного метода:
\\[l(n) = \lambda(n) + \nu(n) - 1\\]
где $\lambda(n) = \lfloor\log_{2}(n)\rfloor$ - уменьшенная на 1 длина бинарной записи n, $\nu(n)$ - вес Хэмминга для бинарной записи $n$.  
Причем
\\[\lambda(n) = \begin{cases}\lambda(\lfloor n/2 \rfloor)+1 & n \neq 1\\0 & n = 1\end{cases}\\]
\\[\nu(n) = \begin{cases}\nu(\lfloor n/2 \rfloor)+n\bmod2 & n \neq 1\\1 & n = 1\end{cases}\\]

__Метод множителей__  
Задача та же.  
Метод основан на разложении n на множители.
1. Пусть n = pq, где p - минимальный простой делитель n, q > 1. Тогда $x^{n} = (x^{p})^{q}$   
2. Если n - простое, вычисляем $x^{n-1}$ и умножаем на x.

Оба метода не являются оптимальными и не гарантируют минимальное кол-во операций.

__Аддитивные цепочки__   
Аддитивная цепочка для $n\in N$ - последовательность натуральных чисел вида
\\[1 = a_{0}, a_{1}, ..., a_{r} = n\\]
где
\\[a_{i} = a_{j} + a_{k}, \,\,\, k \leq j < i, \,\,\, i = 1, 2, ..., r\\]
Связь с ранее изученными методами:  
Пусть $l(n) = r$ - минимальное r, для которого существует цепочка для n.
- Для метода множителей: $l(m*n) \leq l(m) + l(n)$.
- Для бинарного: $l(n) \leq \lambda(n) + \nu(n) - 1$.  

Свойства аддитивных цепочек:
1. Полагаем, что все цепочки строго возрастающие.
2. Если 2 числа в цепочке одинаковые, одно из них можно опустить.
3. Пара $(j, k),\,\, 0 \leq k \leq j< i$ называется шагом i.  
    3.1 Удвоение: $ j = k = i - 1 $  
    3.2 Звездный шаг: $ j = i - 1 $  
    3.3 Малый шаг: $ \lambda(a_i) = \lambda(a_{i-1}) $  
4. Если существует более чем 1 пара $(j , k)$, полагаем j наибольшим.

__Алгоритм Брауэра__   
Алгоритм не является оптимальным, но позволяет вычислить n-ую степень за
\\[l_{B}(n) = \lambda(n) + \frac{\lambda(n)}{\lambda\lambda(n)} + O\bigg(\frac{\lambda(n)\lambda\lambda\lambda(n)}{(\lambda\lambda(n))^{2}}\bigg)\\]
Самая короткая цепочка имеет длину $\leq \lambda(n)$ ($n = 2^{k}$)  
Доказано, что почти для всех n минимальная цепочка имеет длину $l_{B}(n)$  
Реккурентное определение:  
Для $n \in N$ при заданном $k \in N$
\\[B_{k}(n) = \begin{cases}1, 2, 3, ..., 2^{k}-1 & n < 2^{k}\\B_{k}(q), 2q, 4q, ..., 2^{k}q, n & n \geq 2^{k}, \,\, q = [n/2^{k}]\end{cases}\\]
Тогда при $jk \leq \lambda(n) < (j+1)k$:
\\[l_{B}(n) = j(k+1) + 2^k - 2\\]
Длина минимизируется для больших n, если $k = \lambda\lambda(n) - 2\lambda\lambda\lambda(n)$

__Звездные цепочки__  
Звездная - аддитивная цепочка со всеми звездными шагами.
1. Обозначим длину звездной цепочки как $l^{*}(n)$
2. Шаг $a_{i} = a_{i-1} + a_{k}, \,\, \forall k < i$
3. Очевидно, что $l(n) \leq l^{*}(n)$


__Вектор индексов__  
Пусть задана звездная цепочка длины $m-1$ вида $1 = a_{1}, a_{2}, ..., a_{m} = n$. Для каждой звездной цепочки существует вектор индексов $r = (r_{1}, r_{2}, ..., r_{m})$ длины $m-1$, такой что:
\\[r_{i} = z: 1 \leq z \leq i, \,\,\, a_{i} = a_{i-1} + a_{r-1}, \,\, 2 \leq i \leq m-1 \\]
1. Первый элемент всегда равен 1, второй либо 1, либо 2, третий либо 1, либо 2, либо 3 и тд.
2. Наибольшая звездная цепочка: $a = 1, 2, 4, ..., 2^{m-1}$ при $r = (1, 2, 3, ..., m-1)$
3. Наименьшая звездная цепочка $a = 1, 2, 3,..., m-1$ при $r = (1, 1, 1, ..., 1)$

Для перехода от r к меньшему вектору(следующему), необходимо старшую позицию, содержащаю число > 1 уменьшить на 1.

__Алгоритм дробления вектора индексов:__  
Задача стоит в нахождении минимальной звездной цепочки т.ч. $a_{m} = n$.  
Можно заметить, что при уменьшении последнего элемента вектора индексов с m-1 до 1 последний элемент цепочки монотонно убывает.
Рассмотрим вектор индексов типа $(r_{1}, r_{2},..., r_{q})\cup (p_{q+1}, p_{q+2}, ..., p_{m})$. Назовем левую часть фиксированной, правую - меняющейся. Всего таких наборов существует $\frac {m!}{q!}$  
Монотонность исчезает, однако
1. $a_{min} = a_{q+1} + m -q$ при $(r_{1}, r_{2},...,r_{q})\cup (1, 1,...,1)$
2. $a_{max} = a_{q+1}\cdot2^{m-q}$ при $(r_{1}, r_{2},...,r_{q})\cup (q+1, q+2, ..., m)$

Сам алгоритм:
1. Внешний цикл по длинам цепочек $\underline{l(n)} \leq m \leq \overline{l(n)}$. Выбираем $q \in N$.
2. Внутренний цикл перебора всех $(r_{1}, r_{2}, ..., r_{q})$ (q! шагов). На каждом шаге:
  1. Если $a_{m} = n$ - решено.
  2. Если $n \notin [a_{min}, a_{max}]$, то переходим к следующему набору $(r_{1}, r_{2}, ..., r_{q-1})\cup (p_{q})$
  3. Если $n \in [a_{min}, a_{max}]$, то организуем внутренний цикл перебора меняющейся части $(p_{q+1}, p_{q+2}, ..., p_{m})$ ($\frac {m!}{q!}$ шагов)
    1. Если $a_{m} = n$ - решено.
    2. Если решение не нашлось и вектор имеет вид $(...) \cup (1, 1, ..., 1)$, то переходим к следующей фиксированной части.
3. Если наборы фиксированной длины исчерпаны, то увеличиваем иx длину во внешнем цикле.


Предположения:
1. Для n < 12509 $l(n) = l^{*}(n)$
2. Гипотеза Шольца-Брауэра:
\\[l(2^{n}-1) \leq l(n) + n - 1\\]
Гипотеза доказана для звездных цепочек для всех n < 5784689, причем равенство достигает при $1 \leq n \leq 64$

## Постановка задачи
Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной математики SageMath, провести анализ алгоритмов. Полученные результаты содержательно проинтерпретировать.  

## Порядок выполнения работы
1. Вручную (т.е. не реализовывая алгоритм на Sage) построить последовательность вычислений бинарным методом и методом множителей для $𝑥^{𝑛}$ для 2-3 значений 𝑛 (значение 𝑛 > 30 выбираются студентом самостоятельно). Сравнить количество операций для каждого метода, сделать выводы.  
2. Реализовать алгоритм Брауэра (для нечётных вариантов) и алгоритм Яо (для чётных вариантов) для вычисления приближённых аддитивных цепочек для различных чисел при варьировании параметра 𝑘, сопоставить длины полученных аддитивных цепочек с минимальной аддитивной цепочкой для заданного числа. Сделать выводы.  
3. Реализовать алгоритм дробления вектора индексов для нахождения минимальной звёздной цепочки для заданного числа. Протестировать алгоритм минимум для 5 значений 𝑛 > 1000. Указать, сколько времени потребовалось на поиск цепочки и какая цепочка получилась. Сравнить с предыдущими методами, сделать выводы.  
4. Проверить гипотезу Шольца–Брауэра для всех натуральных 1 <= 𝑛 <= 12 на алгоритме дробления вектора индексов. Результаты оформить в виде таблицы. Сделать выводы.  
5. (*) Найти или предложить собственные модификации алгоритмов и привести описание модификаций. Реализовать модифицированные алгоритмы и сравнить их мощность.  

## Выполнение работы
#### Построим последовательность вычислений для $x^{n}$
__n = 48:__  
1. Бинарный метод
\\[48_{10} = 110000_{2}\\]
\\[110000\rightarrow10000\rightarrow SXSSSS\\]
\\[x, x^{2},x^{3},x^{6},x^{12},x^{24},x^{48}\\]
Потребовалось 6 операций.  
2. Метод множителей
\\[x^{48} = ((((x^{2})^{3})^{2})^{2})^{2}\\]
\\[x^{3} = x\cdot x^{2}\\]
\\[x^{2} = x\cdot x\\]
Потребовалось тоже 6 операций.

__n = 33:__  
1. Бинарный метод
\\[33_{10} = 100001_{2}\\]
\\[100001\rightarrow00001\rightarrow SSSSSX\\]
\\[x, x^{2},x^{4},x^{8},x^{16},x^{32},x^{33}\\]
Потребовалось 6 операций.  
2. Метод множителей
\\[x^{33} = (x^{3})^{11}\\]
\\[x^{3} = x\cdot x^{2}\\]
\\[x^{11} = x\cdot x^{10} = x\cdot(x^{2})^{5}\\]
\\[x^{5} = x\cdot (x^{2})^{2}\\]
Потребовалось 7 операций. Т.е. в этом случае бинарный метод оказался лучше.  

__n = 31:__  
1. Бинарный метод
\\[31_{10} = 11111_{2}\\]
\\[11111\rightarrow1111\rightarrow SXSXSXSX\\]
\\[x, x^{2},x^{3},x^{6},x^{7},x^{14},x^{15}, x^{30}, x^{31}\\]
Потребовалось 8 операций.
2. Метод множителей
\\[x^{33} = x\cdot x^{30} = x\cdot(x^{2})^{15}\\]
\\[x^{15} = (x^{3})^{5}\\]
\\[x^{2} = x\cdot x\\]
\\[x^{3} = x\cdot x^{2}\\]
\\[x^{5} = x\cdot(x^{2})^{2}\\]
Потребовалось 7 операций. Следовательно, в этом случае уже метод множителей оказался лучше.  

С помощью этих примеров можно убедиться в том, что ни метод множителей, ни бинарный не являются оптимальными, но позволяют достаточно быстро получить решение задачи.

__Алгоритм Брауэра__

Реализуем алгоритм Брауэра для вычисления приближённых аддитивных цепочек для различных чисел при варьировании параметра 𝑘 и сопоставим длины полученных аддитивных цепочек с минимальной аддитивной цепочкой для заданного числа.  

Для каждого n из соотношения  $jk \leq \lambda(n) < (j+1)k$ составляется список возможных значений $k$. Для каждого $k$ вычисляется теоретическая длина аддитивной цепочки по формуле $l_{B}(n) = j(k+1) + 2^k - 2$ и сама цепочка. Выводится цепочка  без повторения значений в ней, ее длина без повторений и длина с повторениями. 

In [None]:
#Переводим n в другую СС, вычисляем цепочку и выводим
def proc(n, k):
    d = 2 ** k
    cur = n
    l = []
    while cur >= d:
        q = cur // d
        r = cur % d
        l.append([q, r])
        cur = q
    b = [i for i in range(1, d)]
    q_s = l[-1][0]
    b += [(2 ** i) * q_s for i in range(1, k + 1)]
    l = list(reversed(l))[:-1]
    for i in l:
        b.append(b[-1] + i[1])
        b += [(2 ** i) * b[-1] for i in range(1, k + 1)]
    if n % d != 0: b.append(b[-1] + n % d)
    clear = list(dict.fromkeys(b))
    print("\033[31mSolution without repetition: ", clear, "\033[1mHis length = ", len(clear) -1, "\033[0m")
    print("\033[32mLength with repetition =", len(b) - n%2, "\033[0m")

#Рассматриваем цепочки для различных k
def BrowerAlgorithm(n):
    opt = []
    lambda_n = int(log(n, 2))
    for j in range(1, lambda_n+1):
        for k in range(1, lambda_n+1):
            if (j*k <= lambda_n) and ((j+1)*k > lambda_n):
                opt.append([j, k])
    for i in opt:
        print("\033[1mTheoretical length for a given k =", i[1], "is: \033[32m{}\033[0m".format(i[0]*(i[1]+1) + 2**i[1] - 2))
        proc(n, i[1])

Пример работы алгоритма:

In [20]:
BrowerAlgorithm(16)

[1mTheoretical length for a given k = 3 is: [32m10[0m
[31mSolution without repetition:  [1, 2, 3, 4, 5, 6, 7, 8, 16] [1mHis length =  8 [0m
[32mLength with repetition = 10 [0m
[1mTheoretical length for a given k = 4 is: [32m19[0m
[31mSolution without repetition:  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16] [1mHis length =  15 [0m
[32mLength with repetition = 19 [0m
[1mTheoretical length for a given k = 2 is: [32m8[0m
[31mSolution without repetition:  [1, 2, 3, 4, 8, 16] [1mHis length =  5 [0m
[32mLength with repetition = 8 [0m
[1mTheoretical length for a given k = 1 is: [32m8[0m
[31mSolution without repetition:  [1, 2, 4, 8, 16] [1mHis length =  4 [0m
[32mLength with repetition = 8 [0m


Результаты запуска алгоритма для различных значений $n$:  

| n\k |  1 |  2 |  3 |  4 |  5 |  6 |  7  | min_len |
|:---:|:--:|:--:|:--:|:--:|:--:|:--:|:---:|:-------:|
| 128 |  7 |  8 | 11 | 18 | 33 | 64 | 127 |    7    |
| 333 | 12 | 12 | 14 | 21 | 35 | 66 | 129 |    11   |
|  69 |  8 |  9 | 11 | 18 | 33 | 64 |  -  |    8    |
| 200 |  9 |  9 | 12 | 19 | 34 | 65 | 128 |    9    |
| 111 | 11 | 10 | 12 | 18 | 33 | 64 |  -  |    9    |

Видим, что оптимальное $k$ для малых $n$ колеблется в пределах от 1 до 2. Для больших значений $n$ необходимо брать значение $k = \lambda \lambda (n) - 2 \lambda \lambda \lambda (n)$.  
С увеличением $k$ длина цепочек увеличивается, а в самих цепочках все чаще начинает встречаться шаг $(i-1, 0)$. Цепочка, в которой все шаги (i-1, 0) получается при $k$, т.ч. $2^k \ge n$.

__Алгоритм дробления вектора__

Реализуем алгоритм дробления вектора индексов для нахождения минимальной звёздной цепочки для заданного числа и протестируем для 5 значений 𝑛 > 1000.

In [48]:
import time

def lam(n):
    c = 0
    while n != 0:
        c += 1
        n //= 2
    return c - 1

def nu(n):
    c = 0
    while n != 0:
        if n % 2 == 1:
            c += 1
        n //= 2
    return c

def make_chain(vec):
    chain = [1]
    for i in vec:
        chain.append(chain[-1] + chain[i - 1])
    return chain

def make_vec(length):
    return [i for i in range(1, length + 1)]

def decrease_vec(vec1, q):
    i = 1
    l = len(vec1)
    while vec1[-i] == 1:
        if i != l:
            vec1[-i] = l - i + 1 + q
            i += 1
        else:
            break
    if i != l or vec1[-i] != 1:
        vec1[-i] -= 1

def alg(n):
    m_min = int(log(n, 2))
    m = m_min
    m_max = lambd(n) + nu(n) - 1
    while m <= m_max:
        vec = make_vec(m)
        q = m//2
        fix, chang = vec[:q], vec[q:]
        chain = make_chain(vec)
        a_min = chain[q] + m - q
        a_max = chain[q] * 2 ** (m - q)
        steps_count = factorial(q)
        while steps_count > 0:
            if n < a_min or n > a_max:
                if q > 1:
                    q -= 1
                    steps_count = factorial(q)
                    fix = vec[:q]
                    chang = vec[q:]
                    chain = make_chain(fix + chang)
                    a_min = chain[q] + m - q
                    a_max = chain[q] * 2 ** (m - q)
                else:
                    steps_count = 0
                continue
            else:
                steps_count2 = factorial(m) / factorial(q)+1
                chain2 = make_chain(fix + chang)
                while steps_count2 > 0:
                    if chain2[-1] == n:
                        return fix + chang
                    if chain2[-1] < n:
                        steps_count2 -= (chang[-1])
                        chang[-1] = 1
                        if chang.count(1) != len(chang):
                            decrease_vec(chang, q)
                    else:
                        decrease_vec(chang, q)
                        steps_count2 -= 1
                    chain2 = make_chain(fix+chang)
            decrease_vec(fix, 0)
            chang = vec[q:]
            steps_count -= 1
        m += 1

def VectorAlgorithm(n):
    start_time = time.time()
    vec = alg(n)
    ch = make_chain(vec)
    print("n =", n)
    print("    Vector: ", vec, "Vector length = ", len(vec) - 1)
    print("    Chain: ", ch, "Chain length = ", len(ch) - 1)
    print("--- %s seconds ---" % (time.time() - start_time))

In [49]:
VectorAlgorithm(1024)
VectorAlgorithm(2112)
VectorAlgorithm(4096)
VectorAlgorithm(1000)
VectorAlgorithm(1008)

n = 1024
    Vector:  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] Vector length =  9
    Chain:  [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024] Chain length =  10
--- 0.04528093338012695 seconds ---
n = 2112
    Vector:  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 7] Vector length =  11
    Chain:  [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 2112] Chain length =  12
--- 1.3544185161590576 seconds ---
n = 4096
    Vector:  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12] Vector length =  11
    Chain:  [1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096] Chain length =  12
--- 0.0041599273681640625 seconds ---
n = 1000
    Vector:  [1, 2, 3, 4, 5, 6, 7, 7, 4, 10, 11, 10] Vector length =  11
    Chain:  [1, 2, 4, 8, 16, 32, 64, 128, 192, 200, 400, 800, 1000] Chain length =  12
--- 114.88414287567139 seconds ---
n = 1008
    Vector:  [1, 2, 3, 4, 5, 6, 7, 8, 7, 5, 11, 11] Vector length =  11
    Chain:  [1, 2, 4, 8, 16, 32, 64, 128, 256, 320, 336, 672, 1008] Chain length =  12
--- 105.20026326179504 secon

Видим, что скорость работы алгоритма дробления вектора зависит от того, насколько первые значения вектора индесов отличаются от максимально возможных. Чем ближе к началу вектора значение отличается от максимального, тем дольше будет работать алгоритм. На практике также оказалось, что алгоритм работает особенно долго на числах, равных $2^{t} - 1$, где $t\in N$.

Длины получаемых звездных цепочек оказались оптимальными, что подтвержает утверждение о том, что для всех $n < 12509 \,\,\, l^{*}(n) = l(n)$.
Таким образом, в сравнении с бинарным методом, методом множителей и алгоритмом Брауэра алгоритм дробления вектора индексов работает намного дольше, но дает самые оптимальные минимальные цепочки.

__Гипотеза Шольца-Брауэра__

Проверим гипотезу Шольца-Брауэра для $1 \leq n \leq 12$: 

|  n | \\[2^n - 1\\] | \\[l^*(2^n - 1)\\] | \\[l^*(n) + n - 1\\] |
|:--:|:-------------:|:------------------:|:--------------------:|
|  1 |       1       |          0         |           0          |
|  2 |       3       |          2         |           2          |
|  3 |       7       |          4         |           4          |
|  4 |       15      |          5         |           5          |
|  5 |       31      |          7         |           7          |
|  6 |       63      |          8         |           8          |
|  7 |      127      |         10         |          10          |
|  8 |      255      |         10         |          10          |
|  9 |      511      |         12         |          12          |
| 10 |      1023     |         13         |          13          |
| 11 |      2047     |         15         |          15          |
| 12 |      4095     |         15         |          15          |

Как видим, утверждение о том, что $l^{*}(2^{n} - 1) \leq l^{*}(n) + n - 1$ выполняется, причем при $n \leq 12$ достигается равенство.

## Выводы
В ходе выполнения данной практической работы были сформированы представления об аддитивных цепочках, были выработаны умения реализовывать и применять алгоритмы для нахождения минимальных аддитивных цепочек, был сформирован навык использования системы компьютерной математики SageMath для реализации таких алгоритмов.

Для возведения числа x в заданную степень n за минимальное число операций были рассмотрены простые и быстрые алгоритмы - бинарный метод, метод множителей и метод Брауэра. Ни один из них не является оптимальным, но их плюсом является время работы.

Наиболее точным является алгоритм дробления вектора индексов, основаный на использовании звездных цепочек. Минимальная звездная цепочка, построенная с помощью алгоритма почти совпадает минимальной аддитивной цепочкой для n. Единственный минус этого алгоритма - огромное время работы, получаемое из-за большого кол-ва переборов вариантов.

Также на практике была проверена и подтверждена гипотеза Шольца-Брауэра.