## Практическая работа №1: Исследование алгоритмов формирования аддитивных цепочек
Выполнил студент гр. 0304 Голиков Анатолий, вариант 30.
## Цель работы
Формирование представления о аддитивных цепочках, выработать умение составлять и применять алгоритмы для нахождения минимальных аддитивных цепочек для заданного числа, привить навык использования систем компьютерной алгебры для реализации алгоритмов.
## Основные теоретические положения
### Аддитивные цепочки
Аддитивная цепочка для некоторого числа $n\in \mathbb{N}$ - это последовательность натуральных чисел $$ 1 = a_0, a_1, ..., a_r = n, $$ начинающаяся с единицы, в которой каждый последующий элемент является суммой каких-то двух предшествующих элементов. Данная последовательность удовлетворяет следующим свойствам:
1. $a_0 = 1$;
2. $\forall i > 0: a_i = a_j + a_k$, где $j, k < i$.

#### Типы шагов в аддитивной цепочке:
* удвоение: $ j = k = i - 1 $
* звёздный шаг: $ j = i - 1 $ (линейный шаг)
* малый шаг: $ \lambda (a_i) = \lambda (a_i - 1) $, где $ \lambda (n) = \lfloor lb(n) \rfloor$

#### Свойства шагов:

* шаг 1 - всегда удвоение
* удвоение - звёздный шаг, но никогда не малый
* если $i$-ый шаг не малый, то $(i+1)$-ый шаг либо малый, либо звёздный, либо оба
* за удвоением всегда следует звёздный шаг
* если $(i+1)$-ый шаг не звёздный и не малый, то $i$-ый шаг должен быть малым

$l(n) = r$ - наименьшая длина аддитивной цепочки для $ n \in ℕ $.

* Для метода наименьших множителей: $ \quad l(mn) \le l(m) + l(n) $

* Для m-арного метода: $ \quad l(n) \le m - 2 + (k + 1)t \quad (m = 2^k, n = \sum_{j = 0}^t d_j m^{t-j}) $

* Для SX-метода: $ \quad l(n) \le \lambda (n) + \nu (n) - 1 $

#### Свойства аддитивных цепочек
* Полагается строгое возрастание элементов цепочки:
$ 1 = a_0 < a_1 < a_2 < ... < a_n = n $
* Одинаковые числа в цепочке можно опустить
* Пара $ (j, k), 0 \le k \le j < i $ называется шагом $i$
* Если $\exists$ более чем 1 пара $ (j, k) $, полагаем $ max \hspace{0.2cm} j $

#### Теорема:

Если аддитивная цепочка содержит $d$ и $f = r - d$ неудвоений, то $n \le 2^{d-1} F_{f+3}$, где $F_j$ - число Фиббоначи

#### Следствие:

Если аддитивная цепочка содержит $f$ удвоений и $S$ малых шагов, то

${S \le f \le} {S \over {1 - lb(\varphi)}}$, где $\varphi = {{\sqrt{5} + 1} \over 2} $ - золотое сечение

#### Следствие 2
Наилучшая верхняя оценка для длины аддитивной цепочки: $\lambda(n)(1+\frac{1}{\lambda(\lambda(n))}+\frac{o(\lambda(\lambda(\lambda(n))))}{\lambda(\lambda(n))^2})$
### Алгоритм Брауэра
Для натурального числа n при заданном натуральном числе k можно построить цепочку Брауэра с помощью рекуррентной формулы:

$$ B_k (n) =
\begin{cases}
1, 2, 3, ..., 2^k - 1, \quad n < 2^k \\
B_k (q), 2q, 4q, ..., 2^k q, n, \quad n \ge 2^k
\end{cases} \\
q = \lfloor {n \over 2^k} \rfloor
$$

Данная цепочка будет иметь длину
$$l_B (n) = j(k + 1) + 2^k - 2,$$
при условии что $jk \le \lambda (n) \le (j+1)k$

Длина будет минимализирована для больших $n$, если положить $k = \lambda \lambda (n) - \lambda \lambda \lambda \lambda (n)$

#### Ход алгоритма

##### Задаётся некий параметр $k$ для $n$.
Выполняется вычисление вспомогательных чисел:
$$
d = 2^k, \hspace{0.2cm} q_1 = [ {n \over d} ], \hspace{0.2cm} r_1 = n \hspace{0.2cm} mod \hspace{0.2cm} d => n = q_1 d + r_1 \quad (0 \le r_1 < d) \\
q_2 = [ {q_1 \over d} ], \hspace{0.2cm} r_2 = q_1 \hspace{0.2cm} mod \hspace{0.2cm} d => q_1 = q_2 d + r_2 \quad (0 \le r_2 < d)
$$
##### Данная процедура продолжается, пока не появится $q_s < d,$ следовательно $q_{s-1} = q_s d + r_s$
##### Таким образом, n имеет вид
$$ n = 2^k q_1 + r_1 = 2^k (2^k q_2 + r_2) + r_1 = ...\\
... = 2^k (2^k (... (2^k q_s + r_s ) ... ) + r_2 ) + r_1 . $$

$$B_n (n) = 1, 2, 3, ..., 2^k - 1, \\
2q_s, 4q_s, 8q_s, ..., 2^k q_s, 2^k q_s + r_s, \\
2q_{s-1}, 4q_{s-1}, 8q_{s-1}, ..., 2^k q_{s-1}, 2^k q_{s-1} + r_{s-1}, \\
..., \\
..., 2^k q_1, 2^k q_1 + r_1 = n.$$

### Алгоритм Яо
* Обладает такой же вычислительной мощностью, что и алгоритм Брауэра
* Начало похоже: $k \ge 2$, $n$ раскладывается в $2^k$-ой системе счисления:
$$ n = \sum_{i = 0}^j a_i 2^{ik} , a_j \ne 0 $$
* Вводится функция d:
$$ d(z) = \sum_{i: a_i = z} 2^{ik} $$
##### Алгоритм
* Базовая последовательность: $1, 2, 4, ..., 2^{\lambda(n)}$
* Вычисление значений $d(z)$ для всех $z \in \{ 1, 2, ..., 2^k - 1\}, \quad d(z) \ne 0$
* Вычисление $zd(z)$ для всех $z$
* В конечном итоге, n представляет собой разложение вида:
$$ n = \sum_{z = 1}^{2^k - 1} zd(z) $$

### Алгоритм дробления вектора индексов
Алгоритм дробления вектора индексов позволяет найти минимальную звездную цепочку для некоторого числа $n \in \mathbb{N}$. 

Рассмотрим вектор индексов $\{r_i\}_{i=1}^q \cup {\{{\rho}_j \}}_{j=q+1}^m$, где ${\rho}_j= \{x: 1 \leq x \leq j \}$, ${\{r_i\}}_{i=1}^q$ - фиксированная часть, ${\{{\rho}_j\}}_{j=q+1}^m$ - изменяющаяся часть.

Наибольшее значение $a_m$ достигается при векторе индексов ${\{r_i\}}_{i=1}^{q} \cup \{q+1,q+2,\dots,m\}$.

Наименьшее значение $a_m$ достигается при векторе индексов ${\{r_i\}}_{i=1}^{q}\cup\{1,1,\dots,1\}$.

$a_{max} = a_{q+1} \cdot {2}^{m-q}$

$a_{min} = a_{q+1}+m-q$

##### Алгоритм:
1. Во внешнем цикле рассматриваем аддитивные цепочки длины $m$ от значения ${l}(n)=\lceil log_2(n) \rceil$ до $\overline{l}(n)=\lambda(n)+\nu(n)-1$, на каждой итерации выбираем $q \in N$ 
2. Далее перебираем все возможные фиксированные части вектора индексов $\{r_i\}_{i=1}^q$ ($q!$ вариантов), для каждой строим соответствующую ей звездную цепочку, находим $a_{max}$ и ${a}_{min}$, после чего:
 1. Если $n \notin [a_{min},a_{max}]$, то переходим к следующему набору $\{r_i\}_{i=1}^q$;
 2. Если $n\in [a_{min},a_{max}]$, то организуем внутренний цикл перебора меняющейся части вектора индексов ${\{{\rho}_j\}}_{j=q+1}^m$ и находим $a_m$:
  1. Если $a_m=n$, то цепочка найдена;
  2. Если все возможные изменяющиеся части вектора индексов ${\{{\rho}_j\}}_{j=q+1}^m$ исчерпаны, то переходим к следующему набору $\{r_i\}_{i=1}^q$;
3. Если все наборы вектора индексов длины $m$ исчерпаны, то увеличиваем $m$ на 1.

## Постановка задачи
Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной алгебры SageMath, провести анализ алгоритмов. Полученные результаты содержательно проинтерпретировать.

## Выполнение работы
### Шаг 1
Вручную (т.е. не реализовывая алгоритм на Sage) построить последовательность вычислений бинарным методом и методом множителей для $x^n$ для 2-3 значений $n$ ($n \ge 30$). Сравнить количество операций для каждого метода, сделать выводы.

**n = 31:**<br>
Бинарный метод:<br>

N | Y | Z
--- | --- | ---
31 | 1 | x
15 | x | x^2
7 | x^3 | x^4
3 | x^7 | x^8
1 | x^15 | x^16
0 | x^31 | x^32

Количество операций: 10

Метод множителей:
$$ 
31 = 30 + 1 = (3 * 10) + 1\\
x, x*x=x^2, x^2*x=x^3=y\\
y, y*y=y^2, y^2*y^2=y^4, y^4*y=y^5, y^5*y^5=y^{10}\\
y^{10}=(x^3)^{10}=x^{30}, x^{30}*x=x^{31}
$$

Количество операций: 7
   
**n = 121:**<br>

N | Y | Z
--- | --- | ---
121 | 1 | x
60 | x | x^2
30 | x | x^4
15 | x | x^8
7 | x^9 | x^16
3 | x^25 | x^32
1 | x^57 | x^64
0 | x^121 | x^128

Количество операций: 10

Метод множителей: $$ 
121 = 11 * 11\\
x, x*x=x^2, x^2*x^2=x^4, x^4*x=x^5, x^5*x^5=x^{10}, x^{10}*x=x^{11}=y\\
y, y*y=y^2, y^2*y^2=y^4, y^4*y=y^5, y^5*y^5=y^{10}, y^{10}*y=y^{11}\\
y^{11}=(x^{11})^{11}=x^{121}
$$
Количество операций: 10

n | бинарный  | м. множителей
--- | --- | ---
31 | 10 | 7
121 | 10 | 10

В общем случае бинарный метод уступает методу множителей по операциям Это заметно для степеней равных $2^k-1$, где $k \in N$, но для степеней $2^k+1$, где $k \in N$, бинарный метод дает результат лучше, чем метод множителей. Эта закономерность вытекает из опредления методов, так как для получения степени $2^k+1$ надо $k$ раз возвести число в квадрат и потом домножить на исходное, например, для n=65 метод множителей затрачивает 8 операция, при том, что бинарный метод - 7 операций.

### Шаг 2. Реализуем алгоритм Яо

In [None]:
basic_sq = [1]

def get_lambda(n):
    n = Integer(n)
    return n.nbits() - 1

def primfacs(n):
    i = 2
    primfac = []
    while i * i <= n:
        while n % i == 0:
            primfac.append(i)
            n = n / i
        i = i + 1
    if n > 1:
        primfac.append(n)
    return primfac

def d(z, n, k):
    sum = 0
    for i in range(0, len(n)):
        if n[i] == z:
            sum+=2**(i*k)
    return sum

def multiply_dz(z, d):
    seq = []
    seq.append(d)
    while seq[len(seq)-1] != z*d:
        check = false
        i = 1
        while(check != true):
            if seq[len(seq)-i] + seq[len(seq)-1] <= z*d:
                seq.append(seq[len(seq)-i] + seq[len(seq)-1])
                check = true
            else:
                i = i + 1
    return seq
        
    
def main(n,k):
    global basic_sq

    n_ = n
    lmd = get_lambda(n)
    num_to_add = 2
    for i in range(1, lmd+1):
        basic_sq.append(2**i)
    #print(basic_sq)
    n = n.digits(2**k)
    #print(n)
    n_no_dublicates = []
    for i in n:
        if i not in n_no_dublicates:
            n_no_dublicates.append(i)
    #print(n_no_dublicates)
    Z = []
    for i in range(1, 2**k):
        Z.append(i)
    
    Z = ([v for v in n_no_dublicates if v in set(n_no_dublicates) & set(Z)])
    #print(Z)
    
    for i in range(0, len(Z)):  #вычисление zd(z)
        #print(Z[i])
        Z[i] = multiply_dz(Z[i], d(Z[i],n,k))
       
    Z.append([n_])
    #print(basic_sq)
    merged_list = []
    for i in range(0, len(Z)):
        basic_sq+=Z[i]
    
    basic_sq = list(set(basic_sq))
    basic_sq.sort()
    '''
    print("Z")
    print(Z)
    print(merged_list)
    print(basic_sq)
    print(lmd)
    '''
    return basic_sq, len(basic_sq)



In [None]:
test_n = [136, 512, 1007, 1294, 3096, 27812, 40000]
test_k = [2,3,5,8,10]
min_chains = [9,10,14,14,14,19, 19]
i=0
for n in test_n:
    for k in test_k:
        (m, l) = main(n,k)
        pretty_print(f"Chain for {n}, length: {l}, k: {k}, min length:{min_chains[i]}:")
        print(basic_sq)
        basic_sq = [1]
        print("\n")
    i+=1

Сравнивая длины цепочек, полученные алгоритмом Яо, с длининами минимальных цепочек можно заметить, что алгоритм Яо выдает минимальные цепочки для заданных  при определенном k. Для некоторых n алгоритм не дает минимальную цепочку, например, при n=27812 и k=2,3,5,8,10 невозможно получить минимальную цепочку. Зависимости между  и длиной аддитивной цепочки не наблюдается. Однако начиная с некоторго k увеличение $k$ только увеличивает длину аддитивной цепочки, что логично, так как при увеличении $k$ количество $a_i$ в $n=\displaystyle\sum_{i=0} a_i \cdot 2^{ik}$ будет уменьшатся, а сами $a_i$ будут увеличиваться, что приведёт к неэффективности данного алгоритма.

### Шаг 3. Реализуем алгоритм дробления векторов индексов

In [None]:
import time
import math

def min_len(n):
    return math.ceil(log(n, 2))


def max_len(n):
    lambda_n = int(log(n, 2)) + 1
    nu_n = bin(n)[3:].count('1')
    return lambda_n + nu_n - 1


def create_chain(index_vec):
    chain = [1]
    for i in index_vec:
        chain.append(chain[-1] + chain[i - 1])
    return chain


def next_vec(vec_set, q=0):
    if (vec_set == [1 for i in range(len(vec_set))]):
        return [0 for i in range(len(vec_set))]

    for i in range(len(vec_set) - 1, -1, -1):
        if (vec_set[i] == 1):
            vec_set[i] = i + 1 + q
            continue
        vec_set[i] -= 1
        break
    return vec_set


def solve(n):
    res = []
    if(n == 1):
        return [1]
    for m in range(min_len(n), max_len(n) + 1):
        q = m // 2
        if (q == 0):
            q = 1
        r_set = [i for i in range(1, q + 1)]
        rho_set = [q + i + 1 for i in range(m - q)]
        while (r_set != [0 for i in range(q)]):
            chain = create_chain(r_set + rho_set)
            #print(chain)
            a_min = chain[q] + (m - q)
            a_max = chain[q] * 2 ** (m - q)
            if (n < a_min or n > a_max):
                r_set = next_vec(r_set)
                continue
            if(chain[-1] == n):
                return chain
            while (rho_set != [0 for i in range(m - q)]):
                chain = create_chain(r_set + rho_set)
                if (n == chain[-1]):
                    return chain
                rho_set = next_vec(rho_set, q)
            r_set = next_vec(r_set)
            rho_set = [q + i + 1 for i in range(m - q)]
    return res

def main(n):
    print(f"Chain for {n}")
    start = time.time()
    chain = solve(n)
    end = time.time()
    print(chain)
    print(f"Length = {len(chain)}, time: {end-start}")
    
    
#main(310)

        

Проведем тесты алгоритма для n>1000:

In [None]:
test_n = [1001, 1021, 1037, 1070, 1345]
for n in test_n:
    main(n)

n | time | length |chain
--- | --- | --- | ---
1001 | 2509.17 | 14 | 1,2,4,8,16,32,64,128,192,200,400,800,1000,1001
1021 | 2559.95 | 14 | 1,2,4,8,16,32,64,68,136,272,340,680,1020,1021
1037 | 2177.04 | 14 | 1,2,4,8,16,32,64,128,256,512,1024,1032,1036,1037
1070 | 2191.85 | 14 | 1,2,4,8,16,32,64,128,136,264,266,402,804,1070
1345 | 1106.11 | 14 | 1,2,4,8,16,32,64,128,256,512,1024,1280,1344,1345


### Шаг 4. Проверим гипотезу Штольца-Брауэра для n принадлежащего [1, 12]

Гипотеза Штольца - Брауэра заключается в следующем:
$$ l^*(2^n - 1) \le l^*(n) + n - 1 $$

In [None]:
#Гипотеза Штольца - Брауэра:
for i in range(1, 13):
    print("n = {}, {} <= {}".format(i, len(solve(2 ** i -  1)), len(solve(i))+i-1))


n | $$ l^*(2^n - 1) \le l^*(n) + n - 1 $$
--- | --- 
1 | +
2 | +
3 | +
4 | +
5 | +
6 | +
7 | +
8 | +
9 | +
10 | +
11 | +
12 | +


Таким образом, было подтверждено, что гипотеза Шольца-Брауэра для звёздных цепочек верна для $n \in [1,12]$

### Выводы

В рамках выполнения данной практической работы было сформировано представление об аддитивных цепочках. 
Реализованы и применены алгоритмы составления аддитивных цепочек, такие как: бинарный метод, метод множителей, алгоритм Яо, алгоритм дробления вектора индексов. Так же была проверена гипотеза Штольца-Брауэра, гласящая, что $ l^*(2^n - 1) \le l^*(n) + n - 1 $
