# Практическая работа №2: Исследование алгоритмов формирования аддитивных цепочек

Выполнил студент гр. 1304 Павлов Даниил. Вариант №45.

## Цель работы

Формирование представления о аддитивных цепочках, выработать уме- ние составлять и применять алгоритмы для нахождения минимальных аддитивных цепочек для заданного числа, привить навык использования систем компьютерной математики для реализации алгоритмов.

## Основные теоретические положения

#### Аддитивные цепочки
Аддитивная цепочка для некоторого числа $n\in \mathbb{N}$ - это последовательность натуральных чисел $\{a_i\}_{i=0}^m$, где $a_0 = 1$, $a_m = n$, в которой каждый последующий элемент является суммой каких-то двух предшествующих элементов.

$a_i = a_j + a_k, \forall i:1..m, k \leq j < i$
$l(n) = m$

Типы шагов в аддитивной цепочке:

Шаг $i$ называют удвоением, если $i - 1 = k = j$;

Шаг $i$ называют звездным, если $j = i - 1$, $k \in \{0, \dots, i-1\}$;

Шаг $i$ называют малым, если $\lambda(a_i)=\lambda(a_{i-1})$

Звездная цепочка - это аддитивная цепочка, в которая состоит только из звездных шагов.

#### Алгоритм Брауэра
Алгоритм Брауера вычисляет n-ую стпенень за $\lambda(n)+\frac{(1+o(1))\lambda(n)}{\lambda(\lambda(n))}$ операций.

Для некоторых $n, k$ Брауерские цепочки задаются в виде рекурентной формулы:
$$B_k(n) =\begin{cases}1, 2, 3, ..., 2^k-1\text{, если }n < 2^k \\ B_k(q), 2q, 4q, 8q, ..., 2^kq, n,\text{ если } n \geqslant 2^k\ \text{и } q = \lfloor\frac{n}{2^k}\rfloor \end{cases}$$

#### Алгоритм дробления вектора индексов
Алгоритм дробления вектора индексов позволяет найти минимальную звездную цепочку для некоторого числа $n \in \mathbb{N}$.

Рассмотрим вектор индексов $\{r_i\}_{i=1}^q \cup {\{{\rho}_j \}}_{j=q+1}^m$, где ${\rho}_j= \{x: 1 \leq x \leq j \}$, ${\{r_i\}}_{i=1}^q$ - фиксированная часть, ${\{{\rho}_j\}}_{j=q+1}^m$ - изменяющаяся часть.

Наибольшее значение $a_m$ достигается при векторе индексов ${\{r_i\}}_{i=1}^{q} \cup \{q+1,q+2,\dots,m\}$.

Наименьшее значение $a_m$ достигается при векторе индексов ${\{r_i\}}_{i=1}^{q}\cup\{1,1,\dots,1\}$.

$a_{max} = a_{q+1} \cdot {2}^{m-q}$

$a_{min} = a_{q+1}+m-q$

Алгоритм:

1) Во внешнем цикле рассматриваем аддитивные цепочки длины $m$ от значения $\underline{l}(n)=\lceil log_2(n) \rceil$ до $\bar{l}(n)=\lambda(n)+\nu(n)-1$, на каждой итерации выбираем $q$ ($1 \leq q \leq m-1$), пусть $q = \frac{m}{2}$

2) Далее перебираем все возможные фиксированные части вектора индексов $\{r_i\}_{i=1}^q$ ($q!$ вариантов), для каждой строим соответствующую ей звездную цепочку, находим $a_{max}$ и ${a}_{min}$

&emsp; а) Если $a_m = n$ - конец

&emsp; б) Если $n \notin [a_{min},a_{max}]$, то переходим к следующему набору $\{r_i\}_{i=1}^q$

&emsp; в) Если $n\in [a_{min},a_{max}]$, то перебираем все возможные изменяющиеся части вектора индексов ${\left \{{\rho}_j \right \}}_{ j=q+1}^m$ и находим $a_m$. Если $a_m=n$, то цепочка найдена. Если все возможные изменяющиеся части вектора индексов ${\{{\rho}_j\}}_{j=q+1}^m$ исчерпаны, то переходим к следующему набору $\{r_i\}_{i=1}^q$.

3) Если все наборы вектора индексов длины $m$ исчерпаны, то увеличиваем $m$ на 1.


#### Гипотеза Шольца-Брауэра
Пусть $l^*(n)$ - длина звёздной цепочки.

Тогда $\forall n \in \mathbb{N} : n < 578469$ верно: $l^*(2^n-1)\leq l^*(n)+n-1$

*Примечание:* выполняется равенство для $n < 65$

## Постановка задачи

Реализовать точные и приближённые алгоритмы нахождения минимальных аддитивных цепочек с использованием системы компьютерной математики SageMath, провести анализ алгоритмов. Полученные результаты содержательно проинтерпретировать.

## Выполнение работы

### 1. Алгоритм Брауэра

Класс $Brouwer$ содержит два метода: $run$ и $do\_test$. Он отвечает за реализацию Алгоритма Брауэра.
- Метод $run$ отвечает за запуск вычислений последовательности определенной формулой Брауэра. Он принимает три аргумента: $n$ (целое число), $k$ (целое число) и $chain$ (список). Прямо в функции $run$ производятся вычисления и заполняется список chain значениями порядка. Если $n$ меньше, чем $2^k$, то метод заполняет список $chain$ последовательностью длиной $2^{k - 1}$.
- Метод $do\_test$ используется для тестирования метода $run$. Он принимает два аргумента: $n$ (целое число) и $kRange$ (целое число). Метод запускает цикл по всем значениям $k$ от $2$ до $kRange - 1$ и для каждого значения k вызывает метод $run$ с аргументами $n, k$ и пустым списком $chain$. Затем метод выводит результаты вычисления в консоль.

Этот класс используется для вычисления последовательности определенной формулой Брауэра. $run$ реализует алгоритм вычисления, а $do\_test$ используется для проверки корректности алгоритма на различных входных данных.

In [13]:
class Brouwer:    
    def __run(self, n, k, chain):
        if n >= 2**k:
            q1 = q = n // 2**k
            self.__run(q, k, chain)
            
            for i in range(1, k + 1):
                q *= 2
                
                if not (q1 < 2**(k - i)):
                    chain.append(q)
            if n != q:    
                chain.append(n)
        else:
            for i in range(1, 2**k):
                chain.append(i)
            return
                
    def do_test(self, n, kRange):
        for k in range(2, kRange):
            chain = []
            self.__run(n, k, chain)
            print(f"N = {n}\tK = {k}\nChain = {chain}\nChain Length = {len(chain)}\n")

В качестве входных данных подставим заместо $n$ числа $123, 456, 666$. При $k \in [2, 4]$

In [14]:
brouwer = Brouwer()
brouwer.do_test(123, 5)

N = 123	K = 2
Chain = [1, 2, 3, 4, 7, 14, 28, 30, 60, 120, 123]
Chain Length = 11

N = 123	K = 3
Chain = [1, 2, 3, 4, 5, 6, 7, 8, 15, 30, 60, 120, 123]
Chain Length = 13

N = 123	K = 4
Chain = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 28, 56, 112, 123]
Chain Length = 19



In [15]:
brouwer = Brouwer()
brouwer.do_test(456, 5)

N = 456	K = 2
Chain = [1, 2, 3, 4, 7, 14, 28, 56, 112, 114, 228, 456]
Chain Length = 12

N = 456	K = 3
Chain = [1, 2, 3, 4, 5, 6, 7, 14, 28, 56, 57, 114, 228, 456]
Chain Length = 14

N = 456	K = 4
Chain = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 28, 56, 112, 224, 448, 456]
Chain Length = 22



In [16]:
brouwer = Brouwer()
brouwer.do_test(666, 5)

N = 666	K = 2
Chain = [1, 2, 3, 4, 8, 10, 20, 40, 41, 82, 164, 166, 332, 664, 666]
Chain Length = 15

N = 666	K = 3
Chain = [1, 2, 3, 4, 5, 6, 7, 8, 10, 20, 40, 80, 83, 166, 332, 664, 666]
Chain Length = 17

N = 666	K = 4
Chain = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 32, 41, 82, 164, 328, 656, 666]
Chain Length = 23



Сравним результаты с уже известным минимальным количеством операций, необходимым для формирования цепочки.

|  N  | K |Brouwer ChainLength| Shortest Length |
|:---:|:-:|:-----------------:|:---------------:|
| 123 | 2 | 11                | 9               |
| 123 | 3 | 13                | 9               |
| 123 | 4 | 19                | 9               |
| 456 | 2 | 12                | 11              |
| 456 | 3 | 14                | 11              |
| 456 | 4 | 22                | 11              |
| 666 | 2 | 15                | 12              |
| 666 | 3 | 17                | 12              |
| 666 | 4 | 23                | 12              |

#### Вывод
Можно заметить, что чем меньше значение $k$, тем длина цепочки приближается к мнимальной длине.

### 2. Алгоритм дробления вектора индексов

Класс $SplitAlgorithm$ - реализация алгоритма поиска оптимальной цепочки для заданного числа методо дробления векторов, описание которого находится теоретическом положении. 

- $search\_chain$ принимает на вход целое число $n$ и ищет оптимальную цепочку для него. Возвращает найденную цепочку и время выполнения поиска.
- $binary\_length$ вспомогательный метод, который принимает на вход целое число $n$ и возвращает количество разрядов в двоичном представлении этого числа.
- $iterate\_unfixed\_par$ вспомогательный метод, который выполняет итерации по вектору индексов итераций с незафиксированными элементами. Возвращает $True$, если найдена оптимальная цепочка и $False$, если цепочка не найдена. Параметр $skip$ определяет, нужно ли пропускать первую итерацию.
- $decrement\_last\_item$ вспомогательный метод, который уменьшает последний элемент вектора индексов на $1$. Используется в методе $iterate\_unfixed\_part$ для перебора возможных векторов индексов.
- $find\_star\_chain$ вспомогательный метод, который ищет цепочку для числа $m$. Он возвращает найденную цепочку. Параметр $fSize$ определяет минимальный размер вектора индексов. Если он не указан, то определяется из числа $m$
- $form\_chain$ вспомогательный метод, который принимает на вход вектор индексов итераций и возвращает цепочку итераций, соответствующую этому вектору.

In [20]:
from time import time
import numpy as np


class SplitAlgorithm:
    
    def search_chain(self, n):
        start = time()            
        chain = self.__find_star_chain(n)
        return chain, time() - start
    
    def __binary_length(self, n):
        return floor(log(n, 2)) + str(bin(n))[2:].count('1') - 1
    
    def __find_star_chain(self, m, fSize = 0):
        if (fSize == 0): fSize = ceil(log(m, 2).n())
            
        for vSize in range(fSize, self.__binary_length(m) + 2):
            skip = False
            v = [vElem for vElem in range(1, vSize + 1)]  
                
            minFix = 0
            maxFix = len(v) // 2
            
            if (m < 10):
                minFix = -1
                maxFix = 1
            for fixedPartSize in range(maxFix, minFix, -1):
                aMin = 0
                aMax = np.inf
                
                if (m > 20):
                    aMin = v[fixedPartSize - 1] + len(v) - fixedPartSize
                    aMax = v[fixedPartSize - 1] * 2^(len(v) - fixedPartSize)
                if not (m >= aMin and m <= aMax): continue
                    
                found = self.__iterate_unfixed_part(v, fixedPartSize, m, skip)
                skip = True
                
                if found[0]: return found[1]
                
    def __iterate_unfixed_part(self, v, fixedPartSize, m, skip=False):
        if (skip):
            if (fixedPartSize != 0):
                v[fixedPartSize] -= 1
            else:
                return [False, v]   
        while True:
            vChain = self.__form_chain(v)
            
            if (vChain[-1] == m): return [True, vChain]
            if v.count(1) == len(v) - fixedPartSize + 1: return [False, vChain]
            
            v = self.__decrement_last_item(v, fixedPartSize)
            
    def __decrement_last_item(self, v, start):
        v1 = []
        v2 = []
        for i in range(len(v)):
            v1.append(v[i]) if i < start else v2.append(v[i]) 

        eIndex = lastElemIndex = 0    
        for e in v:
            if (e  != 1): lastElemIndex = eIndex
            eIndex+=1

        v2[lastElemIndex - start] -= 1
        for i in range(lastElemIndex - start + 1, len(v2)):
            v2[i] = i + 1 + start
        v = v1 + v2 
        return v
            
    def __form_chain(self, indexVector):
        chain = [1]
        for r in indexVector:
            nxtElem = chain[-1] + chain[r - 1]
            chain.append(nxtElem)
        return chain 

Ниже приведены тесты для чисел: $123, 456, 666$.

In [22]:
for item in [123, 456, 666]:
    chain, excecutionTime = SplitAlgorithm().search_chain(item)
    print(f"N = {item}\n" + 
          f"Chain: {chain}\n" +
          f"Chain Length: {len(chain)}\n" + 
          f"Excecution Time: {excecutionTime}\n")

N = 123
Chain: [1, 2, 4, 8, 16, 32, 40, 41, 82, 123]
Chain Length: 10
Excecution Time: 0.258655309677124

N = 456
Chain: [1, 2, 4, 8, 16, 32, 64, 128, 256, 384, 448, 456]
Chain Length: 12
Excecution Time: 21.778913021087646

N = 666
Chain: [1, 2, 4, 8, 16, 32, 64, 128, 136, 264, 528, 664, 666]
Chain Length: 13
Excecution Time: 208.2409200668335



#### Вывод
Сравнивая с Алгоритм Брауэра, Алгоритм дробления вектора индексов дает более приближенную к минимальной цепочку, однако он занимает куда больше времени.

### 3. Проверка гипотезы Шольца-Брауэра

Была написана функция $check\_hypotheses$, которая проверяет числа от $3$ до $kRange - 1$ на соблюдение гипотезы Шольца-Брауэра. Если гипотеза верна - неравенство горит зеленым цветом, в противном случае - красным.

In [23]:
GREEN_COLOR, RED_COLOR, NORMAL_COLOR = "\033[92m", "\033[91m", "\033[0m"

def check_hypotheses(kRange):
    for i in range(3, kRange):
        chain1, excecutionTime = SplitAlgorithm().search_chain(i)
        chain2, excecutionTime = SplitAlgorithm().search_chain(2**i - 1)
        color = GREEN_COLOR if (len(chain2) <= len(chain1) + i - 1) else RED_COLOR
        
        print(f"{i}: " + color +
                            (f"l(2^{i} - 1) < l({i}) + {i} - 1"
                            if len(chain2) < len(chain1) + i - 1 
                            else f"l(2^{i} - 1) == l({i}) + {i} - 1"
                            if len(chain2) == len(chain1) + i - 1 
                            else f"l(2^{i} - 1) > l({i}) + {i} - 1") +
                         NORMAL_COLOR)

Проверим интервал $[3, 8)$ на корректность гипотезы:

In [24]:
check_hypotheses(8)

3: [92ml(2^3 - 1) == l(3) + 3 - 1[0m
4: [92ml(2^4 - 1) == l(4) + 4 - 1[0m
5: [92ml(2^5 - 1) == l(5) + 5 - 1[0m
6: [92ml(2^6 - 1) == l(6) + 6 - 1[0m
7: [92ml(2^7 - 1) == l(7) + 7 - 1[0m


#### Вывод

Для последовательности {$3..7$} выполняется гипотеза.

## Выводы

Были реализованы алгоритмы нахождения минимальных аддитивных цепочек при помощи $SageMath$: Алгоритм Брауэра и Алгоритм дробления вектора индексов; а так же проведены их сравнение, в ходе которого были выявлены плюсы и минусы методов. Более того, проведна проверка гипотезы Шольца-Брауэра.