# Алгоритмы. Задание 2
### Удовин Илья, 874

## 1.
Доказать, что для произвольной константы $c>0$ функция $g(n) = 1+c+c^2+\ldots+c^n$ есть

а) $\Theta(1)$, если $c < 1$.

$$\blacktriangle \hspace{10pt}  1 \leq 1+c+c^2+\ldots+c^n = \frac{1-c^{n+1}}{1-c} \leq \frac{1}{1-c}. \hspace{10pt} \blacksquare $$

b) $\Theta(n)$, если $c = 1$.

$$ \blacktriangle \hspace{10pt} g(n) = \underbrace{1 + \dots + 1}_{n} = n = \Theta(n). \hspace{10pt} \blacksquare $$ 

c) $\Theta(c^n)$, если $c > 1$.

$$ g(n) = \frac{c^{n+1}-1}{c-1} .$$

Докажем, что $\exists c_1, c_2 \in \mathbb{R}_+ :$
$$ c_1 \leq \frac{\frac{c^{n+1}-1}{c-1}}{c^n} \leq c_2 .$$

$$ \blacktriangle \hspace{10pt} \frac{\frac{c^{n+1}-1}{c-1}}{c^n} = \frac{c^{n+1}-1}{c^{n+1}-c^n} = \frac{c^{n+1}-1}{c^{n}(c-1)} $$

Пусть $c_1 = 1$, тогда 
$$ 1 \leq \frac{c^{n+1}-1}{c^{n+1}-c} \Leftrightarrow c^{n+1}-c \leq c^{n+1}-1 \Leftrightarrow 1 \leq c. $$

Пусть $c_2 = \dfrac{c}{c-1}$, тогда
$$ \frac{c^{n+1}-1}{c^{n}(c-1)} \leq \frac{c}{c-1} \Leftrightarrow \frac{c^{n+1}-1}{c^n} \leq c \Leftrightarrow c^{n+1}-1 \leq c^{n+1}.$$

Последнее равенство верно для любого $c$. $\hspace{10pt} \blacksquare$

## 2.
Построить линейный по времени онлайн-алгоритм, который вычисляет следующие функции:

a) среднее арифметическое последовательности чисел.

Для определения среднего арифметического необходимо знать сумму чисел и их количество. Их частное будет искомым значением. Сумму будем хранить в переменной $s$, изначально имеющей значение $0$. На каждой итерации будем увеличивать ее значение на элемент последовательности. Количество чисел будем хранить в переменной $n$, изначально имеющей значение $0$, и увеличивать ее на каждой итерации на $1$.

In [17]:
def solve_2a(a):    # a - массив чисел
    s = 0    # сумма чисел
    n = 0    # количество чисел
    avg = None
    for x in a:
        s += x
        n += 1
        avg = s / n    # на каждой итерации вычисляется среднее значение
    return avg

In [19]:
solve_2a([3, 1, 4, 1, 5])

2.8

Сложность по времени $-$ $O(n)$. Сложность по памяти $-$ $O(1)$.

b) число элементов последовательности целых чисел, равных её максимальному элементу.

Для начала нужно знать значение максимального элемента последовательности. Для этого воспользуемся известным жадным алгоритмом. Сохраним результат в переменную $m$ (*max*).

In [2]:
def find_max(a):
    m = a[0]    # максимальный элемент
    for x in a:
        if x > m:
            m = x
    return m

Затем заведем переменную-счетчик $c$ (*counter*), значение которой изначально равно нулю. Пройдем по элементам последовательности, увеличивая значение $c$ каждый раз, когда значение элемента будет совпадать с $m$.

In [15]:
def solve_2b(a):
    m = find_max(a)
    c = 0    # счетчик
    for x in a:
        if x == m:
            c += 1
    return c

In [16]:
solve_2b([1, 5, 2, 5, 3, 4, 5])

3

Сложность по времени и по памяти $-$ $O(n)$.

c) максимальное число идущих подряд одинаковых элементов.

Создадим переменную $prev$, чтобы записывать в нее значение предыдущего элемента последовательности и переменную $c$, чтобы записывать в нее текущее значение счетчика. Каждый раз когда значение элемента отлично от $prev$ будем обнулять счетчик и перезаписывать значение $prev$, иначе просто увеличивать счетчик. Затем, если он больше своего максимального значения, сохранять его в переменной $m$.

Изначально запишем в $c$ и $m$ значение $0$, в $prev$ $-$ первого элемента последовательности. Тогда на первой итерации $c$ увеличится на $1$, значит в результате значение $m$ будет положительным.

In [4]:
def solve_2c(a):
    c = 0    # текущее значение счетчика
    m = 0    # искомое число
    prev = a[0]    # предыдущий элемент
    for x in a:
        if x == prev:
            c += 1
        else:
            c = 1
            prev = x
        if c > m:
            m = c
    return m

In [6]:
solve_2c([1, 2, 2, 3, 3, 3, 4, 5])

3

In [9]:
solve_2c([1, 2, 3, 4, 5, 5, 5, 5])

4

Сложность по времени $-$ $O(n)$. Сложность по памяти $-$ $O(1)$. 

## 4.

На вход подаётся последовательность чисел $a_1, b_1, a_2, b_2, \dots , a_n, b_n$. Построить онлайн-алгоритм, который вычисляет сумму 􏰀$\displaystyle \sum_{i \neq j} a_i \times b_j$.

**Решение**

Искомую сумму можно записать как

$$ 
\sum_{i \neq j} a_i \times b_j = a_1 \cdot b_2 + a_2 \cdot b_1 + a_3 (b_1 + b_2) + b_3 (a_1 + a_2) + a_4 (b_1 + b_2 + b_3) + b_4 (a_1 + a_2 + a_3) + \dots + a_n (b_1 \dots b_{n-1}) + b_n (a_1 + \dots + a_{n-1}).
$$

$\blacktriangle \hspace{10pt} $ Для n = 2 (база индукции)

$$ \sum_{i \neq j} a_i \times b_j = a_2 b_1 + b_2 a_1 . $$

Предположим, что это верно для некоторого $n - 1$ (шаг). Тогда при добавлении элементов $a_n$ и $b_n$ в новой сумме будут все слагаемые $a_i b_j$ из предыдущей суммы, кроме содержащих $a_n$ или $b_n$. Чтобы получить окончательный результат, нужно прибавить к предыдущей сумме $a_n b_1 + a_n b_2 + \dots + a_n b_{n-1} + b_n a_1 + b_n a_2 + \dots + b_n a_{n-1} = a_n (b_1 + \dots + b_{n-1}) + b_n (a_1 + \dots + a_{n-1})$, т. е. два последних слагаемых. $\hspace{10pt} \blacksquare$

Элементы в скобках упорядочены и индекс элемента перед каждой скобкой на $1$ больше индекса последнего элемента в скобке. На $k$-м шаге алгоритма нам нужно знать сумму всех предыдущих элементов $\displaystyle S_a = \sum_{i=1}^{k-1} a_k$ и сумму всех предыдущих элементов $\displaystyle S_b = \sum_{i=1}^{k-1} b_k$ ($S_a$ и $S_b$ будем хранить как переменные). Зная эти значения, остается прибавить к итоговому ответу (будем хранить его в переменной $ans$) $a_k \cdot S_b + b_k \cdot S_a$  и перейти к следующему шагу. Значения переменных $S_a$, $S_b$ и ans изначально сделаем равными $0$. Трех этих переменных будет достаточно (все значения $a_i$ и $b_j$ запоминать не нужно). Всего слагаемых $2n$, значит алгоритм линейный.

In [18]:
def solve_4(s):
    sum_a = sum_b = ans = 0
    for i in range(0, len(s), 2):
        a = s[i]
        b = s[i + 1]
        ans += a * sum_b + b * sum_a
        sum_a += a
        sum_b += b
    return ans

In [19]:
solve_4([1, 2, 3, 4, 5, 6])

64

*Комментарий к примеру*. $ a = \{1, 3, 5\}, b = \{2, 4, 6\} $
$$ \sum_{i \neq j} a_i \times b_j = 1 \cdot 4 + 1 \cdot 6 + 3 \cdot 2 + 3 \cdot 6 + 5 \cdot 2 + 5 \cdot 4 = 4 + 6 + 6 + 18 + 10 + 20 = 64. $$

Сложность по времени $-$ $O(n)$. Сложность по памяти $-$ $O(1)$.

## 5.

Дана последовательность целых чисел $a_1, a_2, \dots , a_n$. Найти её самую длинную строго возрастающую подпоследовательность.

а) Предложить $O(n^2)$ алгоритм.

*Если таких последовательностей будет несколько, то выведем любую из них.*

Алгоритм будет работать рекуррентно. Создадим для каждого элемента массив, хранящий самую длинную строго возрастающую последовательность, оканчивающуюся им самим (последовательность его предков). Для каждого элемента будем находить предка с самой длинной последовательностью и присоединять ее к элементу. В результате на $k$-й итерации будет найдена самая длинная подпоследовательность среди первых $k$ элементов. После $n$ итераций будет получен ответ на задачу.

Для поиска предка с самой длинной последовательностью необходимо сохранять все последовательности. Будем использовать для этого двумерный массив **parents[n, n]**, изначально заполненный массивами из одного элемента $-$ соответствующего элемента последовательности. Для удобства будем использовать отдельный массив **number_of_parents[n]**, хранящий длины последовательностей предков для каждого элемента. По сути данные в нем будут избыточны, т. к. их можно вычислить, но код будет легче читаться. Также введем переменную $m$, которая будет хранить наибольшую длину последовательности предков (по аналогии с поиском наибольшего элемента), и переменную $key$, хранящую индекс элемента с этой последовательностью.

In [51]:
def solve_5(a):
    n = len(a)
    m = 0
    key = 0
    parents = [[a[i]] for i in range(n)]
    num_of_parents = [1 for _ in range(n)]
    
    for i in range(n):
        
        for j in range(i):
            if a[j] < a[i]:
                if num_of_parents[j] + 1 > num_of_parents[i]:
                    num_of_parents[i] = num_of_parents[j] + 1
                    
        if a[i] > a[key]:
            parents[i] += parents[key]    # склейка массивов происходит за линейное время
            
        if num_of_parents[i] > m:
            key = i
            m = num_of_parents[i]
            
    parents[key].reverse()
    return parents[key]

In [52]:
solve_5([3, 1, 4, 1, 5, 9, 2, 6, 5, 3])

[3, 4, 5, 9]

На каждой итерации в цикле по $i$ происходит $i$ константных операций (сравнение и присваивание) (цикл по $j$). Также происходит склейка массивов, занимающая порядка $i$ операций (т. к. длина присоединяемого массива не превосходит $i$) и некоторые операции, занимающие константное время. В результате происходит порядка $\displaystyle \sum_{i=1}^n 2i = n(n+1) = O(n^2)$ операций.

Сложность по времени $-$ $O(n^2)$.

В наихудшем случае, если последовательность монотонно возрастает массив предков будет содержать $\displaystyle \sum_{i=1}^n i = \frac{n(n+1)}{2} = O(n^2)$ элементов.

Сложность по памяти $-$ $O(n^2)$.