# Но сначала задача про подмассивы

**K Sum Subarrays Count**

Дан массив целых чисел `arr`. Нужно найти количество подмассивов, сумма которых равна k

Подмассив – это непрерывный участок массива `arr[i:j+1]`. Один элемент и весь массив так же являются подмассивами.

In [None]:
def k_sum_subarrays(arr: list, k) -> int:
    
    # Заведем словарь, где будем хранить частичные суммы массива и сколько раз мы ее встретили
    # Частично суммой для элемента i будет sum(arr[:i+1])
    sums = {}
    now_s = 0 # Нынешняя сумма, чтобы каждый раз не вызывать функцию sum
    n = 0

    for i in range(len(arr)):
        # Увеличиваем нынешнюю сумму
        now_s += arr[i]
        # Если какая-то из частичных сумм равна нужному числу, то увеличиваем счетчик
        if now_s == k:
            n += 1
        # Если выполнено условие, что sum(arr[i:j+1]) = k, которое можно записать как
        # sum(arr[:j+1]) - sum(arr[:i+1]) = k, то мы нашли нужный подмассив
        if (now_s - k) in sums:
            # Для данного индекса таких подмассиво может быть сразу несколько, так что нам надо хранить их число
            n += sums[now_s - k]
        # Заполяем хэш-таблицу
        if now_s in sums:
            sums[now_s] += 1
        else:
            sums[now_s] = 1
    return n

In [None]:
print(k_sum_subarrays([1, 2, 3], 3))
print(k_sum_subarrays([1, -2, 3], 0))
print(k_sum_subarrays([1, 1, 1, 1, 1], 3))

2
0
3


In [None]:
[-3, 3, -2, 2, 1, 3, 4]

# Dynamic Programming. Basics

## Размен монет

Дан массив `coins[0..m-1]`, содержащий `m` монет разного номинала. Необходимо написать программу, которая выдаст нужную сумму `V` наименьшим числом монет. Если выдать сумму невозможно, верните `-1`.

In [None]:
def coins_change(coins, V):
    
    table = [float('inf') for _ in range(0, V + 1)]
    table[0] = 0

    for i in range(1, V + 1):
        for coin in coins:
            if coin <= i:
                curr = table[i - coin]
                if curr != float('inf') and curr + 1 < table[i]:
                    table[i] = curr + 1

    if table[V] == float('inf'):
        return -1
    
    return table[V]


In [None]:
coins = [1, 4, 7]
V = 17

coins_change(coins, V)

5

In [None]:
coins = [1, 2, 4, 8, 16]
V = 31

coins_change(coins, V)

5

## Рюкзак

Есть рюкзак вместимостью `W` и `N` предметов разной ценности. Нужно заполнить рюкзак так, чтобы его общая ценность была максимальной. Другими словами, даны два целочисленных массива `val[0..N-1]` и `wt[0..N-1]`, которые представляют ценность и веса предметов. Найдите максимальное подмножество значений из `val[]`, такое, что сумма весов этого подмножества меньше или равна `W`. В качестве ответа, выведите полученное значение для ценности рюкзака. Предмет можно выбрать полностью, или не выбрать вообще. Решите задачу с неповторяющимися предметами.

In [None]:
val = [4, 5, 3, 2]
wt = [4, 5, 1, 2]
W = 4

max_val = ''

### Идеи:
* Какой рекурсивный алгоритм тут можно придумать (как у него сложность)?
* Как получить эффективную рекурсию?

In [None]:
def knapsack_no_repetition(val, wt, W, N):
    
    table = [[0 for _ in range(W + 1)] for __ in range(N + 1)]

    for i in range(1, N + 1):
        for w in range(1, W + 1):

            if wt[i - 1] <= w:
                table[i][w] = max(table[i - 1][w], val[i - 1] + table[i - 1][w - wt[i - 1]])
            else:
                table[i][w] = table[i - 1][w]
    print(*table, sep='\n')
    return table[N][W]

In [None]:
val = [30, 14, 16, 9]
wt = [6, 3, 4, 2]
N = 4
W = 10

knapsack_no_repetition(val, wt, W, N)

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
[0, 0, 0, 0, 0, 0, 30, 30, 30, 30, 30]
[0, 0, 0, 14, 14, 14, 30, 30, 30, 44, 44]
[0, 0, 0, 14, 16, 16, 30, 30, 30, 44, 46]
[0, 0, 9, 14, 16, 23, 30, 30, 39, 44, 46]


46

In [None]:
val = [4, 5, 3, 2]
wt = [4, 5, 1, 2]
W = 4
N = 4

knapsack_no_repetition(val, wt, W, N)

[0, 0, 0, 0, 0]
[0, 0, 0, 0, 4]
[0, 0, 0, 0, 4]
[0, 3, 3, 3, 4]
[0, 3, 3, 5, 5]


5

# А как если с повторениями?

* Измениться ли наша рекурсивная формула?

In [None]:
def knapsack_with_repetition(val, wt, W, N):
    
    table = [0 for _ in range(0, W + 1)]
    table[0] = 0

    for i in range(1, W + 1):
        for item in range(N):
            if wt[item] <= i:
                curr = table[i - wt[item]]
                if curr + val[item] > table[i]:
                    table[i] = curr + val[item]
    return table[W]


In [None]:
val = [30, 14, 16, 9]
wt = [6, 3, 4, 2]
N = 4
W = 10

knapsack_with_repetition(val, wt, W, N)

48

# Edit Distance

In [None]:
def compute_edit_distance(s1, s2, insertion_cost, deletion_cost, substit_cost):
  
    table = [[0 for _ in range(len(s2) + 1)] for __ in range(len(s1) + 1)]

    table[0] = [i for i in range(len(s2)+1)]
    for i in range(len(table)):
        table[i][0] = i
    for i in range(1, len(s1) + 1):
        for j in range(1, len(s2) + 1):
            if s1[i - 1] == s2[j - 1]:
                table[i][j] = table[i - 1][j - 1]
            else:
                table[i][j] = min(table[i][j - 1] + 1, table[i - 1][j] + 1, table[i - 1][j - 1] + 1)
    print(*table, sep='\n')
    return table[len(s1)][len(s2)]

In [None]:
compute_edit_distance('sunday', 'saturday', 2, 3, 4)

[0, 1, 2, 3, 4, 5, 6, 7, 8]
[1, 0, 1, 2, 3, 4, 5, 6, 7]
[2, 1, 1, 2, 2, 3, 4, 5, 6]
[3, 2, 2, 2, 3, 3, 4, 5, 6]
[4, 3, 3, 3, 3, 4, 3, 4, 5]
[5, 4, 3, 4, 4, 4, 4, 3, 4]
[6, 5, 4, 4, 5, 5, 5, 4, 3]


3

# Наибольшая общая подпоследовательность

Даны 2 последовательности (строки). Необходимо найти наибольшую подпоследовательность этих строк. `z` — подпоследовательность `x` в том случае, если существует строго возрастающий набор индексов элементов `x`, из которых получается `z`.

In [None]:
def GCS(s1, s2):
    table = [[0 for _ in range(len(s2) + 1)] for __ in range(len(s1) + 1)]

    table[0] = [i for i in range(len(s2)+1)]
    for i in range(len(table)):
        table[i][0] = i
    for i in range(1, len(s1) + 1):
        for j in range(1, len(s2) + 1):
            if s1[i - 1] == s2[j - 1]:
                table[i][j] = table[i - 1][j - 1]
            else:
                table[i][j] = min(table[i][j - 1] + 1, table[i - 1][j] + 1, table[i - 1][j - 1] + 1)
    print(*table, sep='\n')
    return table[len(s1)][len(s2)]

In [None]:
def GCS(s1, s2):
    matrix = [[0 for _ in range(len(s2)+1)] for _ in range(len(s1)+1)]
    
    for i in range(1, len(s1)+1):
        for j in range(1, len(s2)+1):
            if s1[i-1] == s2[j-1]:
                matrix[i][j] = matrix[i-1][j-1] + 1
            else:
                matrix[i][j] = max(matrix[i-1][j], matrix[i][j-1])
    return matrix[-1][-1]

In [None]:
GCS('apple', 'pear')

2

In [None]:
GCS('sunday', 'saturday')

5

# Наибольшая возрастающая последовательность

Найдите среди всех возможных подпоследовательностей данной последовательности монотонно возрастающую подпоследовательность наибольшей длины

* Рассмотрим какой-то элемент s[i]. Его можно добавить в любую последовательность, которая заканчивается число, меньшим, чем s[i]. Тогда если есть последовательность длиной k и заканчивающаяся на число, меньше s[i], то можно получить последовательность длиной k + 1.
* Чтобы все было ОК, такое добавление должно приводить к улучшению для последовательности длины k + 1. То есть последний элемент последовательности длины k + 1 должен быть не меньше s[i].
* Как получить ответ? Нам нужнен индекс первого числа, не равного бесконечности

In [None]:
def GAS(s):
    # В таблице храним для каждой длины (индекса) последний элемент соответсвующей последовательности
    table = [float('inf') for i in range(len(s) + 2)] # нам нужно рассмотреть от 0 и до n + 1 включительно
    table[0] = -float('inf') # Для нуля минус бесконечность (это значит, что к нулю можно любую последовательность приделать)

    for i in range(len(s)): # Это просто бин поиск. Для каждого элемента мы ищем 

        left, right = 0, len(s) 

        while right - left > 1:
            mid = (right + left) // 2
            if table[mid] >= s[i]:
                right = mid
            else: 
                left = mid 
        table[right] = s[i]

    return table.index(float('inf')) - 2 # Тут находим первое вхождение бесконечности и отнимаем 2, так как нужное нам число до нее и еще лишний индекс от нулевого элемента


In [None]:
GAS([2, 4, 8, 16, 7, 10, 9, 5, 11, 22, 8, 9])

6