# Префиксные суммы

Префиксные суммы (prefix sums) — это техника, используемая для эффективного вычисления суммы элементов подмассивов в массиве. Эта техника особенно полезна, когда требуется многократно вычислять суммы элементов на подотрезках одного и того же массива.

# Основные идеи и свойства префиксных сумм:

1. **Определение:**
   Префиксная сумма для массива \( arr \) — это массив \( prefix \), где \( prefix[i] \) представляет собой сумму элементов от начала массива до индекса \( i \) включительно.
   Формально:
   \[
   prefix[i] = \sum_{j=0}^{i} arr[j]
   \]

2. **Построение префиксных сумм:**
   - Префиксные суммы строятся за линейное время \( O(N) \), где \( N \) — длина массива.
   - Для построения достаточно выполнить один проход по исходному массиву и на каждом шаге накапливать сумму элементов.

3. **Использование префиксных сумм:**
   - После построения префиксных сумм любую сумму подмассива \( arr[l:r] \) можно вычислить за константное время \( O(1) \):
     \[
     \text{sum}_{l:r} = prefix[r] - prefix[l-1], \quad \text{если } l > 0
     \]
     \[
     \text{sum}_{l:r} = prefix[r], \quad \text{если } l = 0
     \]
   - Это возможно благодаря тому, что \( prefix[i] \) содержит сумму элементов от начала массива до индекса \( i \).


# Применение префиксных сумм:

- **Вычисление сумм на подотрезках массива** — префиксные суммы значительно ускоряют процесс вычисления сумм на подмассивах.
- **Решение задач на суммы** — многие алгоритмические задачи, связанные с массивами и подмассивами, могут быть эффективно решены с использованием префиксных сумм.
- **Поиск частых встречающихся элементов** — префиксные суммы могут использоваться для подсчета частоты встречаемости элементов в массиве.

Префиксные суммы представляют собой мощный инструмент для работы с массивами, который значительно улучшает производительность операций, связанных с вычислением сумм на подмассивах.

# Задачи

### Условие задачи

Реализовать вычисление суммы элементов на подотрезке массива (Range Sum Query, RSQ) с использованием префиксных сумм.

### Описание алгоритма

1. **Построение префиксных сумм:**
   - Создается массив `prefixsum`, где `prefixsum[i]` будет содержать сумму элементов массива `nums` от начала до индекса `i`.
   - Префиксная сумма для элемента `prefixsum[0]` равна 0 (это условие удобно для обобщения).

2. **Вычисление RSQ:**
   - Функция `rsq(prefixsum, l, r)` принимает массив `prefixsum` и границы подотрезка `[l, r]`.
   - Сумма на подотрезке `[l, r]` вычисляется как разность `prefixsum[r + 1] - prefixsum[l]`.
   - Это работает, потому что `prefixsum[r + 1]` содержит сумму элементов от начала массива до `r`, а `prefixsum[l]` содержит сумму элементов от начала массива до `l-1`.


In [1]:
def make_prefix_sum(nums):
    prefix_sum = [0] * (len(nums) + 1)
    for i in range(1, len(nums) + 1):
        prefix_sum[i] = prefix_sum[i - 1] + nums[i - 1]
    return prefix_sum

def rsq(prefix_sum, l, r):
    return prefix_sum[r + 1] - prefix_sum[l]

# Пример использования
nums = [1, 3, 5, 7, 9, 11, 13]
prefix_sum = make_prefix_sum(nums)

# Вычисление RSQ для интервала [2, 5]
l, r = 2, 5
result = rsq(prefix_sum, l, r)
print(f"Сумма элементов на подотрезке [{l}, {r}]: {result}")

Сумма элементов на подотрезке [2, 5]: 32


### Условие задачи

Необходимо подсчитать количество нулей в массиве `nums` для каждого запроса, заданного диапазоном `[l, r)`.

### Описание алгоритма

Данный алгоритм решает задачу подсчета количества нулей на заданном подотрезке массива. В худшем случае каждый запрос может занимать время \(O(N)\), что делает общий алгоритм \(O(NM)\) для \(M\) запросов.



In [2]:
def count_zeroes(nums, l, r):
    cnt = 0
    for i in range(l, r):
        if nums[i] == 0:
            cnt += 1
    return cnt

# Пример использования
nums = [1, 0, 5, 0, 0, 3, 0, 9]
queries = [(1, 4), (2, 6), (0, 8)]

for l, r in queries:
    result = count_zeroes(nums, l, r)
    print(f"Количество нулей на подотрезке [{l}, {r}): {result}")

Количество нулей на подотрезке [1, 4): 2
Количество нулей на подотрезке [2, 6): 2
Количество нулей на подотрезке [0, 8): 4


**Оптимизация**

Хотя приведенный алгоритм работает, его сложность \(O(NM)\) может быть неприемлемой для больших массивов и большого числа запросов. Для оптимизации можно использовать префиксные суммы, которые позволят обрабатывать каждый запрос за \(O(1)\) после предварительной обработки массива за \(O(N)\).

**Оптимизация с использованием префиксных сумм**

1. **Построение префиксной суммы нулей**:
   - Создаем массив `prefix_zeros`, где `prefix_zeros[i]` содержит количество нулей в массиве `nums` от начала до индекса `i`.

2. **Вычисление префиксной суммы**:
   - Итерируемся по массиву и заполняем массив `prefix_zeros`.

3. **Обработка запросов**:
   - Для каждого запроса `[l, r)` количество нулей вычисляется как `prefix_zeros[r] - prefix_zeros[l]`.



In [4]:
def build_prefix_zeros(nums):
    prefix_zeros = [0] * (len(nums) + 1)
    for i in range(1, len(nums) + 1):
        prefix_zeros[i] = prefix_zeros[i - 1]
        if nums[i - 1] == 0:
            prefix_zeros[i] += 1
    return prefix_zeros

def count_zeroes_optimized(prefix_zeros, l, r):
    return prefix_zeros[r] - prefix_zeros[l]

# Пример использования
nums = [1, 0, 5, 0, 0, 3, 0, 9]
queries = [(1, 4), (2, 6), (0, 8)]

prefix_zeros = build_prefix_zeros(nums)

for l, r in queries:
    result = count_zeroes_optimized(prefix_zeros, l, r)
    print(f"Количество нулей на подотрезке [{l}, {r}): {result}")

Количество нулей на подотрезке [1, 4): 2
Количество нулей на подотрезке [2, 6): 2
Количество нулей на подотрезке [0, 8): 4


### Условие задачи

Дан массив чисел длиной \( N \). Необходимо найти количество подотрезков (отрезков с непрерывными элементами) с нулевой суммой.

### Описание алгоритма

#### Решение за \( O(N) \) с использованием префиксных сумм:

1. **Префиксные суммы:**
   - Вычисляем префиксные суммы для массива `nums`. Префиксная сумма на позиции `i` равна сумме всех элементов массива от начала до `i`.
   - Используем словарь `prefixsumbyvalue`, где ключами являются значения префиксных сумм, а значениями — количество раз, которое каждая префиксная сумма встречается.

2. **Подсчет количества отрезков с нулевой суммой:**
   - Для каждой префиксной суммы `nowsum` из словаря `prefixsumbyvalue` вычисляем количество способов выбрать два различных индекса `i` и `j` таких, что префиксные суммы на этих индексах равны `nowsum`. Это количество равно \( \frac{\text{cntsum} \cdot (\text{cntsum} - 1)}{2} \), где `cntsum` — количество раз, которое встречается префиксная сумма `nowsum`.

3. **Временная сложность:**
   - Построение префиксных сумм занимает \( O(N) \).
   - Подсчет количества отрезков с нулевой суммой также занимает \( O(N) \), так как мы проходимся по словарю `prefixsumbyvalue`.
   - Общая временная сложность алгоритма составляет \( O(N) \).


In [5]:
def count_zero_sum_ranges(nums):
    # Step 1: Calculate prefix sums and store their frequencies in a dictionary
    prefixsumbyvalue = {0: 1}
    nowsum = 0
    for now in nums:
        nowsum += now
        if nowsum not in prefixsumbyvalue:
            prefixsumbyvalue[nowsum] = 0
        prefixsumbyvalue[nowsum] += 1

    # Step 2: Count zero sum ranges using prefix sum frequencies
    cntranges = 0
    for nowsum in prefixsumbyvalue:
        cntsum = prefixsumbyvalue[nowsum]
        cntranges += cntsum * (cntsum - 1) // 2

    return cntranges

# Пример использования
nums = [2, -3, 1, 0, 4, -1]
result = count_zero_sum_ranges(nums)
print(f"Количество отрезков с нулевой суммой: {result}")

Количество отрезков с нулевой суммой: 3


### Условие задачи

Дан отсортированный массив целых чисел `sortednums` и число `k`. Необходимо найти количество уникальных пар `(i, j)` таких, что `0 <= i < j < len(sortednums)` и `sortednums[j] - sortednums[i] > k`.

### Описание алгоритма

1. **Итерация по элементам:**
   - Используется два указателя: `first` (начало потенциальной пары) и `last` (конец потенциальной пары).
   - `first` перебирает каждый элемент массива `sortednums` по очереди.

2. **Нахождение подходящих пар:**
   - Для текущего `first` увеличиваем `last`, пока разница между `sortednums[last]` и `sortednums[first]` не превышает `k`.
   - Количество подходящих пар для текущего `first` вычисляется как `len(sortednums) - last`. Это работает потому, что все элементы `sortednums[last]`, где `last >= j`, удовлетворяют условию `sortednums[last] - sortednums[first] > k`.

3. **Суммирование количества пар:**
   - Добавляем количество найденных пар для текущего `first` к общему счетчику `cntpairs`.

4. **Возвращение результата:**
   - Возвращаем общее количество найденных пар `cntpairs`.


In [9]:
def count_pairs_with_difference_greater_than_k(sortednums, k):
    cntpairs = 0
    last = 0
    for first in range(len(sortednums)):
        while last < len(sortednums) and sortednums[last] - sortednums[first] <= k:
            last += 1
        cntpairs += len(sortednums) - last
    return cntpairs

# Пример использования
sortednums = [1, 3, 5, 7, 8]
k = 4
result = count_pairs_with_difference_greater_than_k(sortednums, k)
print(f"Количество пар с разницей больше {k}: {result}")

Количество пар с разницей больше 4: 3


### Условие задачи

Дан массив `players`, где каждый элемент представляет собой силу игрока. Необходимо найти максимальную сумму подмассива `players[i:j]`, где для любых двух последовательных игроков `players[k]` и `players[k+1]`, выполняется условие `players[k] + players[k+1] >= players[k+2]`.

### Описание алгоритма

1. **Итерация по элементам:**
   - Используем два указателя: `first` (начало потенциального подмассива) и `last` (конец текущего подмассива).
   - `first` перебирает каждый элемент массива `players` по очереди.

2. **Накопление текущей суммы:**
   - Для каждого `first`, `last` увеличивается до тех пор, пока условие `players[first] + players[first+1] >= players[last]` выполняется или `last` не достигнет конца массива.

3. **Обновление лучшей суммы:**
   - Если текущая сумма `nowsum` (сумма элементов от `first` до `last-1`) больше текущей `bestsum`, обновляем `bestsum`.

4. **Сдвиг `first` и обновление `nowsum`:**
   - После того как условие не выполнено для текущего `first`, вычитаем `players[first]` из `nowsum`, чтобы перейти к следующему `first`.

5. **Возврат результата:**
   - В конце возвращаем `bestsum`, который и будет максимальной суммой подмассива, удовлетворяющего условию.



In [11]:
def best_team_sum(players):
    bestsum = 0
    nowsum = 0
    last = 0

    for first in range(len(players)):
        while last < len(players) and (last == first or players[first] + players[first + 1] >= players[last]):
            nowsum += players[last]
            last += 1
        bestsum = max(bestsum, nowsum)
        nowsum -= players[first]

    return bestsum

# Пример использования
players = [1, 3, 5, 2, 4, 6]
result = best_team_sum(players)
print(f"Максимальная сумма для лучшей команды: {result}")  # Ожидаемый вывод: 12

Максимальная сумма для лучшей команды: 20


**Объяснение работы**

- В примере выше, для массива `players = [1, 3, 5, 2, 4, 6]`:
  - На первом шаге `first = 0`. Подмассив `[1, 3]` удовлетворяет условию (1 + 3 >= 5), поэтому `nowsum = 4`.
  - На втором шаге `first = 1`. Подмассив `[3, 5]` также удовлетворяет условию (3 + 5 >= 2), поэтому `nowsum = 12`, что является максимальной суммой для лучшей команды.

Этот алгоритм эффективно находит максимальную сумму подмассива, удовлетворяющего условию задачи, за время \( O(N) \), где \( N \) — длина массива `players`, благодаря эффективному использованию двух указателей.

### Условие задачи

Даны две отсортированные последовательности чисел (длиной N и М соответственно)
Необходимо слить их в одну отсортированную последовательность.

### Описание алгоритма

Данная функция `merge(nums1, nums2)` сливает два отсортированных массива `nums1` и `nums2` в один отсортированный массив `merged`.

1. **Инициализация переменных:**
   - `merged` инициализируется массивом нулей длины, равной суммарной длине `nums1` и `nums2`.
   - `first1` и `first2` — указатели на начало `nums1` и `nums2` соответственно, инициализируются нулевыми значениями.

2. **Слияние массивов:**
   - Используется переменная `k` для отслеживания текущей позиции в массиве `merged`.
   - Пока один из указателей (`first1` или `first2`) не достиг конца своего массива:
     - Если `first1` указывает на элемент `nums1`, который меньше или равен элементу `nums2`, на который указывает `first2`, этот элемент добавляется в `merged`, и `first1` сдвигается на следующий элемент в `nums1`.
     - В противном случае, если элемент `nums2[first2]` меньше, чем `nums1[first1]`, он добавляется в `merged`, и `first2` сдвигается на следующий элемент в `nums2`.

3. **Обработка оставшихся элементов:**
   - Если в одном из массивов (`nums1` или `nums2`) остались элементы после завершения основного цикла, они добавляются в `merged` с помощью дополнительного цикла `while`.

4. **Возврат результата:**
   - Возвращается массив `merged`, содержащий объединение отсортированных массивов `nums1` и `nums2`.

In [18]:
def merge(nums1, nums2):
    merged = [0] * (len(nums1) + len(nums2))  # Создаем массив для объединенных результатов
    first1 = first2 = 0  # Указатели на начало nums1 и nums2

    # Итерируемся по merged и сравниваем элементы из nums1 и nums2
    for k in range(len(nums1) + len(nums2)):
        if first1 < len(nums1) and (first2 >= len(nums2) or nums1[first1] <= nums2[first2]):
            merged[k] = nums1[first1]  # Добавляем элемент из nums1 в merged
            first1 += 1  # Сдвигаем указатель первого массива
        else:
            merged[k] = nums2[first2]  # Добавляем элемент из nums2 в merged
            first2 += 1  # Сдвигаем указатель второго массива

    return merged

# Пример использования
nums1 = [1, 3, 5, 7]
nums2 = [2, 4, 6, 8, 9]
result = merge(nums1, nums2)
print("Объединенный отсортированный массив:", result)

Объединенный отсортированный массив: [1, 2, 3, 4, 5, 6, 7, 8, 9]
