# Введение в алгоритмы


## RAM-модель


**Определение:** RAM (Random Access Machine) — теоретическая модель вычислений, используемая для анализа алгоритмов. В рамках этой модели:

1. Память представляет собой бесконечную последовательность ячеек с произвольным доступом, индексируемую с $0$.
2. Каждая простая операция (арифметическая, логическая, битовая, доступ к памяти) выполняется за один временной шаг.
3. Циклы и подпрограммы не считаются простыми операциями и их время выполнения зависит от количества выполняемых в них простых операций.

RAM-модель является абстракцией, которая упрощает анализ алгоритмов, абстрагируясь от особенностей конкретных компьютерных архитектур. Несмотря на свою простоту, она достаточно хорошо отражает реальное поведение алгоритмов на современных компьютерах.

### Временная сложность в RAM-модели

**Определение:** Временная сложность алгоритма в RAM-модели — это количество элементарных операций, выполняемых алгоритмом как функция от размера входных данных.

**Теорема:** В RAM-модели время работы алгоритма пропорционально количеству выполненных элементарных операций.
$\square$
По определению RAM-модели, каждая элементарная операция выполняется за константное время. Пусть алгоритм выполняет $n$ элементарных операций. Тогда общее время работы алгоритма будет $T(n) = \sum_{i=1}^{n} c_i$, где $c_i$ — время выполнения $i$-й операции. Поскольку все $c_i$ константы, $T(n) = \Theta(n)$.
$\blacksquare$

Элементарные операции в RAM-модели включают:
1. **Арифметические операции**: сложение, вычитание, умножение, деление, остаток от деления
2. **Логические операции**: AND, OR, NOT, XOR
3. **Битовые операции**: сдвиги, побитовые операции
4. **Операции доступа к памяти**: чтение и запись значений
5. **Операции сравнения**: равенство, неравенство, больше, меньше

Каждая из этих операций считается выполняемой за константное время, независимо от размера операндов.

### Пространственная сложность в RAM-модели

**Определение:** Пространственная сложность алгоритма в RAM-модели — это количество ячеек памяти, используемых алгоритмом как функция от размера входных данных.

Пространственная сложность включает:
1. **Входные данные**: память, необходимая для хранения входных данных
2. **Вспомогательная память**: дополнительная память, необходимая для работы алгоритма
3. **Выходные данные**: память, необходимая для хранения результатов работы алгоритма

**Теорема:** Для большинства алгоритмов существует соотношение между временной и пространственной сложностью: $S(n) \leq T(n)$, где $S(n)$ — пространственная сложность, $T(n)$ — временная сложность.
$\square$
Алгоритм не может использовать больше памяти, чем он может адресовать за время своей работы. Каждая операция доступа к памяти требует времени, поэтому количество используемых ячеек памяти не может превышать количество выполненных операций.
$\blacksquare$

### Варианты RAM-модели

#### 1. Стандартная RAM-модель (Uniform Cost Model)
В стандартной RAM-модели предполагается, что все элементарные операции выполняются за константное время, независимо от размера операндов. Это упрощение полезно для анализа алгоритмов, работающих с данными фиксированного размера (например, 32-битные или 64-битные целые числа).

#### 2. Логарифмическая стоимость (Logarithmic Cost Model)
В этой модели стоимость операции зависит от размера операндов. Если операнды имеют размер $w$ бит, то стоимость операции пропорциональна $\log w$. Эта модель более реалистична для алгоритмов, работающих с большими числами.

**Теорема:** В логарифмической модели стоимости, время выполнения операции с числом размера $w$ бит составляет $\Theta(\log w)$.
$\square$
Для выполнения операции над числом размера $w$ бит, процессору необходимо обработать все $w$ бит. В реальных компьютерах процессор обрабатывает фиксированное количество бит за одну операцию (например, 64 бита). Следовательно, для обработки числа размера $w$ бит потребуется $\Theta(\lceil w/64 \rceil) = \Theta(\lceil \log_2 n / 64 \rceil) = \Theta(\log n)$ операций, где $n$ — значение числа.
$\blacksquare$

#### 3. PRAM (Parallel Random Access Machine)
PRAM — расширение RAM-модели для параллельных вычислений. В этой модели несколько процессоров имеют доступ к общей памяти. В зависимости от правил доступа к памяти, различают несколько вариантов PRAM:

- **EREW PRAM (Exclusive Read Exclusive Write)**: Каждая ячейка памяти может быть прочитана или записана только одним процессором за один шаг.
- **CREW PRAM (Concurrent Read Exclusive Write)**: Несколько процессоров могут читать из одной ячейки памяти одновременно, но только один процессор может записывать в ячейку за один шаг.
- **ERCW PRAM (Exclusive Read Concurrent Write)**: Только один процессор может читать из ячейки за один шаг, но несколько процессоров могут записывать в одну ячейку одновременно.
- **CRCW PRAM (Concurrent Read Concurrent Write)**: Несколько процессоров могут читать и записывать в одну ячейку памяти одновременно.

Для CRCW PRAM существуют различные правила разрешения конфликтов при одновременной записи:
- **Common**: Все процессоры должны записывать одно и то же значение.
- **Arbitrary**: Один из процессоров произвольно выбирается для выполнения записи.
- **Priority**: Процессор с наименьшим индексом выполняет запись.
- **Sum**: В ячейку записывается сумма всех значений, которые процессоры пытаются записать.

#### 4. Внешняя память (External Memory Model)
Модель внешней памяти учитывает иерархию памяти в современных компьютерах. В этой модели данные перемещаются между быстрой памятью ограниченного размера (кэш) и медленной памятью большого размера (диск) блоками фиксированного размера.

**Определение:** В модели внешней памяти, стоимость алгоритма измеряется количеством передач блоков данных между различными уровнями памяти.

#### 5. Модель с ограничением по размеру слова (Word RAM Model)
В этой модели размер слова памяти ограничен $w$ битами, где $w \geq \log n$, и $n$ — размер входных данных. Эта модель более реалистично отражает ограничения реальных компьютеров.

### Применение RAM-модели для анализа алгоритмов

RAM-модель позволяет анализировать алгоритмы, абстрагируясь от особенностей конкретных компьютерных архитектур. Основные шаги анализа:

1. **Определение размера входных данных**: Например, для алгоритмов сортировки это количество элементов в массиве.
2. **Подсчет элементарных операций**: Определение количества арифметических операций, операций сравнения, доступа к памяти и т.д.
3. **Выражение количества операций как функции от размера входных данных**: Например, $T(n) = n^2$ для алгоритма сортировки вставками.
4. **Асимптотический анализ**: Определение асимптотической сложности алгоритма с использованием O-нотации, Ω-нотации и Θ-нотации.


In [None]:
# Пример алгоритма, анализируемого в RAM-модели: подсчет количества операций
def count_operations(n):
    """
    Функция, демонстрирующая подсчет операций в RAM-модели

    Аргументы:
    n -- размер входных данных

    Возвращает:
    Количество выполненных элементарных операций
    """
    operations = 0

    # Инициализация переменных (2 операции)
    sum_value = 0  # 1 операция
    operations += 1

    # Цикл от 1 до n
    for i in range(1, n + 1):  # n итераций
        # Проверка условия цикла (1 операция на итерацию)
        operations += 1

        # Увеличение суммы (2 операции на итерацию: чтение и запись)
        sum_value += i
        operations += 2

        # Проверка условия (1 операция на итерацию)
        if i % 2 == 0:
            operations += 1

            # Внутренний цикл (выполняется n/2 раз)
            for j in range(1, 10):
                # Проверка условия внутреннего цикла (1 операция)
                operations += 1

                # Операция внутри цикла (1 операция)
                sum_value += 1
                operations += 1

    return operations

# Пример использования
n_values = [10, 100, 1000]
for n in n_values:
    ops = count_operations(n)
    print(f"Для n = {n}, количество операций: {ops}")


## Введение


**Определение:** Алгоритм — это конечная последовательность точно определённых инструкций, описывающих порядок действий исполнителя для решения некоторой задачи за конечное число шагов.

В рамках RAM-модели, алгоритм можно определить как последовательность элементарных операций, выполняемых над данными, хранящимися в памяти. Формально, алгоритм можно представить как вычислимую функцию $f: \Sigma^* \rightarrow \Sigma^*$, где $\Sigma^*$ — множество всех конечных строк над некоторым конечным алфавитом $\Sigma$.

Алгоритмы обладают следующими фундаментальными свойствами:
1. **Дискретность** — алгоритм должен представлять процесс решения задачи как последовательное выполнение простых шагов (элементарных операций в RAM-модели).
2. **Детерминированность** — каждый шаг алгоритма должен быть строго и недвусмысленно определён.
3. **Конечность** — алгоритм должен завершаться за конечное число шагов (элементарных операций).
4. **Массовость** — алгоритм должен решать не одну конкретную задачу, а некоторый класс задач данного типа.
5. **Результативность** — алгоритм должен приводить к решению задачи за конечное число шагов.


## Классификация алгоритмов


### По характеру решения

1. **Точные алгоритмы** — алгоритмы, для которых доказано, что они выдают наилучшее (оптимальное) решение.

   _Пример:_ Алгоритм Дейкстры для нахождения кратчайшего пути в графе с неотрицательными весами рёбер.

2. **Приближенные алгоритмы** — алгоритмы, для которых известна величина $|C - C'| < \varepsilon$, где $C$ — оптимальное решение, $C'$ — приближенное решение, $\varepsilon$ — погрешность.

   _Пример:_ Жадный алгоритм для задачи о рюкзаке, который не всегда даёт оптимальное решение, но обеспечивает решение с гарантированной точностью.

3. **Эвристические алгоритмы** — алгоритмы, которые работают на практике, но для которых не существует строгого математического доказательства их эффективности или оптимальности.

   _Пример:_ Генетические алгоритмы, алгоритмы локального поиска для NP-трудных задач.

4. **Вероятностные алгоритмы** — алгоритмы, использующие генератор случайных чисел и дающие правильный ответ с вероятностью $p > 0$.

   _Пример:_ Алгоритм Рабина-Карпа для поиска подстроки, алгоритм Монте-Карло для вычисления определённых интегралов.


In [None]:
# Пример вероятностного алгоритма: проверка числа на простоту методом Миллера-Рабина
import random

def miller_rabin_test(n, k=5):
    """
    Проверка числа на простоту методом Миллера-Рабина

    Аргументы:
    n -- проверяемое число
    k -- количество проверок (влияет на вероятность правильного ответа)

    Возвращает:
    True, если число вероятно простое
    False, если число составное
    """
    if n <= 1:
        return False
    if n <= 3:
        return True
    if n % 2 == 0:
        return False

    # Представляем n-1 в виде 2^r * d
    r, d = 0, n - 1
    while d % 2 == 0:
        r += 1
        d //= 2

    # Проводим k тестов
    for _ in range(k):
        a = random.randint(2, n - 2)
        x = pow(a, d, n)
        if x == 1 or x == n - 1:
            continue
        for _ in range(r - 1):
            x = pow(x, 2, n)
            if x == n - 1:
                break
        else:
            return False
    return True

# Пример использования
print("Проверка чисел на простоту:")
for num in [2, 3, 17, 19, 21, 119, 1000003]:
    print(f"{num} вероятно простое: {miller_rabin_test(num)}")


### По порядку выполнения

1. **Последовательные алгоритмы** — алгоритмы, в которых операции выполняются одна за другой.

   _Пример:_ Классический алгоритм сортировки вставками.

2. **Параллельные алгоритмы** — алгоритмы, в которых несколько операций могут выполняться одновременно.

   _Пример:_ Параллельная сортировка слиянием, параллельное умножение матриц.


In [None]:
# Пример последовательного алгоритма: сортировка вставками
def insertion_sort(arr):
    """
    Сортировка массива методом вставок

    Аргументы:
    arr -- сортируемый массив

    Возвращает:
    Отсортированный массив
    """
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and arr[j] > key:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key
    return arr

# Пример использования
arr = [12, 11, 13, 5, 6]
print("Исходный массив:", arr)
sorted_arr = insertion_sort(arr.copy())
print("Отсортированный массив:", sorted_arr)


### По определенности

1. **Детерминированные алгоритмы** — алгоритмы, в которых каждый шаг и результат однозначно определены, и при одних и тех же входных данных всегда получается один и тот же результат.

   _Пример:_ Алгоритм бинарного поиска, алгоритм Евклида для нахождения НОД.

2. **Рандомизированные алгоритмы** — алгоритмы, использующие генератор случайных чисел для принятия решений в процессе выполнения.

   _Пример:_ Быстрая сортировка с случайным выбором опорного элемента, рандомизированный алгоритм поиска медианы.


In [None]:
# Пример детерминированного алгоритма: алгоритм Евклида для нахождения НОД
def gcd(a, b):
    """
    Нахождение наибольшего общего делителя двух чисел

    Аргументы:
    a, b -- числа, для которых ищется НОД

    Возвращает:
    Наибольший общий делитель a и b
    """
    while b:
        a, b = b, a % b
    return a

# Пример использования
a, b = 48, 18
print(f"НОД({a}, {b}) = {gcd(a, b)}")

# Пример рандомизированного алгоритма: быстрая сортировка с случайным выбором опорного элемента
def quick_sort(arr):
    """
    Быстрая сортировка массива с случайным выбором опорного элемента

    Аргументы:
    arr -- сортируемый массив

    Возвращает:
    Отсортированный массив
    """
    if len(arr) <= 1:
        return arr

    # Случайный выбор опорного элемента
    pivot_idx = random.randint(0, len(arr) - 1)
    pivot = arr[pivot_idx]

    # Разделение массива
    less = [x for i, x in enumerate(arr) if x <= pivot and i != pivot_idx]
    greater = [x for x in arr if x > pivot]

    # Рекурсивная сортировка и объединение
    return quick_sort(less) + [pivot] + quick_sort(greater)

# Пример использования
arr = [10, 7, 8, 9, 1, 5]
print("Исходный массив:", arr)
sorted_arr = quick_sort(arr)
print("Отсортированный массив:", sorted_arr)


## Типы задач в алгоритмике


### Задача принятия решения

**Определение:** Задача принятия решения (Decision problem) — это задача, ответом на которую является "да" или "нет". Формально, это функция $f: \Sigma^* \rightarrow \{True, False\}$.

_Пример:_ Проверка графа на связность, проверка числа на простоту, проверка принадлежности элемента множеству.


In [None]:
# Пример задачи принятия решения: проверка графа на связность
def is_connected(graph):
    """
    Проверка графа на связность с помощью поиска в глубину

    Аргументы:
    graph -- словарь, представляющий граф (ключи - вершины, значения - списки смежных вершин)

    Возвращает:
    True, если граф связный
    False, если граф несвязный
    """
    if not graph:
        return True

    # Выбираем произвольную вершину
    start_vertex = next(iter(graph))

    # Множество посещенных вершин
    visited = set()

    # Поиск в глубину
    def dfs(vertex):
        visited.add(vertex)
        for neighbor in graph.get(vertex, []):
            if neighbor not in visited:
                dfs(neighbor)

    # Запускаем DFS из начальной вершины
    dfs(start_vertex)

    # Проверяем, что все вершины были посещены
    return len(visited) == len(graph)

# Пример использования
# Связный граф
connected_graph = {
    0: [1, 2],
    1: [0, 2],
    2: [0, 1, 3],
    3: [2]
}

# Несвязный граф
disconnected_graph = {
    0: [1],
    1: [0],
    2: [3],
    3: [2]
}

print("Связный граф связен:", is_connected(connected_graph))
print("Несвязный граф связен:", is_connected(disconnected_graph))


### Сертификат решения

**Определение:** Сертификат решения (Solution certificate) — это набор данных, позволяющий эффективно проверить корректность решения задачи.

_Пример:_ При проверке наличия пути между вершинами $u$ и $v$ в графе, сертификатом будет являться сам путь. При проверке составности числа, сертификатом будет являться его нетривиальный делитель.

**Теорема:** Для любой задачи из класса NP существует полиномиальный алгоритм проверки сертификата решения.
$\square$
По определению, задача принадлежит классу NP, если существует недетерминированная машина Тьюринга, решающая эту задачу за полиномиальное время. Это эквивалентно тому, что существует полиномиальный алгоритм проверки сертификата решения.

Формально, задача $L$ принадлежит NP, если существует полиномиальный алгоритм $V$ и полином $p$ такие, что для любого входа $x$:
- Если $x \in L$, то существует строка $y$ длины не более $p(|x|)$ такая, что $V(x, y) = 1$.
- Если $x \not\in L$, то для любой строки $y$ длины не более $p(|x|)$ выполняется $V(x, y) = 0$.

Здесь $y$ и есть сертификат решения, а $V$ — алгоритм проверки сертификата.
$\blacksquare$


In [None]:
# Пример проверки сертификата решения: проверка пути в графе
def verify_path(graph, start, end, path):
    """
    Проверка, является ли последовательность вершин путем от start до end в графе

    Аргументы:
    graph -- словарь, представляющий граф
    start -- начальная вершина
    end -- конечная вершина
    path -- последовательность вершин (сертификат)

    Возвращает:
    True, если path является путем от start до end
    False, в противном случае
    """
    # Проверяем, что путь начинается с start и заканчивается на end
    if not path or path[0] != start or path[-1] != end:
        return False

    # Проверяем, что каждая пара последовательных вершин соединена ребром
    for i in range(len(path) - 1):
        if path[i+1] not in graph.get(path[i], []):
            return False

    return True

# Пример использования
graph = {
    0: [1, 2],
    1: [0, 2, 3],
    2: [0, 1, 3],
    3: [1, 2]
}

start, end = 0, 3
valid_path = [0, 1, 3]
invalid_path = [0, 2, 0, 3]

print(f"Путь {valid_path} от {start} до {end} верен:", verify_path(graph, start, end, valid_path))
print(f"Путь {invalid_path} от {start} до {end} верен:", verify_path(graph, start, end, invalid_path))


### Задача оптимизации

**Определение:** Задача оптимизации (Optimization problem) — это задача нахождения такого решения из множества допустимых решений, которое максимизирует или минимизирует заданную целевую функцию.

Формально, задача оптимизации может быть представлена как:
- Множество допустимых решений $X$
- Целевая функция $f: X \rightarrow \mathbb{R}$
- Задача: найти $x^* \in X$ такое, что $f(x^*) = \min_{x \in X} f(x)$ (для задачи минимизации) или $f(x^*) = \max_{x \in X} f(x)$ (для задачи максимизации)

_Пример:_ Задача о кратчайшем пути, задача о максимальном потоке, задача о рюкзаке.


In [None]:
# Пример задачи оптимизации: задача о рюкзаке (жадный алгоритм для дробного рюкзака)
def fractional_knapsack(items, capacity):
    """
    Решение задачи о дробном рюкзаке

    Аргументы:
    items -- список кортежей (стоимость, вес)
    capacity -- вместимость рюкзака

    Возвращает:
    Максимальная суммарная стоимость предметов, которые можно положить в рюкзак
    """
    # Сортируем предметы по удельной стоимости (стоимость/вес) в убывающем порядке
    items_sorted = sorted(items, key=lambda x: x[0]/x[1], reverse=True)

    total_value = 0
    remaining_capacity = capacity

    for value, weight in items_sorted:
        if remaining_capacity >= weight:
            # Берем предмет целиком
            total_value += value
            remaining_capacity -= weight
        else:
            # Берем часть предмета
            fraction = remaining_capacity / weight
            total_value += value * fraction
            break

    return total_value

# Пример использования
items = [(60, 10), (100, 20), (120, 30)]  # (стоимость, вес)
capacity = 50
print(f"Максимальная стоимость для рюкзака вместимостью {capacity}:", fractional_knapsack(items, capacity))


### Offline и Online алгоритмы

**Определение:** Offline алгоритм — алгоритм, который имеет доступ ко всем входным данным перед началом работы.

**Определение:** Online алгоритм — алгоритм, который получает входные данные последовательно и должен принимать решения на основе уже полученных данных, без знания будущих входных данных.

**Теорема:** Для многих задач оптимизации online алгоритмы не могут достичь оптимального решения, которое может быть найдено offline алгоритмом.
$\square$
Рассмотрим задачу планирования страниц памяти (page replacement problem). В этой задаче необходимо решить, какую страницу удалить из кэша при его заполнении.

Оптимальный offline алгоритм (алгоритм Белади) удаляет страницу, которая не будет использоваться дольше всего в будущем. Этот алгоритм требует знания всей последовательности обращений к страницам заранее.

Любой online алгоритм, не имеющий информации о будущих обращениях, может быть вынужден удалить страницу, которая потребуется в ближайшем будущем, что приведет к дополнительному промаху кэша.

Можно доказать, что для любого online алгоритма существует последовательность обращений, на которой он будет работать хуже, чем оптимальный offline алгоритм. Конкретно, для задачи планирования страниц памяти с кэшем размера $k$, конкурентное отношение (competitive ratio) любого детерминированного online алгоритма не может быть лучше $k$.
$\blacksquare$


In [None]:
# Пример online алгоритма: алгоритм LRU (Least Recently Used) для кэширования
class LRUCache:
    """
    Реализация кэша с политикой вытеснения LRU (Least Recently Used)
    """
    def __init__(self, capacity):
        """
        Инициализация кэша

        Аргументы:
        capacity -- емкость кэша
        """
        self.capacity = capacity
        self.cache = {}  # словарь для хранения значений
        self.usage_order = []  # список для отслеживания порядка использования

    def get(self, key):
        """
        Получение значения из кэша

        Аргументы:
        key -- ключ

        Возвращает:
        Значение, если ключ в кэше, иначе -1
        """
        if key in self.cache:
            # Обновляем порядок использования
            self.usage_order.remove(key)
            self.usage_order.append(key)
            return self.cache[key]
        return -1

    def put(self, key, value):
        """
        Добавление значения в кэш

        Аргументы:
        key -- ключ
        value -- значение
        """
        if key in self.cache:
            # Обновляем порядок использования
            self.usage_order.remove(key)
        elif len(self.cache) >= self.capacity:
            # Удаляем наименее недавно использованный элемент
            oldest_key = self.usage_order.pop(0)
            del self.cache[oldest_key]

        # Добавляем новый элемент
        self.cache[key] = value
        self.usage_order.append(key)

# Пример использования
cache = LRUCache(2)  # кэш емкостью 2
cache.put(1, 1)
cache.put(2, 2)
print("get(1):", cache.get(1))  # возвращает 1
cache.put(3, 3)  # вытесняет ключ 2
print("get(2):", cache.get(2))  # возвращает -1 (не найден)
print("get(3):", cache.get(3))  # возвращает 3


## Доказательство корректности работы алгоритмов


Существует несколько основных методов доказательства корректности алгоритмов:

### Доказательство от противного

При доказательстве от противного мы предполагаем, что алгоритм не корректен, и приходим к противоречию.

**Пример:** Докажем корректность алгоритма бинарного поиска.
$\square$
Предположим, что алгоритм бинарного поиска некорректен, т.е. существует отсортированный массив $A$ и элемент $x \in A$, который алгоритм не находит.

Пусть $l$ и $r$ — указатели на левую и правую границы текущего рассматриваемого отрезка. Изначально $l = 0$, $r = n-1$, где $n$ — размер массива.

На каждой итерации алгоритм проверяет средний элемент $A[mid]$, где $mid = \lfloor (l + r) / 2 \rfloor$. Если $A[mid] = x$, алгоритм завершается успешно. Если $A[mid] < x$, то $l = mid + 1$. Если $A[mid] > x$, то $r = mid - 1$.

Поскольку массив отсортирован, если $x \in A$, то $x$ должен находиться в отрезке $[l, r]$ на каждой итерации. Но размер этого отрезка уменьшается как минимум вдвое на каждой итерации, поэтому через конечное число итераций либо будет найден элемент $x$, либо отрезок станет пустым ($l > r$), что означает, что $x \not\in A$.

Это противоречит нашему предположению, что $x \in A$ и алгоритм его не находит. Следовательно, алгоритм бинарного поиска корректен.
$\blacksquare$

### Доказательство по индукции

При доказательстве по индукции мы доказываем базовый случай, а затем показываем, что если утверждение верно для $n$, то оно верно и для $n+1$.

**Пример:** Докажем корректность алгоритма сортировки вставками.
$\square$
Будем доказывать, что после $i$-й итерации внешнего цикла подмассив $A[0...i]$ отсортирован.

База индукции: $i = 0$. Подмассив из одного элемента $A[0]$ тривиально отсортирован.

Индукционный переход: Предположим, что после $(i-1)$-й итерации подмассив $A[0...i-1]$ отсортирован. На $i$-й итерации мы вставляем элемент $A[i]$ в правильную позицию в отсортированном подмассиве $A[0...i-1]$. После этой операции подмассив $A[0...i]$ будет отсортирован.

По принципу математической индукции, после $(n-1)$-й итерации весь массив $A[0...n-1]$ будет отсортирован.
$\blacksquare$

### Доказательство по инварианту

При доказательстве по инварианту мы формулируем утверждение (инвариант), которое должно быть истинным до и после каждой итерации цикла.

**Пример:** Докажем корректность алгоритма Евклида для нахождения НОД.
$\square$
Инвариант: $\text{НОД}(a, b) = \text{НОД}(a', b')$, где $(a', b')$ — значения переменных после итерации.

Изначально $(a, b)$ — исходные числа, для которых мы хотим найти НОД.

На каждой итерации алгоритм выполняет операцию $a, b = b, a \bmod b$.

Докажем, что $\text{НОД}(a, b) = \text{НОД}(b, a \bmod b)$.

Пусть $d = \text{НОД}(a, b)$. Тогда $a = d \cdot k_1$ и $b = d \cdot k_2$ для некоторых целых $k_1$ и $k_2$.

Представим $a \bmod b$ как $a - b \cdot \lfloor a / b \rfloor = d \cdot k_1 - d \cdot k_2 \cdot \lfloor a / b \rfloor = d \cdot (k_1 - k_2 \cdot \lfloor a / b \rfloor)$.

Таким образом, $d$ делит $a \bmod b$, и $d$ — общий делитель $b$ и $a \bmod b$.

Теперь докажем, что $d$ — наибольший общий делитель $b$ и $a \bmod b$.

Пусть $d'$ — общий делитель $b$ и $a \bmod b$. Тогда $b = d' \cdot m_1$ и $a \bmod b = d' \cdot m_2$ для некоторых целых $m_1$ и $m_2$.

Из $a = b \cdot \lfloor a / b \rfloor + (a \bmod b)$ следует, что $a = d' \cdot m_1 \cdot \lfloor a / b \rfloor + d' \cdot m_2 = d' \cdot (m_1 \cdot \lfloor a / b \rfloor + m_2)$.

Таким образом, $d'$ делит $a$, и $d'$ — общий делитель $a$ и $b$. Поскольку $d$ — наибольший общий делитель $a$ и $b$, то $d' \leq d$.

Но мы уже показали, что $d$ — общий делитель $b$ и $a \bmod b$, поэтому $d \leq d'$.

Следовательно, $d = d'$, и $\text{НОД}(a, b) = \text{НОД}(b, a \bmod b)$.

Алгоритм завершается, когда $b = 0$. В этом случае $\text{НОД}(a, 0) = a$, что верно, поскольку любое число делит 0, и наибольшим делителем $a$ является само $a$.

Таким образом, алгоритм Евклида корректно находит НОД двух чисел.
$\blacksquare$


In [None]:
# Пример алгоритма бинарного поиска
def binary_search(arr, x):
    """
    Бинарный поиск элемента в отсортированном массиве

    Аргументы:
    arr -- отсортированный массив
    x -- искомый элемент

    Возвращает:
    Индекс элемента в массиве, если он найден, иначе -1
    """
    left, right = 0, len(arr) - 1

    while left <= right:
        mid = (left + right) // 2

        # Проверяем средний элемент
        if arr[mid] == x:
            return mid

        # Если x больше, игнорируем левую половину
        elif arr[mid] < x:
            left = mid + 1

        # Если x меньше, игнорируем правую половину
        else:
            right = mid - 1

    # Элемент не найден
    return -1

# Пример использования
arr = [2, 3, 4, 10, 40]
x = 10
result = binary_search(arr, x)
if result != -1:
    print(f"Элемент {x} найден по индексу {result}")
else:
    print(f"Элемент {x} не найден в массиве")


## Асимптотический анализ алгоритмов


Асимптотический анализ — это метод оценки эффективности алгоритмов с точки зрения их времени выполнения и использования памяти в зависимости от размера входных данных, когда этот размер стремится к бесконечности.

### Основные асимптотические обозначения

1. **O-нотация (верхняя граница)**:
   $f(n) = O(g(n))$, если существуют положительные константы $c$ и $n_0$ такие, что $0 \leq f(n) \leq c \cdot g(n)$ для всех $n \geq n_0$.

2. **Ω-нотация (нижняя граница)**:
   $f(n) = \Omega(g(n))$, если существуют положительные константы $c$ и $n_0$ такие, что $0 \leq c \cdot g(n) \leq f(n)$ для всех $n \geq n_0$.

3. **Θ-нотация (точная граница)**:
   $f(n) = \Theta(g(n))$, если существуют положительные константы $c_1$, $c_2$ и $n_0$ такие, что $0 \leq c_1 \cdot g(n) \leq f(n) \leq c_2 \cdot g(n)$ для всех $n \geq n_0$.

4. **o-нотация (строго меньше)**:
   $f(n) = o(g(n))$, если для любой положительной константы $c$ существует константа $n_0$ такая, что $0 \leq f(n) < c \cdot g(n)$ для всех $n \geq n_0$.

5. **ω-нотация (строго больше)**:
   $f(n) = \omega(g(n))$, если для любой положительной константы $c$ существует константа $n_0$ такая, что $0 \leq c \cdot g(n) < f(n)$ для всех $n \geq n_0$.

### Свойства асимптотических обозначений

1. **Транзитивность**:
   - Если $f(n) = O(g(n))$ и $g(n) = O(h(n))$, то $f(n) = O(h(n))$.
   - Если $f(n) = \Omega(g(n))$ и $g(n) = \Omega(h(n))$, то $f(n) = \Omega(h(n))$.
   - Если $f(n) = \Theta(g(n))$ и $g(n) = \Theta(h(n))$, то $f(n) = \Theta(h(n))$.

2. **Рефлексивность**:
   - $f(n) = O(f(n))$
   - $f(n) = \Omega(f(n))$
   - $f(n) = \Theta(f(n))$

3. **Симметричность**:
   - $f(n) = \Theta(g(n))$ тогда и только тогда, когда $g(n) = \Theta(f(n))$

4. **Связь между обозначениями**:
   - $f(n) = \Theta(g(n))$ тогда и только тогда, когда $f(n) = O(g(n))$ и $f(n) = \Omega(g(n))$
   - Если $f(n) = o(g(n))$, то $f(n) = O(g(n))$
   - Если $f(n) = \omega(g(n))$, то $f(n) = \Omega(g(n))$

**Теорема:** Для любых двух функций $f(n)$ и $g(n)$ выполняется ровно одно из следующих соотношений: $f(n) = o(g(n))$, $f(n) = \Theta(g(n))$ или $f(n) = \omega(g(n))$.
$\square$
Рассмотрим предел $\lim_{n \to \infty} \frac{f(n)}{g(n)}$:

1. Если $\lim_{n \to \infty} \frac{f(n)}{g(n)} = 0$, то $f(n) = o(g(n))$.
2. Если $\lim_{n \to \infty} \frac{f(n)}{g(n)} = c$, где $0 < c < \infty$, то $f(n) = \Theta(g(n))$.
3. Если $\lim_{n \to \infty} \frac{f(n)}{g(n)} = \infty$, то $f(n) = \omega(g(n))$.

Поскольку предел (если он существует) может принимать только одно из этих трех значений, то и соотношение между функциями может быть только одним из трех указанных.
$\blacksquare$

### Основные классы сложности

1. **Константная сложность** — $O(1)$: Время выполнения не зависит от размера входных данных.
   _Пример:_ Доступ к элементу массива по индексу.

2. **Логарифмическая сложность** — $O(\log n)$: Время выполнения пропорционально логарифму размера входных данных.
   _Пример:_ Бинарный поиск в отсортированном массиве.

3. **Линейная сложность** — $O(n)$: Время выполнения пропорционально размеру входных данных.
   _Пример:_ Линейный поиск в массиве.

4. **Линейно-логарифмическая сложность** — $O(n \log n)$: Время выполнения пропорционально произведению размера входных данных на логарифм этого размера.
   _Пример:_ Эффективные алгоритмы сортировки (быстрая сортировка, сортировка слиянием).

5. **Квадратичная сложность** — $O(n^2)$: Время выполнения пропорционально квадрату размера входных данных.
   _Пример:_ Простые алгоритмы сортировки (сортировка пузырьком, сортировка вставками).

6. **Кубическая сложность** — $O(n^3)$: Время выполнения пропорционально кубу размера входных данных.
   _Пример:_ Наивное умножение матриц.

7. **Экспоненциальная сложность** — $O(2^n)$: Время выполнения пропорционально экспоненте от размера входных данных.
   _Пример:_ Рекурсивное вычисление чисел Фибоначчи, перебор всех подмножеств множества.

8. **Факториальная сложность** — $O(n!)$: Время выполнения пропорционально факториалу размера входных данных.
   _Пример:_ Перебор всех перестановок множества.


In [None]:
# Пример анализа сложности алгоритмов
import time
import matplotlib.pyplot as plt
import numpy as np

def constant_time(n):
    """Алгоритм с константной сложностью O(1)"""
    return 1

def logarithmic_time(n):
    """Алгоритм с логарифмической сложностью O(log n)"""
    count = 0
    i = n
    while i > 0:
        count += 1
        i //= 2
    return count

def linear_time(n):
    """Алгоритм с линейной сложностью O(n)"""
    count = 0
    for i in range(n):
        count += 1
    return count

def linearithmic_time(n):
    """Алгоритм с линейно-логарифмической сложностью O(n log n)"""
    count = 0
    for i in range(n):
        j = n
        while j > 0:
            count += 1
            j //= 2
    return count

def quadratic_time(n):
    """Алгоритм с квадратичной сложностью O(n^2)"""
    count = 0
    for i in range(n):
        for j in range(n):
            count += 1
    return count

# Измерение времени выполнения для разных размеров входных данных
def measure_time(func, n_values):
    times = []
    operations = []
    for n in n_values:
        start_time = time.time()
        ops = func(n)
        end_time = time.time()
        times.append(end_time - start_time)
        operations.append(ops)
    return times, operations

# Размеры входных данных
n_values = [10, 100, 1000, 10000]

# Измерение времени для разных алгоритмов
algorithms = [
    ("Константная сложность O(1)", constant_time),
    ("Логарифмическая сложность O(log n)", logarithmic_time),
    ("Линейная сложность O(n)", linear_time),
    ("Линейно-логарифмическая сложность O(n log n)", linearithmic_time)
]

# Построение графиков
plt.figure(figsize=(12, 8))

for i, (name, func) in enumerate(algorithms):
    times, operations = measure_time(func, n_values)
    plt.subplot(2, 2, i+1)
    plt.plot(n_values, times, 'o-', label='Время выполнения')
    plt.title(name)
    plt.xlabel('Размер входных данных (n)')
    plt.ylabel('Время выполнения (с)')
    plt.grid(True)
    plt.legend()

plt.tight_layout()
plt.show()

# Вывод количества операций для каждого алгоритма
for name, func in algorithms:
    _, operations = measure_time(func, n_values)
    print(f"{name}:")
    for n, ops in zip(n_values, operations):
        print(f"  n = {n}: {ops} операций")


## Заключение


В данном введении в алгоритмы мы рассмотрели основные понятия и методы анализа алгоритмов:

1. **Определение и свойства алгоритмов**: Дискретность, детерминированность, конечность, массовость, результативность.

2. **Классификация алгоритмов**: По характеру решения (точные, приближенные, эвристические, вероятностные), по порядку выполнения (последовательные, параллельные), по определенности (детерминированные, рандомизированные).

3. **Типы задач в алгоритмике**: Задачи принятия решения, задачи оптимизации, понятие сертификата решения, offline и online алгоритмы.

4. **Методы доказательства корректности алгоритмов**: Доказательство от противного, по индукции, по инварианту.

5. **RAM-модель**: Теоретическая модель вычислений для анализа алгоритмов, ее свойства и расширения.

6. **Асимптотический анализ**: Основные обозначения (O, Ω, Θ, o, ω), их свойства и основные классы сложности алгоритмов.

Понимание этих фундаментальных концепций является необходимым условием для дальнейшего изучения более сложных алгоритмических техник и структур данных.

Алгоритмы играют центральную роль в компьютерных науках и находят применение во всех областях, где требуется обработка данных и решение вычислительных задач. Эффективные алгоритмы позволяют решать сложные задачи с минимальными затратами ресурсов, что особенно важно в эпоху больших данных и высокопроизводительных вычислений.
