# Грокаем алгоритмы

## Знакомство с алгоритмами
*Алгоритмом* называется набор инструкций для выполнения некоторой задачи.

## Линейный поиск
*Линейный поиск* - самой простой вариант поиска, грубо говоря перечисление в лоб всех элементов, до совпадения с искомым значением.

### Пример реализации:

In [16]:
def linear_search(list, item):
    isFind = False
    iterator = 0;

    while iterator != len(list):
        if (list[iterator] == item):
            return iterator;
        else:
            iterator += 1
    return None

In [17]:
my_list = [1, 3, 5, 7, 9]
print(linear_search(my_list, 3)) # => 1 (Элемент найден в индексе 1)
print(linear_search(my_list, -1)) # => None (Элемент не найден)

1
None


## Бинарный поиск
*Бинарный поиск* - алгоритм, который на входе получает отсортированный список элементов, если элемент поиска присутствует то бинарный поиск возвращает позицию, на которой этот элемент был найден, в противном случае он возвращает null. Поиск начинает осуществляться с середины, и каждый раз сравнивает полученный элемент с искомым, на каждой итерации исходный список уменьшается вдвое, что соответствует временной сложности O(logn)(логарифмическая сложность).

**Бинарный поиск** работает только в том случае, если список отсортирован.

### Пример реализации:

In [10]:
def binary_search(list, item):
    low = 0 # В переменных low и high хранятся границы той части списка, в которой выполняется поиск
    high = len(list) - 1

    while low <= high: # Пока эта часть не сократится до одного элемента ...
        mid = (low + high) // 2 # ... проверяем средний элемент
        guess = list[mid]
        if guess == item: # Значение найден
            return mid
        if guess > item: # Много
            high = mid - 1
        else: # Мало
            low = mid + 1
    return None # Значение не существует

Протестируем функцию **бинарного поиска**:

In [9]:
my_list = [1, 3, 5, 7, 9]
print(binary_search(my_list, 3)) # => 1 (Элемент найден в индексе 1)
print(binary_search(my_list, -1)) # => None (Элемент не найден)

1
None


## Упражнения
**1.1** Имеется отсортированный список из 128 имен, и вы ищете в нем значение методом бинарного поиска. Какое максимальное количество проверк для этого может потребоваться?

**Ответ:** log(128) == 7.

**1.2** Предположим, размер списка увеличился вдвое. Как изменится максимальное количество проверок?

**Ответ:** В случае если список увеличиться вдвое, то результат будет следующим log(256) == 8

## Нотация O-большое
***O-большое*** - описывает скорость работы алгоритма. Это необходимо для того чтобы понимать, насколько быстро или медленно работают различные алгоритмы.

### Время выполнения алгоритмов растет с разной скоростью
***O-большое*** не сообщает скорость в секундах, а позволяет *сравнить количество операций*. Оно указывает, насколько быстро возрастает время выполнения алгоритма.

**"О-большое" определяет время выполнения в худшем случае.**

### Типичные примеры "О-большого"
- **$O(log(n))$** - *логарифмическое время*. Пример: бинарный поиск.
- **$O(n)$** - *линейное время*. Пример: линейный поиск.
- **$O(n * log(n))$** - *квазилинейное время*. Пример: эффективные алгоритмы сортировки (быстрая сортировка).
- **$O(n^2)$** - *квадратичное время*. Пример: медленные алгоритмы сортировки (сортировка выбором).
- **$O(n!)$** - *факториальное время*. Пример: очень медленные алгоритмы (задача о коммивояжере).


### Основные результаты по итогам просмотренной информации:
- Скорость алгоритмов измеряется не в секундах, а в темпе роста количества операций.
- По сути формула описывает, насколько быстро возрастает время выполнения алгоритма с увеличением размера входных данных.
- Время выполнения алгоритмов выражается как **"О-большое"**.
- Время выполнения **$O(log(n))$** быстрее **$O(n)$**, а с увеличением размера списка, в котором ищется значение, оно становится намного быстрее.

### Упражнения
**1.3** Известна фамилия, нужно найти номер в телефонной книге.

**Ответ**: Для данного случая подойдет бинарный поиск, так как телефонная книга отсортирована, осуществляем поиск по фамилиям. 

Временная сложность - **$O(log(n))$**.

**1.4** Известен номер, нужно найти фамилия в телефонной книге.

**Ответ**: Для данного случая придется осуществить поиск по всей книге. 

Временная сложность - **$O(n)$**.

**1.5** Нужно прочитать телефоны всех людей в телефонной книге.

**Ответ**: Для выполнения данной задачи необходимо пройтись по каждой записи в телефонной книге. 

Временная сложность - **$O(n)$**.

**1.6** Нужно прочитать телефоны всех людей, фамилии которых начинаются с буквы "А".

**Ответ**: Для выполнения данной задачи бы будем пользоваться линейным поиском, так как в случае бинарного поиска мы будем отбрасывать нужные нам записи в телефонной книге. 

Временная сложность - **$O(n)$**.

### Шпаргалка
- Бинарный поиск работает намного быстрее простого.
- Время выполнения ***$O(log(n))$** быстрее **$O(n)$**, а с увеличением размера списка, в котором ищется значение, оно становится намного быстрее.
- Скорость алгоритмов не измеряется в секундах.
- Время выполнения алгоритма описывается ростом количества операций.
- Время выполнения алгоритмов выражается как "O-большое"

## Сортировка выбором

### Массивы и связанные списки
**Массив** — это структура данных, в которой элементы хранятся в *непрерывной области памяти* и имеют *одинаковый размер*. Благодаря этому обеспечивается мгновенный доступ к любому элементу по индексу (время доступа — **O(1)**), так как адрес нужного элемента можно вычислить арифметически.
Однако добавление элементов в массив может быть неэффективным. 

Если массив заполнен, то для добавления нового элемента требуется:
- Выделить новую область памяти большего размера (например, в два раза больше текущего массива),
- Скопировать все существующие элементы в новое место,
- Удалить старый массив (если это управляемая память — например, в C# или Java, это делает сборщик мусора).
Этот процесс называется **реаллокацией** и является затратным по времени (в худшем случае — **O(n)**).

**Связанный список** — это структура данных, в которой элементы (узлы) могут находиться *в разных участках памяти*. Каждый узел содержит само значение и **ссылку** (указатель) на следующий элемент. 

Благодаря такой организации:
- Добавление и удаление элементов (особенно в начале списка) происходит быстро — без необходимости сдвига других элементов (в отличие от массива).
- Однако доступ к элементу по индексу медленный — приходится последовательно проходить список от начала до нужного узла (время доступа — **O(n)**).

### Сортировка выбором
**Сортировка выбором** - это алгоритм сортировки, который многократно находит наибольший (или наименьший) элемент из неотсортированного массива и добавляет в начало нового массива.

Алгоритм работает так:
- На каждой итерации выбирается минимальный элемент из оставшейся неотсортированной части массива.
- Этот элемент меняется местами с первым элементом этой неотсортированной части.
- Граница между отсортированной и неотсортированной частью сдвигается на один элемент вправо.

**Пример реализации сортировки выбором:**

In [3]:
def find_smallest(arr):
    smallest = arr[0]
    smallest_index = 0
    for i in range(1, len(arr)):
        if arr[i] < smallest:
            smallest = arr[i]
            smallest_index = i
    return smallest_index

def selection_sort(arr):
    newArr = []
    for i in range(len(arr)):
        smallest = find_smallest(arr)
        newArr.append(arr.pop(smallest))
    return newArr

print(selection_sort([5, 3, 6, 2, 10]))

[2, 3, 5, 6, 10]


### Шпаргалка
- Память компьютера напоминает огромный шкаф с ящиками.
- Если вам потребуется сохранить набор элементов, воспользуйтесь массивом или связанным списком.
- В массиве все элементы хранятся в памяти друг за другом.
- В списке элементы распределяются в произвольных местах памяти, при этом в каждом элементе хранится адрес следующего элемента.
- Массивы обеспечивают быстрое чтение.
- Связанные списки обеспечивают быструю вставу и удаление.
- Все элементы массива должны быть однотипными.