# Поиск в неупорядоченных массивах

1. **Начало**: Получаем на вход массив и искомое значение
2. **Итерация**: Последовательно перебираем элементы массива, начиная с первого
3. **Сравнение**: Для каждого элемента проверяем, равен ли он искомому значению
4. **Результат**:
    - Если найден совпадающий элемент – возвращаем его позицию (индекс)
    - Если весь массив просмотрен и элемент не найден – возвращаем специальное значение (обычно `-1` или `None`)

In [1]:
import numpy as np

In [23]:
def linear_search(arr, target):
    for i in range(len(arr)):
        if arr[i] == target:
            return i
    
    return -1

def linear_search_2(arr, target):
    for i, item in enumerate(arr):
        if item == target:
            return i
    
    return -1

def linear_search_3(arr, target):
    i = 0
    
    while i < len(arr):
        if arr[i] == target:
            return i
        i += 1
    
    return -1

In [4]:
array = [1, 3, 5, 8, 9, 12]
print(f'{linear_search(array, 9) = }')
print(f'{linear_search_2(array, 9) = }')

print(f'{linear_search(array, 55) = }')
print(f'{linear_search_2(array, 66) = }')

linear_search(array, 9) = 4
linear_search_2(array, 9) = 4
linear_search(array, 55) = -1
linear_search_2(array, 66) = -1


In [19]:
N = 100_000
array = np.random.choice(N, size=N, replace=False)

In [12]:
array.shape

(1000,)

In [13]:
len(set(array))

1000

In [20]:
%timeit linear_search(array, N-1)

8.27 ms ± 364 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [21]:
%timeit linear_search_2(array, N-1)

7.56 ms ± 641 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [24]:
%timeit linear_search_3(array, N-1)

10.5 ms ± 369 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


# Дихотомический поиск в упорядоченном массиве

Алгоритм работает по принципу **"разделяй и властвуй"**:
1. Находим средний элемент массива
2. Сравниваем его с искомым значением
3. Если средний элемент равен искомому – поиск завершен
4. Если искомое значение **меньше** среднего элемента – продолжаем поиск в левой половине
5. Если искомое значение **больше** среднего элемента – продолжаем поиск в правой половине
6. Повторяем процесс, пока не найдем элемент или не убедимся в его отсутствии

In [25]:
def binary_search(arr, target):
    left = 0
    right = len(arr) - 1
    
    while left <= right:
        mid = left + (right - left) // 2
        
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    
    return -1

In [26]:
array = [1, 3, 5, 8, 9, 12]
print(f'{binary_search(array, 9) = }')

binary_search(array, 9) = 4


In [36]:
N = 1_000_000
array = np.random.choice(N, size=N, replace=False)
array = np.sort(array)

In [37]:
%timeit linear_search_2(array, N-1)

132 ms ± 10 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [38]:
%timeit binary_search(array, N-1)

7.67 μs ± 399 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [39]:
np.log2(1_000), np.log2(10_000), np.log2(100_000), np.log2(1_000_000)

(np.float64(9.965784284662087),
 np.float64(13.287712379549449),
 np.float64(16.609640474436812),
 np.float64(19.931568569324174))

# Алгоритмы сортировки

## Пузырьковая сортировка (Bubble Sort)

Алгоритм работает по следующей схеме:
1. Проходим по массиву от начала до конца
2. Сравниваем каждую пару соседних элементов
3. Если элементы расположены в неправильном порядке (предыдущий больше следующего), меняем их местами
4. Повторяем процесс до тех пор, пока массив не будет полностью отсортирован

In [3]:
arr = [64, 34, 25, 12, 22, 11, 90]

In [19]:
def bubble_sort(arr):
    for i in range(len(arr) - 1):
        # print(f'\nПроход {i + 1}:')
        # print(f'До прохода: {arr}')
    
        
        for j in range(len(arr) - 1):
            # print(f'  Сравниваем {arr[j] = } и {arr[j+1] = }', end='')
            
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]
            #     print(f' -> МЕНЯЕМ местами')
            # else:
            #     print(f' -> не меняем')
        
        # print(f'После прохода: {arr}')
    return arr

In [15]:
bubble_sort(arr.copy())


Проход 1:
До прохода: [64, 34, 25, 12, 22, 11, 90]
  Сравниваем arr[j] = 64 и arr[j+1] = 34 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 64 и arr[j+1] = 25 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 64 и arr[j+1] = 12 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 64 и arr[j+1] = 22 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 64 и arr[j+1] = 11 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 64 и arr[j+1] = 90 -> не меняем
После прохода: [34, 25, 12, 22, 11, 64, 90]

Проход 2:
До прохода: [34, 25, 12, 22, 11, 64, 90]
  Сравниваем arr[j] = 34 и arr[j+1] = 25 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 34 и arr[j+1] = 12 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 34 и arr[j+1] = 22 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 34 и arr[j+1] = 11 -> МЕНЯЕМ местами
  Сравниваем arr[j] = 34 и arr[j+1] = 64 -> не меняем
  Сравниваем arr[j] = 64 и arr[j+1] = 90 -> не меняем
После прохода: [25, 12, 22, 11, 34, 64, 90]

Проход 3:
До прохода: [25, 12, 22, 11, 34, 64, 90]
  Сравниваем arr[j] = 25 и arr[j+1] = 12 -> МЕНЯЕМ местами
  Ср

[11, 12, 22, 25, 34, 64, 90]

In [26]:
N = 1_000
array = np.random.choice(N, size=N, replace=False)

In [27]:
# 1_000
%timeit bubble_sort(array.copy())

281 ms ± 21.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [None]:
# 10_000
%timeit bubble_sort(array.copy())

34.8 s ± 6.24 s per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [None]:
34.8 * 1000 / 281

123.84341637010677

In [31]:
N = 1_000
sort_array = np.random.choice(N, size=N, replace=False)
sort_array = np.sort(array)

In [32]:
%timeit bubble_sort(sort_array.copy())

191 ms ± 9.34 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


## Сортировка слиянием (Merge Sort)

Работает по принципу рекурсивного алгоритма
1. **Базовый случай**: Если массив содержит 0 или 1 элемент, он уже отсортирован
2. **Разделение**: Находим середину массива: `mid = len(arr) // 2`
3. **Рекурсивный вызов**:
    - Сортируем левую половину: `left = merge_sort(arr[:mid])`
    - Сортируем правую половину: `right = merge_sort(arr[mid:])`
4. **Слияние**: Объединяем отсортированные половины в один массив

In [43]:
def merge_sort(arr, level = 0):
    # print(f'#{level}: {arr}')
    
    if len(arr) <= 1:
        return arr
    
    mid = len(arr) // 2
    
    left_half = merge_sort(arr[:mid], level + 1)
    right_half = merge_sort(arr[mid:], level + 1)
    
    return merge(left_half, right_half, level)

def merge(left, right, level):
    # print(f'  Слияние на уровне #{level}')
    # print(f'  {left} -- {right}')
    result = []
    i = j = 0
    
    while i < len(left) and j < len(right):
        # print(f'    {i}: {left[i]} <= {right[j]}: {j}')
        if left[i] <= right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    result.extend(left[i:])
    result.extend(right[j:])
    
    # print(f'  {result}')
    return result

In [41]:
arr = [38, 27, 43, 3, 9, 82, 10]

In [42]:
merge_sort(arr.copy())

#0: [38, 27, 43, 3, 9, 82, 10]
#1: [38, 27, 43]
#2: [38]
#2: [27, 43]
#3: [27]
#3: [43]
  Слияние на уровне #2
  [27] -- [43]
    0: 27 <= 43: 0
  [27, 43]
  Слияние на уровне #1
  [38] -- [27, 43]
    0: 38 <= 27: 0
    0: 38 <= 43: 1
  [27, 38, 43]
#1: [3, 9, 82, 10]
#2: [3, 9]
#3: [3]
#3: [9]
  Слияние на уровне #2
  [3] -- [9]
    0: 3 <= 9: 0
  [3, 9]
#2: [82, 10]
#3: [82]
#3: [10]
  Слияние на уровне #2
  [82] -- [10]
    0: 82 <= 10: 0
  [10, 82]
  Слияние на уровне #1
  [3, 9] -- [10, 82]
    0: 3 <= 10: 0
    1: 9 <= 10: 0
  [3, 9, 10, 82]
  Слияние на уровне #0
  [27, 38, 43] -- [3, 9, 10, 82]
    0: 27 <= 3: 0
    0: 27 <= 9: 1
    0: 27 <= 10: 2
    0: 27 <= 82: 3
    1: 38 <= 82: 3
    2: 43 <= 82: 3
  [3, 9, 10, 27, 38, 43, 82]


[3, 9, 10, 27, 38, 43, 82]

In [48]:
N = 100_000
array = np.random.choice(N, size=N, replace=False)

In [45]:
# 1_000
%timeit merge_sort(array.copy())

3.99 ms ± 734 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [47]:
# 10_000
%timeit merge_sort(array.copy())

44.5 ms ± 3.53 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [49]:
# 100_000
%timeit merge_sort(array.copy())

552 ms ± 32.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [50]:
28 * 1000 / 4

7000.0

$\mathcal{O}(n^2)$ - Пузырьковая сортировка  
$\mathcal{O}(n*\log{n})$ - Сортировка слиянием

In [55]:
for i in range(1, 7):
    buble_s = (10**i)**2
    merge_s = 10**i * np.log2(10**i)
    print(f'N = {10**i:_}: {buble_s:_} -- {merge_s:_} // {buble_s / merge_s:.0f}')

N = 10: 100 -- 33.219280948873624 // 3
N = 100: 10_000 -- 664.3856189774724 // 15
N = 1_000: 1_000_000 -- 9_965.784284662088 // 100
N = 10_000: 100_000_000 -- 132_877.1237954945 // 753
N = 100_000: 10_000_000_000 -- 1_660_964.0474436812 // 6021
N = 1_000_000: 1_000_000_000_000 -- 19_931_568.569324173 // 50172


In [56]:
import random

In [61]:
N = 4
triangle = [[random.randint(0, 9) for _ in range(i)] for i in range(1, N + 1)]

# Хитрая задачка

Представьте треугольник из чисел:

In [62]:
for row in triangle:
    row_str = ' '.join(f'{num}' for num in row)
    print(f'{row_str:^{N * 2}}')

   4    
  0 2   
 8 1 3  
7 8 3 5 


Простые правила:
- Начинаем с верхней вершины
- Двигаемся вниз, выбирая левого или правого соседа

**Цель**: Найти путь с максимальной суммой чисел

Решение от *Кирилла Анатольевича*:  
1. Прочитать треугольник — данные представлены в виде вложенных списков чисел.
2. Обработать снизу вверх, начиная с предпоследней строки:  
  - Для каждого числа в текущей строке прибавить большее из двух чисел под ним.
  - Пример для строки [4, 0] над [8, 1, 5]:
    - 4 → 4 + max(8, 1) = 12
    - 0 → 0 + max(1, 5) = 5
3. Повторить для каждой строки, поднимаясь вверх.
4. Результат — число в вершине после всех вычислений.

In [63]:
triangle

[[4], [0, 2], [8, 1, 3], [7, 8, 3, 5]]

In [74]:
def find_max_value(triangle, row = 0, col = 0):
    # Сложность: O(2^n)
    
    if row == len(triangle) - 1:
        return triangle[row][col]

    left = find_max_value(triangle, row + 1, col)
    right = find_max_value(triangle, row + 1, col + 1)
    
    return triangle[row][col] + max(left, right)

def find_max_path(triangle, index = 0, res = 0, path = '', level = 0):
    if not len(triangle[1:]):
        result.append((f'{path}', res))
        return
    
    if not level:
        path = triangle[0][0]
        res += triangle[0][0]
        
    for i, row in enumerate(triangle[1]):
        if i in [index, index + 1]:
            find_max_path(triangle[1:], i, res + row, f'{path} -> {row}', level + 1)

def find_max_value_optimized(triangle):
    # Сложность: O(n^2)
    
    for i in range(len(triangle) - 2, -1, -1):
        for j in range(len(triangle[i])):
            triangle[i][j] += max(triangle[i+1][j], triangle[i+1][j+1])
        
    return triangle[0][0]

In [65]:
for row in triangle:
    row_str = ' '.join(f'{num}' for num in row)
    print(f'{row_str:^{N * 2}}')

   4    
  0 2   
 8 1 3  
7 8 3 5 


In [66]:
find_max_value(triangle.copy())

20

In [73]:
find_max_value_optimized(triangle.copy())

20

In [71]:
result = []
find_max_path(triangle.copy())
result.sort(key=lambda x: x[-1], reverse=True)
result

[('4 -> 0 -> 8 -> 8', 20),
 ('4 -> 0 -> 8 -> 7', 19),
 ('4 -> 2 -> 1 -> 8', 15),
 ('4 -> 2 -> 3 -> 5', 14),
 ('4 -> 0 -> 1 -> 8', 13),
 ('4 -> 2 -> 3 -> 3', 12),
 ('4 -> 2 -> 1 -> 3', 10),
 ('4 -> 0 -> 1 -> 3', 8)]

In [88]:
N = 15
triangle = [[random.randint(0, 9) for _ in range(i)] for i in range(1, N + 1)]

In [79]:
# 5
%timeit find_max_value(triangle.copy())
%timeit find_max_value_optimized(triangle.copy())

5.87 μs ± 411 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
3.65 μs ± 465 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [82]:
# 8
%timeit find_max_value(triangle.copy())
%timeit find_max_value_optimized(triangle.copy())

48.5 μs ± 2.82 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)
10 μs ± 1.4 μs per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [84]:
# 10
%timeit find_max_value(triangle.copy())
%timeit find_max_value_optimized(triangle.copy())

225 μs ± 32.3 μs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)
13.9 μs ± 1.12 μs per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [89]:
# 15
%timeit find_max_value(triangle.copy())
%timeit find_max_value_optimized(triangle.copy())

6.1 ms ± 297 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)
29.3 μs ± 1.32 μs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


In [91]:
2 ** 15 , 15 ** 2 , 2 ** 15 / 15 ** 2

(32768, 225, 145.63555555555556)