# Поиск в неупорядоченных массивах

1. **Начало**: Получаем на вход массив и искомое значение
2. **Итерация**: Последовательно перебираем элементы массива, начиная с первого
3. **Сравнение**: Для каждого элемента проверяем, равен ли он искомому значению
4. **Результат**:
    - Если найден совпадающий элемент – возвращаем его позицию (индекс)
    - Если весь массив просмотрен и элемент не найден – возвращаем специальное значение (обычно `-1` или `None`)

In [5]:
import numpy as np

In [23]:
def linear_search(arr, target):
    for i in range(len(arr)):
        if arr[i] == target:
            return i
    
    return -1

def linear_search_2(arr, target):
    for i, item in enumerate(arr):
        if item == target:
            return i
    
    return -1

def linear_search_3(arr, target):
    i = 0
    
    while i < len(arr):
        if arr[i] == target:
            return i
        i += 1
    
    return -1

In [4]:
array = [1, 3, 5, 8, 9, 12]
print(f'{linear_search(array, 9) = }')
print(f'{linear_search_2(array, 9) = }')

print(f'{linear_search(array, 55) = }')
print(f'{linear_search_2(array, 66) = }')

linear_search(array, 9) = 4
linear_search_2(array, 9) = 4
linear_search(array, 55) = -1
linear_search_2(array, 66) = -1


In [19]:
N = 100_000
array = np.random.choice(N, size=N, replace=False)

In [12]:
array.shape

(1000,)

In [13]:
len(set(array))

1000

In [20]:
%timeit linear_search(array, N-1)

8.27 ms ± 364 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [21]:
%timeit linear_search_2(array, N-1)

7.56 ms ± 641 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [24]:
%timeit linear_search_3(array, N-1)

10.5 ms ± 369 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


# Дихотомический поиск в упорядоченном массиве

Алгоритм работает по принципу **"разделяй и властвуй"**:
1. Находим средний элемент массива
2. Сравниваем его с искомым значением
3. Если средний элемент равен искомому – поиск завершен
4. Если искомое значение **меньше** среднего элемента – продолжаем поиск в левой половине
5. Если искомое значение **больше** среднего элемента – продолжаем поиск в правой половине
6. Повторяем процесс, пока не найдем элемент или не убедимся в его отсутствии

In [25]:
def binary_search(arr, target):
    left = 0
    right = len(arr) - 1
    
    while left <= right:
        mid = left + (right - left) // 2
        
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    
    return -1

In [26]:
array = [1, 3, 5, 8, 9, 12]
print(f'{binary_search(array, 9) = }')

binary_search(array, 9) = 4


In [36]:
N = 1_000_000
array = np.random.choice(N, size=N, replace=False)
array = np.sort(array)

In [37]:
%timeit linear_search_2(array, N-1)

132 ms ± 10 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [38]:
%timeit binary_search(array, N-1)

7.67 μs ± 399 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


In [39]:
np.log2(1_000), np.log2(10_000), np.log2(100_000), np.log2(1_000_000)

(np.float64(9.965784284662087),
 np.float64(13.287712379549449),
 np.float64(16.609640474436812),
 np.float64(19.931568569324174))