# Теоретический минимум по теме "Алгоритмы поиска"

## Зачем используются
Алгоритмы поиска используются для нахождения заданного элемента в массиве, списке или другой структуре данных. Выбор алгоритма зависит от структуры данных, объема входных данных и требований к скорости выполнения.


---
# Материалы
https://vk.com/video-62468751_456240449

https://vkvideo.ru/video-151213012_456239017

https://vk.com/video302513503_456239525

Адитья Бхаргава - Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих (2017, Питер)

---

# Задачи по теме "Алгоритмы поиска"

## 1. Найти первый элемент

**Задание:**  
У вас есть список чисел. Ваша задача — написать функцию, которая возвращает первый элемент списка.


**Формат вывода:**

Найденный элемент

Какая Big O этого алгоритма?

In [12]:
def first_el(l):
    if not l:
        return "Empty list"
    return l[0]

s = [1, 2, 4, 9, 12]
print(first_el(s))

print("Сложность О(1), не зависит от размера списка")

1
Сложность О(1), не зависит от размера списка


## 2. Линейный поиск  

**Задание:**  
Напишите простейший алгоритм, который проходит по массиву и сравнивает каждый элемент с искомым значением.  


**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма?

In [6]:
def search(arr, n):
    for i in range(len(arr)):
        if arr[i] == n:
            return i
    return 'Нет совпадений'


arr = [4, 2, 7, 1, 9]
n = 7
print(search(arr, n))

print("Временная сложность O(n), т. к. в худшем случае перебираем все n элементов")

2
Временная сложность O(n), т. к. в худшем случае перебираем все n элементов


## 3. Бинарный поиск
**Задание:**

Напишите эффективный алгоритм для упорядоченных массивов. Работает по принципу "разделяй и властвуй":

Сравнивает искомый элемент с центральным.

Если элемент меньше — ищем в левой половине, если больше — в правой.

Повторяем процесс, пока не найдем элемент или не останется элементов.


**Формат вывода:**


Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

In [13]:
def bin_search(arr, n):
    l = 0
    r = len(arr) - 1
    while l <= r:
        mid = (l + r) // 2
        if arr[mid] == n:
            return mid
        elif arr[mid] > n:
            r = mid - 1
        else:
            l = mid + 1
    return 'Не найдено'

n = 9
arr = [1, 4, 5, 7, 9, 11, 13, 26]
print(bin_search(arr, n))
print("Временная сложность O(log n), на каждой итерации алгоритм уменьшает область в два раза. Массив должен быть отсортирован по возрастанию")


4
Временная сложность O(log n), на каждой итерации алгоритм уменьшает область в два раза. Массив должен быть отсортирован по возрастанию


## 4. Интерполяционный поиск
**Задание:**

Напишите улучшенная версия бинарного поиска. Вы заранее знаете, что данные равномерно распределены. Вместо деления массива пополам вычисляйте приблизительное положение искомого элемента.

**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

In [1]:
'''
Механизм интерполяционного поиска:

pos = lo + ((target - arr[lo]) * (hi - lo)) / (arr[hi] - arr[lo])

arr[]: Array where elements need to be searched
target: Element to be searched
lo: Starting index in arr[]
hi: Ending index in arr[]

'''
def interpolation_search(arr, n):
    l = 0
    r = len(arr) - 1

    while l <= r and arr[l] <= n <= arr[r]:

        mid = l + ((n - arr[l]) * (r - l)) // (arr[r] - arr[l])

        if mid < l or mid > r:
            break

        if arr[mid] == n:
            return mid
        elif arr[mid] < n:
            l = mid + 1
        else:
            r = mid - 1

    return 'Не найдено'

n = 4
arr = [1, 2, 3, 4, 5]

print(interpolation_search(arr, n))


3


## 5. Поиск в строках. Алгоритм Кнута-Морриса-Пратта (KMP)
**Задание:**
Алгоритм Кнута-Морриса-Пратта (KMP) используется для поиска подстроки (шаблона) в строке. Он предварительно строит префикс-функцию (π-функцию), которая позволяет избегать повторных сравнений.

**Шаги реализации:**

Реализовать функцию compute_prefix_function(pattern), которая строит массив префикс-функции.
Реализовать функцию kmp_search(text, pattern), которая использует префикс-функцию для поиска подстроки.
Формат ввода:

text — строка, в которой выполняется поиск.
pattern — подстрока, которую необходимо найти.

**Формат вывода:**

Индексы всех вхождений pattern в text.


In [39]:
def compute_prefix_function(pattern):
    p = [0] * len(pattern)
    j = 0
    i = 1
    while i < len(pattern):
        if pattern[j] == pattern[i]:
            p[i] = j+1
            i += 1
            j +=1
        else:
            if j == 0:
                p[i] = 0
                i += 1
            else:
                j = p[j-1]
    return p

def kmp_search(text, pattern):
    p = compute_prefix_function(pattern)
    index = []
    j = 0
    i = 0
    while i < len(text):
        if text[i] == pattern[j]:
            i += 1
            j += 1
            if j == len(pattern):
                print('Образ', pattern, 'найден')
                index.append(i- len(pattern))
                index.append(i-1)
                return  index
        else:
            if j > 0:
                j = p[j-1]
            else:
                i += 1
    if i == len(text):
        return 'Образ не найден'


text = "abad123sggffg"
pattern= "123"
result = kmp_search(text, pattern)
print("Индексы вхождений:", result)


Образ 123 найден
Индексы вхождений: [4, 6]
