# Теоретический минимум по теме "Алгоритмы поиска"

## Зачем используются
Алгоритмы поиска используются для нахождения заданного элемента в массиве, списке или другой структуре данных. Выбор алгоритма зависит от структуры данных, объема входных данных и требований к скорости выполнения.


---
# Материалы
https://vk.com/video-62468751_456240449

https://vkvideo.ru/video-151213012_456239017

https://vk.com/video302513503_456239525

Адитья Бхаргава - Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих (2017, Питер)

---

# Задачи по теме "Алгоритмы поиска"

## 1. Найти первый элемент

**Задание:**  
У вас есть список чисел. Ваша задача — написать функцию, которая возвращает первый элемент списка.


**Формат вывода:**

Найденный элемент

Какая Big O этого алгоритма?

In [5]:
def search_alg(n):
    n = list(n)
    return n[0]

n = [1, 2, 3, 4, 5]
print(search_alg(n))

# Big O алгоритма составляет О(1)

1


## 2. Линейный поиск  

**Задание:**  
Напишите простейший алгоритм, который проходит по массиву и сравнивает каждый элемент с искомым значением.  


**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма?

In [6]:
def linear_search(x, n):
    n_new = list(n) # O(n)
    n_new.append(x) # O(2)
    i = 0
    while n_new[i] != x: # O(n)
        if i == len(n_new):
            return print('числа в списке нет')
        i += 1
    return i


n = [1,2,3,3,4]
x = 3
print(linear_search(x, n))


# Big O = O(n)

2


## 3. Бинарный поиск
**Задание:**

Напишите эффективный алгоритм для упорядоченных массивов. Работает по принципу "разделяй и властвуй":

Сравнивает искомый элемент с центральным.

Если элемент меньше — ищем в левой половине, если больше — в правой.

Повторяем процесс, пока не найдем элемент или не останется элементов.


**Формат вывода:**


Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

In [48]:
def binary_search(x, n):
    n_new = list(n)
    n_new.sort()
    left = 0
    right = len(n_new)-1

    while left <= right:

        middle = int((left + right) / 2)
        if x == n_new[middle]:
            return middle
        elif x < n_new[middle]:
            right = middle-1
        elif x > n_new[middle]:
            left = middle+1
    return 'элемент не найден'


n = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
x = 11

print(binary_search(x, n))

# Big O = O(log n)
# массив должен быть отсортирован

элемент не найден


## 4. Интерполяционный поиск
**Задание:**

Напишите улучшенная версия бинарного поиска. Вы заранее знаете, что данные равномерно распределены. Вместо деления массива пополам вычисляйте приблизительное положение искомого элемента.

**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

In [49]:
def interp_search(x, n):
    left = 0
    right = len(n) - 1

    if not (n[left] <= x <= n[right]):
        return 'нет такого числа :('

    while left <= right:
        index_searched = int(((x - n[left]) * len(n[left:right]) / (n[right] - n[left])))

        if n[index_searched] < x:
            left = index_searched + 1
        elif n[index_searched] > x: 
            right = index_searched - 1
        else: 
            return index_searched
        
    return left

n = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
x = 6

print(interp_search(x, n))

# Big O = O(log log n)
# массив должен быть отсортирован и равномерно распределен



5


## 5. Поиск в строках. Алгоритм Кнута-Морриса-Пратта (KMP)
**Задание:**
Алгоритм Кнута-Морриса-Пратта (KMP) используется для поиска подстроки (шаблона) в строке. Он предварительно строит префикс-функцию (π-функцию), которая позволяет избегать повторных сравнений.

**Шаги реализации:**

Реализовать функцию compute_prefix_function(pattern), которая строит массив префикс-функции.
Реализовать функцию kmp_search(text, pattern), которая использует префикс-функцию для поиска подстроки.
Формат ввода:

text — строка, в которой выполняется поиск.
pattern — подстрока, которую необходимо найти.

**Формат вывода:**

Индексы всех вхождений pattern в text.


In [31]:
def compute_prefix_function(pattern):
    pi = [0]*len(pattern)
    j = 0
    i = 1
    while i <= (len(pattern) - 1):
        if pattern[j] == pattern[i]:
            pi[i] = j + 1
            i += 1
            j += 1
        else:
            if j == 0:
                pi[i] = 0
                i += 1
            else: 
                j = pi[j-1]
    return pi

strOCHKA = 'лииллиил'
compute_prefix_function(strOCHKA)

[0, 0, 0, 1, 1, 2, 3, 4]

In [None]:
def kmp_search(text, pattern):
    pi = compute_prefix_function(pattern)
    i = 0
    j = 0
    result = []

    while i <= len(text) - 1:
        if text[i] == pattern[j]:
            if j == len(pattern) - 1:
                result.append(i - len(pattern) + 1)
                i += 1
            else:
                i += 1
                j += 1
        elif text[i] != pattern[j]:
            if j == 0:
                i += 1
            else:
                j = pi[j-1]

    if len(result) != 0:
        return result
    return 'нет слов...'



text = 'лилилось лилилась kb лилилапо'
pattern = 'лилила'
kmp_search(text, pattern)

[9, 21]