# Теоретический минимум по теме "Алгоритмы поиска"

## Зачем используются
Алгоритмы поиска используются для нахождения заданного элемента в массиве, списке или другой структуре данных. Выбор алгоритма зависит от структуры данных, объема входных данных и требований к скорости выполнения.


---
# Материалы
https://vk.com/video-62468751_456240449

https://vkvideo.ru/video-151213012_456239017

https://vk.com/video302513503_456239525

Адитья Бхаргава - Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих (2017, Питер)

---

# Задачи по теме "Алгоритмы поиска"

## 1. Найти первый элемент

**Задание:**  
У вас есть список чисел. Ваша задача — написать функцию, которая возвращает первый элемент списка.


**Формат вывода:**

Найденный элемент

Какая Big O этого алгоритма?

In [20]:
def f1(lst):
    return lst[0]


lst = [int(x) for x in input().split()]
print(lst)
print(f'Первый элемент списка: {f1(lst)}')
print('Сложность O(1)')

[4, 5, 3, 2]
Первый элемент списка: 4
Сложность O(1)


## 2. Линейный поиск  

**Задание:**  
Напишите простейший алгоритм, который проходит по массиву и сравнивает каждый элемент с искомым значением.  


**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма?

In [80]:
def linear_search(lst, x):
    for i in range(len(lst)):
        if lst[i] == x:
            return i
    return "В списке нет такого элемента"


l = [i for i in range(1,11)]
x = 5
print(linear_search(l, x))
print("Сложность O(n)")

4
Сложность O(n)


## 3. Бинарный поиск
**Задание:**

Напишите эффективный алгоритм для упорядоченных массивов. Работает по принципу "разделяй и властвуй":

Сравнивает искомый элемент с центральным.

Если элемент меньше — ищем в левой половине, если больше — в правой.

Повторяем процесс, пока не найдем элемент или не останется элементов.


**Формат вывода:**


Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

In [78]:
def binary_search(lst, x):
    left, right = 0, len(lst) - 1
    while left <= right:
        mid = (left + right) // 2
        if lst[mid] == x:
            return mid
        elif x < lst[mid]:
            right = mid - 1
        else:
            left = mid + 1
    return "Такого элемента в списке нет"


lst = [i for i in range(666, 999)]
x = 777
print(binary_search(lst, x))
print("Сложность O(log n)")

111
Сложность O(log n)


## 4. Интерполяционный поиск
**Задание:**

Напишите улучшенная версия бинарного поиска. Вы заранее знаете, что данные равномерно распределены. Вместо деления массива пополам вычисляйте приблизительное положение искомого элемента.

**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

In [81]:
def interpolation_search(lst, x):
    left, right = 0, len(lst) - 1
    while left <= right:
        pos = left + ((x - lst[left]) * (right - left)) // (lst[right] - lst[left])
        if lst[pos] == x:
            return pos
        elif x < lst[pos]:
            right = pos - 1
        else:
            left = pos + 1
    return "Такого элемента в списке нет"


lst = [i for i in range(5,555)]
x = 333
print(interpolation_search(lst, x))
print("Сложность O(log log n)")

328
Сложность O(log log n)


## 5. Поиск в строках. Алгоритм Кнута-Морриса-Пратта (KMP)
**Задание:**
Алгоритм Кнута-Морриса-Пратта (KMP) используется для поиска подстроки (шаблона) в строке. Он предварительно строит префикс-функцию (π-функцию), которая позволяет избегать повторных сравнений.

**Шаги реализации:**

Реализовать функцию compute_prefix_function(pattern), которая строит массив префикс-функции.
Реализовать функцию kmp_search(text, pattern), которая использует префикс-функцию для поиска подстроки.
Формат ввода:

text — строка, в которой выполняется поиск.
pattern — подстрока, которую необходимо найти.

**Формат вывода:**

Индексы всех вхождений pattern в text.


In [88]:
def compute_prefix_function(pattern):
    p = [0] * len(pattern)
    j = 0
    i = 1
    while i < len(pattern):
        if pattern[j] == pattern[i]:
            p[i] = j + 1
            i += 1
            j += 1
        else:
            if j == 0:
                p[i] = 0
                i += 1
            else:
                j = p[j - 1]
    return p


def kmp_search(text, pattern):
    i = 0
    j = 0
    list_index=[]
    while i < len(text):
        if text[i] == pattern[j]:
            list_index.append(i)
            i += 1
            j += 1
            if j == len(pattern):
                print("Образ найден")
                return list_index
        else:
            list_index = []
            if j > 0:
                j = compute_prefix_function(pattern)[j - 1]
            else:
                i += 1
    if i == len(text):
        return "Образ не найден"


text = "лилилось лилилась"
pattern = "лилила"
print(compute_prefix_function(pattern))
print(kmp_search(text, pattern))

print("Сложность O(n+m). n - длина text, m - длина pattern")

[0, 0, 1, 2, 3, 0]
Образ найден
[9, 10, 11, 12, 13, 14]
Сложность O(n+m). n - длина text, m - длина pattern
