# Теоретический минимум по теме "Алгоритмы поиска"

## Зачем используются
Алгоритмы поиска используются для нахождения заданного элемента в массиве, списке или другой структуре данных. Выбор алгоритма зависит от структуры данных, объема входных данных и требований к скорости выполнения.


---
# Материалы
https://vk.com/video-62468751_456240449

https://vkvideo.ru/video-151213012_456239017

https://vk.com/video302513503_456239525

Адитья Бхаргава - Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих (2017, Питер)

---

# Задачи по теме "Алгоритмы поиска"

## 1. Найти первый элемент

**Задание:**  
У вас есть список чисел. Ваша задача — написать функцию, которая возвращает первый элемент списка.


**Формат вывода:**

Найденный элемент

Какая Big O этого алгоритма?

In [None]:
l = [1,2,3,4,5,6,7,8,9,0]
def first(a):
    return a[0]
first(l)

# O(1)

1

## 2. Линейный поиск  

**Задание:**  
Напишите простейший алгоритм, который проходит по массиву и сравнивает каждый элемент с искомым значением.  


**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма?

In [16]:
l = [1,2,3,3,4]
a = 3
for i in range(len(l)):
    if a == l[i]: print(i)
# O(n)

2
3


## 3. Бинарный поиск
**Задание:**

Напишите эффективный алгоритм для упорядоченных массивов. Работает по принципу "разделяй и властвуй":

Сравнивает искомый элемент с центральным.

Если элемент меньше — ищем в левой половине, если больше — в правой.

Повторяем процесс, пока не найдем элемент или не останется элементов.


**Формат вывода:**


Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

**log(n). Отсортированность и доступность по индексу (массивы или кортежи)**

In [15]:
arr = (0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50)
def bins(f, a):
    low = 0
    high = len(f) - 1
    while low <= high:
        mid = (low + high) // 2
        if a == f[mid]: return mid
        elif a < f[mid]: high = mid - 1
        else: low = mid + 1
    return None

bins(arr, 5)


1

## 4. Интерполяционный поиск
**Задание:**

Напишите улучшенная версия бинарного поиска. Вы заранее знаете, что данные равномерно распределены. Вместо деления массива пополам вычисляйте приблизительное положение искомого элемента.

**Формат вывода:**

Индекс найденного элемента

Какая Big O этого алгоритма? Какие требования к массиву данных?

**O(log log n), отсортированность и равномерное распределение**

In [24]:
arr = (0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50)

def ints(f, x):
    low = 0 
    high = len(f) - 1
    while f[low] < x and x < f[high]:
        mid = low + (x - f[low]) // (f[high] - f[low]) * (high - low)                
        if f[mid] < x:
            low = mid + 1
        elif f[mid] > x:
            high = mid - 1
        else: return mid   
    if f[low] == x:
        return low
    elif f[high] == x:
        return high
    else: return None

ints(arr, 5)

1

## 5. Поиск в строках. Алгоритм Кнута-Морриса-Пратта (KMP)
**Задание:**
Алгоритм Кнута-Морриса-Пратта (KMP) используется для поиска подстроки (шаблона) в строке. Он предварительно строит префикс-функцию (π-функцию), которая позволяет избегать повторных сравнений.

**Шаги реализации:**

Реализовать функцию compute_prefix_function(pattern), которая строит массив префикс-функции.
Реализовать функцию kmp_search(text, pattern), которая использует префикс-функцию для поиска подстроки.
Формат ввода:

text — строка, в которой выполняется поиск.
pattern — подстрока, которую необходимо найти.

**Формат вывода:**

Индексы всех вхождений pattern в text.


In [15]:
def compute_prefix_function(pattern):
    m = len(pattern)
    arr = [0] * m  
    j = 0  
    for i in range(1, m):
        while (j > 0 and pattern[i] != pattern[j]):
            j = arr[j - 1]  
        if pattern[i] == pattern[j]:
            j += 1
        arr[i] = j  
    return arr

def kmp_search(text, pattern):
    n = len(text)
    m = len(pattern)
    arr = compute_prefix_function(pattern) 
    j = 0  
    a = [] 
    for i in range(n): 
        while (j > 0 and text[i] != pattern[j]):
            j = arr[j - 1]  
        if text[i] == pattern[j]:
            j += 1
        if j == m: 
            a.append(i - m + 1)  
            j = arr[j - 1]  

    return a

text = "ahahahah"
pattern = "hah"
result = kmp_search(text, pattern)
print("Индексы всех вхождений", result)


Индексы всех вхождений [1, 3, 5]
