# Углубленное программирование Python. Модуль 2. Алгоритмы поиска.

### Линейный поиск

In [78]:
def lin_search(my_seq, item):
    for i in range(len(my_seq)):
        if my_seq[i] == item:
            return i
    return -1

### Бинарный поиск

In [81]:
def bin_search(my_seq, item):
    first = 0
    last = len(my_seq) - 1
    index = -1
    while (first <= last) and (index == -1):
        mid = (first+last) // 2
        if my_seq[mid] == item:
            index = mid
        else:
            if item < my_seq[mid]:
                last = mid - 1
            else:
                first = mid + 1
    return index

### Jump Search

In [84]:
import math

def jump_search(my_seq, item):
    length = len(my_seq)
    jump = int(math.sqrt(length))
    left, right = 0, 0
    while left < length and my_seq[left] <= item:
        right = min(length - 1, left + jump)
        if my_seq[left] <= item <= my_seq[right]:
            break
        left += jump
    if left >= length or my_seq[left] > item:
        return -1
    right = min(length - 1, right)
    i = left
    while i <= right and my_seq[i] <= item:
        if my_seq[i] == item:
            return i
        i += 1
    return -1

### Поиск Фибоначчи

In [119]:
def fib_search(my_seq, item):
    fibm_min_2 = 0
    fibm_min_1 = 1
    fibm = fibm_min_1 + fibm_min_2

    while fibm < len(my_seq):
        fibm_min_2 = fibm_min_1
        fibm_min_1 = fibm
        fibm = fibm_min_1 + fibm_min_2
    index = -1

    while fibm > 1:
        i = min(index + fibm_min_2, (len(my_seq)-1))
        if my_seq[i] < item:
            fibm = fibm_min_1
            fibm_min_1 = fibm_min_2
            fibm_min_2 = fibm - fibm_min_1
            index = i
        elif my_seq[i] > item:
            fibm = fibm_min_2
            fibm_min_1 = fibm_min_1 - fibm_min_2
            fibm_min_2 = fibm - fibm_min_1
        else:
            return i

    if fibm_min_1 and index < len(my_seq) - 1 and my_seq[index + 1] == item:
        return index+1
    return -1

### Экспоненциальный поиск

In [90]:
def bin_search(my_seq, item):
    first = 0
    last = len(my_seq) - 1
    index = -1
    while (first <= last) and (index == -1):
        mid = (first+last) // 2
        if my_seq[mid] == item:
            index = mid
        else:
            if item < my_seq[mid]:
                last = mid - 1
            else:
                first = mid + 1
    return index


def exp_search(my_seq, item):
    if my_seq[0] == item:
        return 0
    index = 1
    while index < len(my_seq) and my_seq[index] <= item:
        index = index * 2
    return bin_search(my_seq[:min(index, len(my_seq))], item)

### Интерполяционный поиск

In [93]:
def interp_search(my_seq, item):
    low = 0
    high = (len(my_seq) - 1)
    while low <= high and my_seq[low] <= item <= my_seq[high]:
        index = low + int(((float(high - low) / (my_seq[high] - my_seq[low])) * (item - my_seq[low])))
        if my_seq[index] == item:
            return index
        if my_seq[index] < item:
            low = index + 1
        else:
            high = index - 1
    return -1

## Практическая работа

Используя рассмотренные алгоритмы поиска, реализованные в виде функций, нужно оценить их эффективность на разных типах входных данных.

Каждый алгоритм нужно протестировать для случайно сгенерированного и отсортированного списка. Оценить эффективность, сделать выводы о применимости алгоритмов.

В качестве входных данных можно использовать сгенерированные списки случайных чисел.

Среднее время исполнения можно оценить, используя библиотеку timeit.


### Универсальная функция для тестирования алгоритмов поиска:

In [97]:
import timeit

def test_search_algorithm(algorithm, algorithm_name):
    """
    Универсальная функция для тестирования алгоритмов поиска.
    :param algorithm: Функция алгоритма поиска (например, lin_search, bin_search и т.д.)
    :param algorithm_name: Название алгоритма (для вывода в консоль)
    """
    print(f"\n{algorithm_name}:")
    
    # Тестирование на неотсортированном списке
    print("Неотсортированный список:")
    print(f"Начало: {timeit.timeit(lambda: algorithm(source_list, source_item_start), number=100) / 100} секунд")
    print(f"Середина: {timeit.timeit(lambda: algorithm(source_list, source_item_mid), number=100) / 100} секунд")
    print(f"Конец: {timeit.timeit(lambda: algorithm(source_list, source_item_end), number=100) / 100} секунд")
    
    # Тестирование на отсортированном списке
    print("Отсортированный список:")
    print(f"Начало: {timeit.timeit(lambda: algorithm(sorted_list, sorted_item_start), number=100) / 100} секунд")
    print(f"Середина: {timeit.timeit(lambda: algorithm(sorted_list, sorted_item_mid), number=100) / 100} секунд")
    print(f"Конец: {timeit.timeit(lambda: algorithm(sorted_list, sorted_item_end), number=100) / 100} секунд")

Генерация списков:

In [121]:
from random import randint

source_list = [randint(-100000000, 100000000) for i in range(1000000)]  # Генерация списка случайных чисел
source_item_start = source_list[100]   # Элемент из начала исходного массива
source_item_mid = source_list[500000]  # Элемент из середины исходного массива
source_item_end = source_list[990000]  # Элемент из конца исходного массива

sorted_list = sorted(source_list)   # Отсортированный список
sorted_item_start = sorted_list[100]   # Элемент из начала отсортированного массива
sorted_item_mid = sorted_list[500000]  # Элемент из середины отсортированного массива
sorted_item_end = sorted_list[990000]  # Элемент из конца отсортированного массива

## Оценка производительности алогоритмов

In [101]:
test_search_algorithm(lin_search, "Линейный поиск")


Линейный поиск:
Неотсортированный список:
Начало: 3.017000271938741e-06 секунд
Середина: 0.017175435000099243 секунд
Конец: 0.03494848000002094 секунд
Отсортированный список:
Начало: 2.823999966494739e-06 секунд
Середина: 0.031084919000277295 секунд
Конец: 0.06102509299991652 секунд


Выводы:
* Линейный поиск эффективен только для небольших списков или когда искомый элемент находится в начале списка.

* На больших списках его производительность резко падает, особенно если элемент находится в конце.

* Не требует предварительной сортировки данных.

In [103]:
test_search_algorithm(bin_search, "Бинарный поиск")


Бинарный поиск:
Неотсортированный список:
Начало: 3.5639997804537417e-06 секунд
Середина: 3.195999888703227e-06 секунд
Конец: 3.185999812558293e-06 секунд
Отсортированный список:
Начало: 2.8249999741092323e-06 секунд
Середина: 2.98400002066046e-06 секунд
Конец: 3.1149998540058733e-06 секунд


Выводы:

* Бинарный поиск работает очень быстро на отсортированных данных.

* На неотсортированных данных результаты могут быть некорректными, так как алгоритм предполагает, что данные отсортированы.

* Идеально подходит для поиска в отсортированных списках.

In [104]:
test_search_algorithm(jump_search, "Jump Search")


Jump Search:
Неотсортированный список:
Начало: 1.3518999912776053e-05 секунд
Середина: 1.1780002387240529e-06 секунд
Конец: 3.519997699186206e-07 секунд
Отсортированный список:
Начало: 6.596000166609883e-06 секунд
Середина: 0.00018304400029592216 секунд
Конец: 0.0002904520003357902 секунд


Выводы:

* Jump Search работает быстрее линейного поиска, но медленнее бинарного.

* Эффективен на отсортированных данных, но требует предварительной сортировки.

* Хорошо подходит для больших отсортированных списков, где бинарный поиск может быть избыточным.

In [123]:
test_search_algorithm(fib_search, "Поиск Фибоначчи")


Поиск Фибоначчи:
Неотсортированный список:
Начало: 1.9170999876223506e-05 секунд
Середина: 1.9346000044606626e-05 секунд
Конец: 2.8817999991588293e-05 секунд
Отсортированный список:
Начало: 2.7963000466115773e-05 секунд
Середина: 2.232300001196563e-05 секунд
Конец: 2.3267000215128065e-05 секунд


Выводы:

* Поиск Фибоначчи работает быстро как на отсортированных, так и на неотсортированных данных.

* Похож на бинарный поиск по производительности, но может быть менее эффективен из-за сложности вычисления чисел Фибоначчи.

In [111]:
test_search_algorithm(exp_search, "Экспоненциальный поиск")


Экспоненциальный поиск:
Неотсортированный список:
Начало: 0.007152668999624439 секунд
Середина: 6.38000201433897e-07 секунд
Конец: 5.990004865452647e-07 секунд
Отсортированный список:
Начало: 1.9880000036209823e-06 секунд
Середина: 0.007823659999994561 секунд
Конец: 0.015313828000216745 секунд


Выводы:

* Экспоненциальный поиск эффективен, если искомый элемент находится ближе к началу списка.

* На больших списках его производительность может ухудшаться, особенно если элемент находится в конце.

In [113]:
test_search_algorithm(interp_search, "Интерполяционный поиск")


Интерполяционный поиск:
Неотсортированный список:
Начало: 7.660000119358302e-07 секунд
Середина: 1.7290003597736359e-06 секунд
Конец: 6.059999577701092e-07 секунд
Отсортированный список:
Начало: 3.2829999690875412e-06 секунд
Середина: 8.401999948546291e-06 секунд
Конец: 4.628000315278769e-06 секунд


Выводы:

* Интерполяционный поиск работает очень быстро на равномерно распределённых данных.

* Идеально подходит для поиска в отсортированных списках с равномерным распределением значений.