In [1]:
from wand.image import Image as WImage
from typing import List

# Лабораторная работа 2. Методы поиска
**Цель работы**: ознакомление с алгоритмами поиска в линейных и нелинейных структурах и оценкой эффективности алгоритмов.

## Поиск по последовательности
### Бинарный поиск
Бинарный поиск - это алгоритм поиска элемента в заранее упорядоченной по возростанию последовательности. На каждом этапе поиска происходит отсечение непрегодных элементов в зависимости от того больше ли искомый элемент серединного элемента или меньше(при условии что они не равны). За счет такого алгоритма достигается максимальная скорость поиска нужных элементов в очень больших последовательностях.
  - В худшем случае: $O(log(n))$
  - В лучшем случае: $O(1)$
  - В среднем: $O(log(n))$

### Блок-схема

In [2]:
from wand.image import Image as WImage
img = WImage(filename='./diagram.pdf')
img

PolicyError: attempt to perform an operation not allowed by the security policy `PDF' @ error/constitute.c/IsCoderAuthorized/421

### Псевдокод

```
int binary_search(int *X, int a) {
    size = sizeof(X)/sizeof(X[0])
    int mid_idx, left_idx, right_idx = nullptr, 0, size - 1
    while (true) {
        if (left_idx > right_idx) {
            return nullptr;
        }
        mid_idx = left_idx + (right_idx - left_idx) / 2
        if (X[mid_idx] < a) {
            left_idx = mid_idx + 1;
        }
        if (X[mid_idx] > a) {
            right_idx = mid_idx - 1;
        }
        if (X[mid_idxmi] == a) {
            return X[mid_idx]
        }
    }
}
```

### Особенности

Достоинства алгоритма:

    -- простота реализации
    -- очень высокая скорость поиска в больших последовательностях

Недостатки:

    -- подходит только для поиска по упорядоченной по возростанию последовательности

### Реализация

In [3]:
def binary_search(X: List, a):
    mid_idx, left_idx, right_idx = None, 0, len(X) - 1
    while True:
        if left_idx > right_idx:
            return None
        mid_idx = left_idx + (right_idx - left_idx) // 2
        if X[mid_idx] < a:
            left_idx = mid_idx + 1
        if X[mid_idx] > a:
            right_idx = mid_idx - 1
        if X[mid_idx] == a:
            return X[mid_idx]


### Тестирование

In [4]:
assert binary_search([1, 2, 3, 4, 5], 4) == 4, 'Ошибка при нахождении входящего значения'

assert not binary_search([1, 2, 3, 4, 5], 0), 'Ошибка при не нахождении не входящего значения'

In [33]:
from datetime import datetime
from random import randint
import time

sizes = [100_000, 1_000_000, 10_000_000, 100_000_000]

relation = {}

for size in sizes:
    nums = list(range(size))
    n = (size // 2) + 2
    start_time = datetime.now()
    a = binary_search(nums, n)
    delta = datetime.now() - start_time
    relation[size] = str(delta).split(':')[2]
print(relation)

{100000: '00', 1000000: '00', 10000000: '00', 100000000: '00.014561'}


Вывод: бинарный поиск очень быстрый, время поиска элемента занимает наносекунды!

## Поиск подстроки в строке
### Алгоритм Бойера — Мура
разработанный двумя учеными — Бойером (Robert S. Boyer) и Муром (J. Strother Moore), считается наиболее быстрым среди алгоритмов общего назначения, предназначенных для поиска подстроки в строке. Важной особенностью алгоритма является то, что он выполняет сравнения в шаблоне справа налево в отличие от многих других алгоритмов.

Алгоритм Бойера-Мура считается наиболее эффективным алгоритмом поиска шаблонов в стандартных приложениях и командах, таких как Ctrl+F в браузерах и текстовых редакторах. 

### Блок-схема

### Псевдокод

```
int find(string &text, string pattern){
    for(int i = 0; i < text.size() - pattern.size() + 1; i++){
        for(int j = pattern.size() - 1; j > -1; j--){
            if(text[i + pattern.size() - 1] == pattern[j]){
                
            }
        }
    }
}
```

### Особенности

### Реализация

### Тестирование

In [None]:
# 1. Найти все вхождения имени главного героя в вашем любимом литературном произведении.