## Бинарный поиск

### Для осуществления бинарного поиска необходим отсортированный массив. Чтобы его осуществить для случайного набора данных, необходимо отсортировать случайный массив, что занимает O(nlogn) временной сложности

In [1]:
import random as rd

arr = [rd.randint(-50, 50) for i in range(100)]
#print(arr)

In [2]:
arr.sort()
#print(arr)

### Так как элменты отсортированны, мы можем сказать, где находится искомый элемент относительно выбранного: справа или слева. Будем делить массив пополам каждый раз, чтобы сузить диапазон поиска, пока не найдем. Если же диапазон включает в себя один элемент, а искомый не нашелся, то значит его нет в массиве. Границы массива задаются двумя указателями l, r, которые меняются в процессе.
### Сложность алгоритма оценивается как O(logn), где n - длина массива, потому что мы каждую итерацию поиска делим рабочую часть массива пополам

In [3]:
# Бинарный поиск
def bin_search(arr, target):
    l = 0
    r = len(arr) - 1
    while l <= r:
        mid = (l + r) // 2
        if arr[mid] == target:
            return mid, target
        elif target > arr[mid]:
            l = mid + 1
        else:
            r = mid - 1
    return None

print(bin_search(arr, 510))
print(arr[15])

None
-37


In [4]:
# Добавление элемента
import bisect

bisect.insort_left(arr, -51)
#print(arr)

In [5]:
def del_el(arr, val):
    if bin_search(arr, val) is not None:
        del_i = bin_search(arr, val)[0]
        arr.pop(del_i)
    else:
        print('Такого элемента нет в массиве')

del_el(arr, -51)

## Бинарное дерево.
### Чтобы организовать дерево из случайного набора данных, необходимо привести массив в структуру сбалансированного дерева, где левый дочерний элемент всегда меньше родителя, а правый больше

### Поиск по сбалансированному бинарному дереву составляет O(logn). В несбалансированном поиск может стремиться к O(n)

In [6]:
# Класс дерева
class TreeNode:
    
    # Инициализация
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

    # Вставка
    def insert(self, target):
    
        if self.value:
            
            if target <= self.value:
                if self.left is not None:
                    self.left.insert(target)
                else:
                    self.left = TreeNode(target)
                    
            elif target > self.value:
                if self.right is not None:
                    self.right.insert(target)
                else:
                    self.right = TreeNode(target)       
        else:
            self.value = target
            
    # Поиск. Можно просто найти, можно удалить при need_del == True
    def find_1(self, target, need_del):
        # Костыль, чтобы через рекурсию у None не вызвать find_1
        if self is None or self.value is None or target == self.value:
            
            if self is not None and self.value is None:
                self = None
                
            if need_del == True:
                if self is not None:
                    self.del_el
                else:
                    return self
                    
            else:
                return self.value, self
                
        # Если искокмый меньше текущего        
        if target < self.value:
            if self.left is not None:
                return self.left.find_1(target, need_del)
            else:
                # Костыль, чтобы через рекурсию у None не вызвать find_1
                self.left = TreeNode(None)
                return self.left.find_1(target, need_del)
                
        # Если искомый больше текущего
        elif target > self.value:
            if self.right is not None:
                return self.right.find_1(target, need_del)
            else:
                # Костыль, чтобы через рекурсию у None не вызвать find_1
                self.right = TreeNode(None)
                return self.right.find_1(target, need_del)

    # Вспомогательная функция для поиска
    def find(self, target, need_del = False):
        if need_del == False:
            ans = self.find_1(target, need_del = False)
            if ans is None:
                return None, None
            else:
                return ans
        else:
            self.find_1(target, need_del = True)

    # Удаление
    def del_el(self):
        
        # Если листовой, то просто удаляем
        if self.left is None and self.right is None:
            self = None
            
        # Если один потомок, то ставим его на место родителя
        elif self.left is None and self.right is not None:
            self = self.right
        elif self.left is not None and self.right is None:
            self = self.left
            
        # Если 2 то ищем максимальный слева (он будет листовой) для замены
        else:
            self.value = self.left.find_max()

    # Поиск замены
    def find_max(self):
        if self.right:
            self.right.find_max()
        else:
            val = self.value
            self = None

    # Вывод дерева
    def out(self):
        if self.left:
            self.left.out()
        print(self.value)
        if self.right:
            self.right.out()

In [7]:
# Построение сбалансированного дерева из отсортированного массива
def sort_tree(arr):
    
    if not arr:
        return  None
        
    mid = len(arr) // 2
    root = TreeNode(arr[mid])
    root.left = sort_tree(arr[:mid])
    root.right = sort_tree(arr[mid+1:])

    return root

In [8]:
# Генерация и сортировка массива
arr = [rd.randint(-50, 50) for i in range(1000)]
arr.sort()

In [9]:
# Создание дерева из отсортированного массива
tree = sort_tree(arr)

In [10]:
# Вставка элемента
tree.insert(-61)

In [11]:
# Нахождение элемента
tree.find(-61)

(-61, <__main__.TreeNode at 0x1f6a15f7fe0>)

In [12]:
# Нахождение и удаление элемента
tree.find(-62, need_del = True)

In [13]:
# Нахождение и удаление элемента
tree.find(-61, need_del = True)

In [14]:
# Вывод дерева
#tree.out()

### Сложность поиска по бинарному дереву составляет O(logn). Преимущества деревьев в том, что вставка и удаление элементов не приводит к созданию нового дерева, из-за чего дереьвя удобнее в плане динамических операций.

## Фибоначиев поиск
### Фибоначиев поиск похож на бинарный. Его отличие в том, что мы разбиваем массив не на половинки, а на части, которые являются элементами последовательности фибоначи, где n = n-1 + n-2 (n0 = 0, n1 = 1). Сравнивается с элементом fib(n-2),  

In [15]:
# f - массив чисел Фибоначчи. Для потенциального масштабирования использования функции

In [16]:
f = [0, 1]

In [17]:
def asd():
    return 1, 2
asd()

(1, 2)

In [18]:
import bisect

# Поиск числа Фибоначчи и заполнение массива f
def fib(ler):
    global f
    if ler > f[-1]: 
        while f[-1] + f[-2] <= ler:
            f.append(f[-1] + f[-2])
        return f[-1]
    else:
        n = bisect.bisect_left(f, ler)
        return [f[n], n]

In [19]:
import random as rand
arr = [rand.randint(-50, 50) for i in range(100)]
arr.sort()

In [20]:
# Этот код наполняет множество с числами Фибоначчи, чтобы при необходимости не считать их заново

In [21]:
ler = 1000
for i in range(1000):
    qw = fib(ler)
    ler*=2

In [22]:
# Поиск Фибоначчи
def fib_search(arr, target):
    f_n = fib(len(arr))
    n, f_n = f_n[1], f_n[0]
    f_n1 = f[n-1]
    f_n2 = f[n-2]
    offset = -1

    # Пока все числа Фибонначи положительные 
    while f_n > 1:
        # Ищем, сравнивая с f - 2
        i = min(offset + f_n2, len(arr) - 1)
        
        # Нашли
        if arr[i] == target:
            return i
            
        # Если больше, то счещаемся на f - 2 - 1 вправо
        elif target > arr[i]:
            f_n = f_n1
            f_n1 = f_n2
            f_n2 = f_n - f_n1
            offset = i
        # Если меньше, то счещаемся на f - 2 - 2 влево
        else:
            f_n = f_n2
            f_n1 -= f_n2
            f_n2 = f_n - f_n1
            
    # Последний элемент
    if f_n1 and arr[offset] == target:
        return offset + 1

    # Не нашелся
    return -1

In [23]:
# Поиск
fib_search(arr, -35)

17

In [24]:
# Вставка
bisect.insort_left(arr, 12)

In [25]:
# Удаление
del_el(arr, 12)

In [26]:
# Удаление
del_el(arr, -123)

Такого элемента нет в массиве


### В худшем случае сложность Фибоначчиева посика O(logn) (хуже чем у бинарного), но в среднем лучше чем у бинарного

## Интерполяционный поиск

### Похож на бинарный поиск, но отличается тем, что элемент, с которым сравниваем, вычисляется по формуле интерполяции. Такой поиск эффективен в данных, которые имеют множественные повторения и распределены равномерно. Сложность интерполяционного поиска составляет O(log(log(n))) в среднем при хороших данных.

In [27]:
# Интерполяционный поиск
def inter_search(arr, target):
    l = 0
    r = len(arr) - 1

    while l <= r and arr[l] <= target <= arr[r]:
        # Используем формулу интерполяции для оценки позиции ключа
        pos = l + int(((target - arr[l]) * (r - l)) / (arr[r] - arr[l]))

        if arr[pos] == target:
            return pos
        elif arr[pos] < target:
            l = pos + 1
        else:
            r = pos - 1

    return -1

In [28]:
import random as rand
arr = [rand.randint(-50, 50) for i in range(100)]
arr.sort()

In [29]:
inter_search(arr, -4)

46

In [30]:
# Вставка
bisect.insort_left(arr, 12)

In [31]:
# Удаление
del_el(arr, 12)

In [32]:
# Удаление
del_el(arr, -123)

Такого элемента нет в массиве
