Скородумов Александр

БВТ1904

Лабораторная работа №2 Методы поиска


№1

In [26]:
#Импорты
from IPython.display import HTML, display
from tabulate import tabulate
import random
import time

In [27]:
#Рандомная генерация
def random_matrix(m = 50, n = 50, min_limit = -250, max_limit = 1016):
    return [[random.randint(min_limit, max_limit) for _ in range(n)] for _ in range(m)]

In [28]:
#Бинарный поиск
class BinarySearchMap:
    def __init__(self):
        self.data = [] # хранилище (key, value) значений

    def search(self, key):
        """ Поиск индекса (во всех случаях лучше левосторонний,
            чтоб insert вставлял по убыванию) """
        l = 0
        r = len(self.data)
        while l < r:
            m = (l + r) // 2
            if self.data[m][0] < key:
                l = m + 1
            else:
                r = m
        return l    
        
    def __setitem__(self, key, value):
        """ Добавить элемент """
        index = self.search(key)
        # если ключ уже есть в таблице, то надо заменить значение
        if index < len(self.data) and self.data[index][0] == key:
            self.data[index] = (key, value)
        else:
            # иначе добавляем новую запись
            self.data.insert(index, (key, value))
    
    def __delitem__(self, key):
        """ Удалить элемент """
        index = self.search(key)
        self.data.pop(index)
    
    def __getitem__(self, key):
        """ Получить элемент """
        index = self.search(key)
        found_key, val = self.data[index]
        # если найденный индекс выдает запрашиваемый ключ
        if found_key == key:
            return val
        raise KeyError()


In [29]:
#Фибоначчиев поиск
fib_c = [0, 1]
def fib(n):
    if len(fib_c) - 1 < n:
        fib_c.append(fib(n - 1) + fib(n - 2))
    return fib_c[n]

class FibonacciMap(BinarySearchMap):
    def search(self, key):
        m = 0 
        while fib(m) < len(self.data): 
            m += 1
        offset = 0
        while fib(m) > 1:
            i = min(offset + fib(m - 1), len(self.data) - 1)
            if key > self.data[i][0]:
                offset = i
            elif key == self.data[i][0]:
                return i
            m -= 1
        if len(self.data) and self.data[offset][0] < key:
            return offset + 1
        return 0

In [30]:
#Интерполяционный поиск
def nearest_mid(input_list, lower_bound_index, upper_bound_index, search_value):
    return lower_bound_index + \
        (upper_bound_index - lower_bound_index) * \
        (search_value - input_list[lower_bound_index]) // \
        (input_list[upper_bound_index][0] - input_list[lower_bound_index][0])

class InterpolateMap(BinarySearchMap):
    def interpolation_search(self, term):
        size_of_list = len(self.data) - 1

        index_of_first_element = 0
        index_of_last_element = size_of_list

        while index_of_first_element <= index_of_last_element:
            mid_point = nearest_mid(self.data, index_of_first_element, index_of_last_element, term)

            if mid_point > index_of_last_element or mid_point < index_of_first_element:
                return None

            if self.data[mid_point][0] == term:
                return mid_point

            if term > self.data[mid_point][0]:
                index_of_first_element = mid_point + 1
            else:
                index_of_last_element = mid_point - 1

        if index_of_first_element > index_of_last_element:
            return None

In [31]:
#Бинарное дерево
class Tree:
    def __init__(self, key, value):
        self.key = key
        self.value = value
        self.left = self.right = None
        
class BinaryTreeMap:
    root = None
    
    def insert(self, tree, key, value):
        if tree is None:
            return Tree(key, value)
        if tree.key > key:
            tree.left = self.insert(tree.left, key, value)
        elif tree.key < key:
            tree.right = self.insert(tree.right, key, value)
        else:
            tree.value = value
        return tree
            
    def search(self, tree, key):
        if tree is None or tree.key == key:
            return tree
        if tree.key > key:
            return self.search(tree.left, key)
        return self.search(tree.right, key)
        
    def __getitem__(self, key):
        tree = self.search(self.root, key)
        if tree is not None:
            return tree.value
        raise KeyError()
    
    def __setitem__(self, key, value):
        if self.root is None:
            self.root = self.insert(self.root, key, value)
        else: self.insert(self.root, key, value)

№2

In [32]:
#Простое рехеширование
class HashMap:
    def __init__(self):
        self.size = 0
        self.data = []
        self._resize()
    
    def _hash(self, key, i):
        return (hash(key) + i) % len(self.data)
        
    def _find(self, key):
        i = 0;
        index = self._hash(key, i);
        while self.data[index] is not None and self.data[index][0] != key:
            i += 1
            index = self._hash(key, i);
        return index;
    
    def _resize(self):
        temp = self.data
        self.data = [None] * (2*len(self.data) + 1)
        for item in temp:
            if item is not None:
                self.data[self._find(item[0])] = item
    
    def __setitem__(self, key, value):
        if self.size + 1 > len(self.data) // 2:
            self._resize()
        index = self._find(key)
        if self.data[index] is None:  
            self.size += 1
        self.data[index] = (key, value)
    
    def __getitem__(self, key):
        index = self._find(key)
        if self.data[index] is not None:
            return self.data[index][1]
        raise KeyError()

In [33]:
#Рехеширование с помощью псевдослучайных чисел
class RandomHashMap(HashMap):
    _rand_c = [5323]
    
    def _rand(self, i):
        if len(self._rand_c) - 1 < i:
            self._rand_c.append(self._rand(i - 1))
        return (123456789 * self._rand_c[i] + 987654321) % 65546
        
    def _hash(self, key, i):
        return (hash(key) + self._rand(i)) % len(self.data)

In [34]:
#Метод Цепочек
class ChainMap:
    def __init__(self):
        self.size = 0
        self.data = []
        self._resize()
    
    def _hash(self, key):
        return hash(key) % len(self.data)
    
    def _insert(self, index, item):
        if self.data[index] is None:
            self.data[index] = [item]
            return True
        else:
            for i, item_ in enumerate(self.data[index]):
                if item_[0] == item[0]:
                    self.data[index][i] = item
                    return False
            self.data[index].append(item)
            return True
    
    def _resize(self):
        temp = self.data
        self.data = [None] * (2*len(self.data) + 1)
        for bucket in temp:
            if bucket is not None:
                for key, value in bucket:
                    self._insert(self._hash(key), (key, value))
    
    def __setitem__(self, key, value):
        if self.size + 1 > len(self.data) // 1.5:
            self._resize()
        if self._insert(self._hash(key), (key, value)):  
            self.size += 1
    
    def __getitem__(self, key):
        index = self._hash(key)
        if self.data[index] is not None:
            for key_, value in self.data[index]:
                if key_ == key:
                    return value
        raise KeyError()

Сравнение алгоритмов

In [35]:
алгоритмы = {
    'Бинарный поиск': BinarySearchMap,
    'Фибоначчиева поиск': FibonacciMap,
    'Интерполяционный поиск': InterpolateMap,
    'Бинарное дерево': BinaryTreeMap,
    'Простое рехэширование': HashMap,
    'Рехэширование с помощью псевдослучайных чисел': RandomHashMap,
    'Метод цепочек': ChainMap,
    'Стандартная функция поиска': dict
}


затраченное_время = {}
тестовые_набор = random_matrix(50, 1000)
for имя_алгоритма, Таблица in алгоритмы.items():
    копия_наборов = тестовые_набор.copy()
    время_начало = time.perf_counter()
    for набор in копия_наборов:
        таблица = Таблица()
        for значение, ключ in enumerate(набор):
            таблица[ключ] = значение
            assert таблица[ключ] == значение, f'Найденный элемент не соответствует записанному'
    время_конца = time.perf_counter()
    затраченное_время[имя_алгоритма] = (время_конца - время_начало) / len(тестовые_набор)

отсортированная_таблица_затраченного_времени = sorted(затраченное_время.items(), key=lambda kv: kv[1])
tabulate(отсортированная_таблица_затраченного_времени, headers=['Алгоритм','Время'], tablefmt='html', showindex="always")

Unnamed: 0,Алгоритм,Время
0,Стандартная функция поиска,0.000429984
1,Простое рехэширование,0.00502279
2,Метод цепочек,0.00579552
3,Интерполяционный поиск,0.00848867
4,Рехэширование с помощью псевдослучайных чисел,0.00906001
5,Бинарный поиск,0.00931886
6,Бинарное дерево,0.010458
7,Фибоначчиева поиск,0.0547007


№3

In [36]:
#Вывод результата
def tag(x, color='white'):
    return f'<td style="width:24px;height:24px;text-align:center;" bgcolor="{color}">{x}</td>'
th = ''.join(map(tag, ' abcdefgh '))
def chessboard(data):
    row = lambda i: ''.join([
        tag('<span style="font-size:24px">*</span>' * v,
            color='white' if (i+j+1)%2 else 'silver')
        for j, v in enumerate(data[i])])
    tb = ''.join([f'<tr>{tag(8-i)}{row(i)}{tag(8-i)}</tr>' for i in range(len(data))])
    return HTML(f'<table>{th}{tb}{th}</table>')

In [37]:
#Создание доски
arr = [[0] * 8 for i in range(8)]
arr[1][2] = 1
chessboard(arr)

0,1,2,3,4,5,6,7,8,9
8,,,,,,,,,8
7,,,*,,,,,,7
6,,,,,,,,,6
5,,,,,,,,,5
4,,,,,,,,,4
3,,,,,,,,,3
2,,,,,,,,,2
1,,,,,,,,,1


In [39]:
#Алгоритм
def check_place(rows, row, column):
    """ Проверяет, если board[column][row] под атакой других ферзей """
    for i in range(row):
        if rows[i] == column or \
            rows[i] - i == column - row or \
            rows[i] + i == column + row:
            return False
    return True

total_shown = 0
def put_queen(rows=[0]*8, row=0):
    """ Пытается подобрать место для ферзя, которое не находится под атакой других """
    if row == 8: # мы уместили всех 8 ферзей и можем показать доску
        arr = [[0] * 8 for i in range(8)]
        for row, column in enumerate(rows):
            arr[row][column] = 1
        return chessboard(arr)
    else:
        for column in range(8):
            if check_place(rows, row, column):
                rows[row] = column
                board = put_queen(rows, row + 1)
                if board: return board
    
put_queen()

0,1,2,3,4,5,6,7,8,9
8,*,,,,,,,,8
7,,,,,*,,,,7
6,,,,,,,,*,6
5,,,,,,*,,,5
4,,,*,,,,,,4
3,,,,,,,*,,3
2,,*,,,,,,,2
1,,,,*,,,,,1
