# Тестирование АВЛ, рандомизированных и расширяющихся деревьев поиска

In [1]:
import random
import sys

from algorithms_py.trees import TreeAVL, TreeRandom, TreeSplay

sys.setrecursionlimit(20000)

Cлучайным образом выполняет операции добавления, поиска и удаления элемента в соотношении "weights". Поиск и удаление осуществляются на присутствующих в дереве элементах. Таким образом, в процессе еще происходит обход дерева.

In [2]:
def test(tree_type, N, weights=[0.8, 0.1, 0.1], shuffle=False):
    tree = tree_type()
    array = [i for i in range(N)]
    array_used = []
    if shuffle:
        random.shuffle(array)
    count = 0
    i = 0
    f = 0
    r = 0
    for k in random.choices(['i', 'f', 'r'], weights=weights, k=N*100):
        if array:
            count += 1
            if k == 'i':
                number = array.pop(0)
                tree.insert(number)
                array_used.append(number)
                i += 1
            elif k == 'f':
                if array_used:
                    number = random.choice(array_used)
                    tree.has_value(number)
                    f += 1
            else:
                try:
                    if array_used:
                        number = random.choice(array_used)
                        tree.remove(number)
                        r += 1
                # если числа нет в дереве
                except KeyError:
                    pass
        if not array:
            break
    #print(count, i, f, r)
    print('Обход дерева:', list(tree)[:10])
    print('Количество узлов:', len(list(tree)))
    return tree

## Тест №1

- Входной массив отсортирован
- Операций добавления больше, чем операций поиска и удаления
- N = 50000

In [3]:
N = 50000
weights = [5, 1, 1]

In [4]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeAVL, N, weights=weights)

Обход дерева: [0, 12, 16, 25, 28, 29, 30, 32, 35, 38]
Количество узлов: 41853


<TimeitResult : 3.22 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [5]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeRandom, N, weights=weights)

Обход дерева: [9, 17, 20, 21, 32, 36, 37, 46, 55, 56]
Количество узлов: 41730


<TimeitResult : 3.51 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [6]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeSplay, N, weights=weights)

Обход дерева: [2, 4, 11, 13, 16, 22, 29, 34, 45, 47]
Количество узлов: 41781


<TimeitResult : 9.23 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

## Тест №2

- Входной массив отсортирован
- Операций поиска больше, чем операций добавления и удаления
- N = 50000

In [7]:
N = 50000
weights = [2, 5, 1]

In [8]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeAVL, N, weights=weights)

Обход дерева: [49, 88, 115, 150, 178, 196, 231, 234, 235, 240]
Количество узлов: 33359


<TimeitResult : 4.03 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [9]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeRandom, N, weights=weights)

Обход дерева: [24, 67, 88, 101, 146, 177, 184, 202, 210, 246]
Количество узлов: 33409


<TimeitResult : 7.06 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [10]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeSplay, N, weights=weights)

Обход дерева: [30, 34, 35, 42, 107, 112, 113, 115, 126, 130]
Количество узлов: 33545


<TimeitResult : 6.82 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

## Тест №3

- Входной массив перемешан
- Операций добавления больше, чем операций поиска и удаления
- N = 50000

In [11]:
N = 50000
weights = [5, 1, 1]

In [12]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeAVL, N, weights=weights, shuffle=True)

Обход дерева: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Количество узлов: 41619


<TimeitResult : 3.12 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [13]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeRandom, N, weights=weights, shuffle=True)

Обход дерева: [2, 3, 4, 6, 7, 8, 9, 10, 11, 12]
Количество узлов: 41692


<TimeitResult : 8.41 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [14]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeSplay, N, weights=weights, shuffle=True)

Обход дерева: [0, 1, 2, 3, 4, 6, 7, 8, 9, 11]
Количество узлов: 41750


<TimeitResult : 2.71 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

## Тест №4

- Входной массив перемешан
- Операций поиска больше, чем операций добавления и удаления
- N = 50000

In [15]:
N = 50000
weights = [2, 5, 1]

In [16]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeAVL, N, weights=weights, shuffle=True)

Обход дерева: [2, 3, 4, 5, 8, 9, 12, 13, 15, 16]
Количество узлов: 33458


<TimeitResult : 3.98 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [17]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeRandom, N, weights=weights, shuffle=True)

Обход дерева: [0, 1, 3, 7, 11, 12, 13, 14, 15, 16]
Количество узлов: 33470


<TimeitResult : 9.25 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

In [18]:
%%timeit -r 1 -n 1 -o -q

tree = test(TreeSplay, N, weights=weights, shuffle=True)

Обход дерева: [0, 3, 4, 7, 8, 10, 11, 13, 14, 16]
Количество узлов: 33423


<TimeitResult : 5.02 s ± 0 ns per loop (mean ± std. dev. of 1 run, 1 loop each)>

## Выводы

|Номер теста|АВЛ|Рандомизированное|Расширяющееся|
|:--------:|---------|--------------|--------------------|
|1|3.223|3.512|9.232|
|2|4.027|7.056|6.817|
|3|3.117|8.414|2.708|
|4|3.983|9.246|5.016|

- АВЛ-дерево показывает наилучший результат во всех тестах
- Рандомизированное дерево показывает себя лучше расширяющегося в случае отсортированного массива на входе, когда операций добавления больше, чем операций поиска и удаления. При таком варианте высока вероятность перебалансировки дерева перестановкой добавляемого узла в корень поддерева.
- Расширяющееся дерево начинает показывать себя лучше рандомизированного в случае отсортированного массива на входе, операций поиска больше, чем операций добавления и удаления. При таком варианте перебалансировка дерева происходит при помощи перестановки найденного узла в корень дерева, что позволяет также ускорить поиск часто запрашиваемых элементов.

In [20]:
# для сбора замеров времени в один массив
from IPython import get_ipython
from IPython.core.magics.execution import TimeitResult

RESULTS = []

def collect_results():
    for k, v in get_ipython().__dict__['user_ns']['Out'].items():
        if v.__class__ == TimeitResult:
            RESULTS.append(round(v.worst, 3))

In [21]:
collect_results()

In [25]:
for i in range(4):
    print(RESULTS[i*3:3*(i+1)])

[3.223, 3.512, 9.232]
[4.027, 7.056, 6.817]
[3.117, 8.414, 2.708]
[3.983, 9.246, 5.016]
