<a href="https://colab.research.google.com/github/WojtekD5/python/blob/main/wlasno%C5%9Bci_drzew_optymalne_drzewo_poszukiwan.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Dynamiczne struktury danych i ich przeszukiwanie

Wyobraźmy sobie zadanie przeszukania pewnego zbioru, który został utworzony dynamicznie. Jego dynamiczność oznacza, że poszczególne elementy w pamięci muszą wskazywać kolejne elementy tej samej struktury. Dobrym przykładem jest tutaj lista




In [None]:
class ListElement(object):
    def __init__(self, data, left = None, right = None):
        self.data = data
        self.left = left
        self.right = right

class List(object):
    
    def __init__(self):
        self.begin = None
    
    def append(self, item):
        current = self.begin
        if current is None:
            self.begin = ListElement(item)
        else:
            while current.right is not None:
                current = current.right;
            created = ListElement(item, left = current)
            current.right = created
    
    def print(self):
        current = self.begin
        while current is not None:
            print(f'->{current.data}', end='')
            current = current.right
            
            

In [None]:
lista = List()
lista.append(4)
lista.append(2)
lista.append(6)
lista.append(1)
lista.append(3)
lista.append(5)
lista.append(7)
lista.print()

->4->2->6->1->3->5->7

Zauważmy, że w tej strukturze - choć dodawania lub usuwanie elementów działa bardzo sprawnie - wyszukiwanie natomiast już takie szybkie nie jest. Na taką strukturę dynamiczną można patrzeć jak na graf umieszczony w pamięci komputera. Każda struktura dynamiczna ma swój ustalony początek i jej pesymistyczny czas przeszukania wynosi proporcjonalnie tyle co najdłuższa ścieżka w tym grafie.

W przypadku listy składującej $n$ elementów najdłuższa ścieżka ma długość $n-1$. Wyszukiwanie jest więc pesymistycznie liniowe $O(n)$. Rozważmy zatem możliwość użycia grafu do stworzenia struktury o krótszych najdłuższych ścieżkach. Pytanie jednak jaki nadać kształt tej strukturze w pamięci. Zastanówmy się jaka własność grafu powodowałaby marnowanie czasu naszego przeszukiwania najbardziej?

Oczywiście cykle !! Każdy cykl to potencjalna szansa na powtórzenie tych samych sprawdzeń !!

Jakie grafy nie mają cykli - oczywiście drzewa!

Rozważmy analogiczną do naszej $n$ elementowej listy, strukturę opartą o drzewo binarne (wspominane wcześniej drzewo BST). Okazuje się, że najdłuższa ścieżka w takim grafie będzie dobrze przybliżana przez $\ln(n)$

# Własności drzew

Dla drzew można zdefiniować kilka istotnych własności. W tej lekcji opiszemy 3 z nich

## Pełne drzewo

Drzewo binarne nazywamy pełnym jeśli spełniony jest następujący warunek, że dla każdego węzła drzewa zachodzi jeden z warunków

1. Węzeł nie ma żadnych potomków,
1. Węzeł ma dwóch potomków.

Oznacza to, że w drzwie nie ma węzłów z jednym potomkiem. 

## Kompletne drzewo

Drzewem kompletnyme (zupełnym) nazywamy takie drzewo binarne w którym spełniony jest następujący warunek:

*Jeśli mamy dostępny węzeł z tego drzewa, to na tej samej głębokości drzewa muszą istnieć węzły położone na lewo od niego.*

Inaczej można by również warunek zadać, że w drzewie tym numerowanie (przechodzenie) poziomami przypisuje te same numery (przechodzi w tym samym momencie) do tych samych węzłów co dla drzewa doskonałego. Szybko śpieszymy z wyjaśnieniem czym jest drzewo doskonałe

## Drzewo doskonałe

Drzewem binarnym doskonałym nazwiemy nazwiemy binarne drzewo pełne gdzie wszystkie liście znajdują się w tej samej odległości od korzenia. 

Oznacza to, że jedynie najniższy poziom drzewa może nie posiada potomstwa. Jeśli $n$ oznacza głebokość drzewa (maksymalną odległość od korzenia) to węzły na głębokości $1,\ldots, n-1$ mają po 2 potomków, a te na głębokości $n$ nie mają żadnego.

## Przykłady drzew

Jak wyglądają omawiane drzewa przedstawia poniższy schemat

![](https://github.com/rroszczyk/Python/raw/master/drzewa/cztery_drzewa.png)


# Przykładowe implementacje drzew i konwersja typów drzew
Przyjrzyjmy się następującej implementacji drzewa binarnego oraz drzewa z dowolną liczbą liści

In [None]:
class BinaryTreeElement(object):

    def __init__(self, item, left = None, right = None):
        self.item = item
        self.left = left
        self.right = right
        
    def depth(self):
        depths = [1]
        if self.left is not None:
            depths.append(self.left.depth()+1)
        if self.right is not None:
            depths.append(self.right.depth()+1)
        #print(f'DEBUG dep of element {self.item} = {depths}')
        return max(depths)
    
        
class BinaryTree(object):
    

    def __init__(self, root = None):
        self.root : BinaryTreeElement = root
            
    def depth(self):
        if self.root is None:
            return 0
        else:
            return self.root.depth()
    
    def plot(self):
        
        def plot_k_spaces(k):
            for _ in range(k):
                    print(' ', end='')
        
        dep = self.depth()
        level = [self.root]
        next_level = []
        while len(level) > 0:
            #print(f'DEBUG len(levels) {len(level)} , dep {dep}')
            for element in level:
                if element is None:
                    plot_k_spaces(2**dep*2)
                    next_level.append(None)
                    next_level.append(None)
                else:        
                    plot_k_spaces(2**dep)
                    print(element.item,end='')
                    plot_k_spaces(2**dep-1)
                    next_level.append(element.left)
                    next_level.append(element.right)
            is_done = all([ element is None for element in next_level])
            level = next_level
            next_level = []
            dep -= 1
            print('')
            if is_done:
                break;

                    
        
        

In [None]:
row31 = BinaryTreeElement(1)
row32 = BinaryTreeElement(3)
row33 = BinaryTreeElement(6)
row34 = BinaryTreeElement(9)
row21 = BinaryTreeElement(2, left = row31, right = row32)
row22 = BinaryTreeElement(8, left = row33, right = row34)
row1 = BinaryTreeElement(5, left = row21, right = row22)
tree = BinaryTree(row1)
tree.plot()

        5       
    2       8   
  1   3   6   9 



Z drugiej strony zupełnie analogicznie możemy utworzyć drzewo gdzie węzły posiadają dowolną liczbą liści

In [None]:
class TreeElement(object):

    def __init__(self, item, leafs=[]):
        self.item = item
        self.leafs = leafs

    def depth(self):
        depths = [1]
        for leaf in self.leafs:
            depths.append(leaf.depth() + 1)
        return max(depths)

    def plot(self, new_line, indent=0):
        def plot_k_spaces(k):
            for _ in range(k):
                    print(' ', end='')
        if new_line:
            print('')
            plot_k_spaces(indent)
        print(self.item, '-', sep='', end='')
        next_line = False
        for leaf in self.leafs:
            leaf.plot(new_line = next_line, indent=indent + len(str(self.item)) + 1)
            next_line = True



class Tree(object):

    def __init__(self, root=None):
        self.root: TreeElement = root

    def depth(self):
        if self.root is None:
            return 0
        else:
            return self.root.depth()

    def plot(self):
        if self.root is not None:
            self.root.plot(new_line=False)

                    
        
        

In [None]:
row31 = TreeElement(1)
row32 = TreeElement(3)
row32_a = TreeElement(0)
row33 = TreeElement(6)
row34 = TreeElement(9)
row21 = TreeElement(2, leafs = [row31, row32, row32_a])
row22 = TreeElement(8, leafs = [row33, row34])
row1 = TreeElement(5, leafs = [row21,row22])
tree = Tree(row1)
tree.plot()

5-2-1-
    3-
    0-
  8-6-
    9-

Drzewa niebinarne są rzadko spotykane w implementacjach informatycznych. W drzewie o $n$ liściach trzeba bowiem wykonać pesymistycznie $n-1$ porównań zanim zdecyduje się do którego liścia przejdzie się w dalszej części. Tymczasem drzewo binarne wymaga dokładnie $1$ porównania. 

Znany jest też algorytm dokonujący konwersji pomiędzy drzewem o dowolnej liczności liści a drzewem binarnym.

W drzewie konwersji obowiązuje zasada, że

* Jeśli element jest lewym dowiązaniem - to jest potomkiem danego węzła;
* Natomiast jeśli jest prawy dowiązeniem - to jest rodzeństwem danego węzła;

In [None]:
def convertToBinaryTree(tree):

    def convertNode(node, siblings=[]):
        left = None
        if node.leafs: # są potomkowie trzeba generować nowych lewych
            next_siblings = node.leafs[:]
            item = next_siblings.pop(0)
            left = convertNode(item, siblings=next_siblings)
        right = None
        if len(siblings) > 0:
            item = siblings.pop(0)
            right = convertNode(item, siblings=siblings)
        return BinaryTreeElement(item=node.item, left = left, right = right)

    if tree.root is None:
        return BinaryTree()
    return BinaryTree(root=convertNode(tree.root))


In [None]:
bt = convertToBinaryTree(tree)
bt.plot()

                                5                               
                2                                               
        1               8                                       
            3       6                                           
              0       9                                         


# Generowanie optymalnego drzewa wyszukań

Widzimy, że drzewo wygenerowane w ostatnim przykładzie jest drzewem bardzo dalekim od pełnego. Zauważmy, że wyszukanie w takim drzewie binarnym konkretnej wartości będzie w tej sytuacji nie optymalne. W ostatniej części skupimny się na wygenerowaniu takiego drzewa dla konkretnego zbioru liczb. 

In [None]:
def max_2_power(value):
    if value == 0:
        return 0
    result = 1
    while result * 2 < value:
        result *= 2
    return result


def optimal_binary_tree_sr(liczby):  # s - sorted , r-recurent
    length = len(liczby)
    if length == 0:
        return None
    split = max_2_power(length)-1
    left = optimal_binary_tree_sr(liczby[:split])
    item = liczby[split]
    right = optimal_binary_tree_sr(liczby[split+1:])
    return BinaryTreeElement(item=item, left=left, right=right)


def optimal_binary_tree(liczby):
    liczby = sorted(liczby)
    length = len(liczby)
    if length == 0:
        root = None
    else:
        root = optimal_binary_tree_sr(liczby)
    return BinaryTree(root=root)

In [None]:
liczby = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15]

obt = optimal_binary_tree(liczby)
obt.plot()


                8               
        4               12       
    2       6       10       14   
  1   3   5   7   9   11   13   15 


In [None]:
liczby = [1,3,5,7,9,11,13,15,2,4,6,8,10,12,14]

obt = optimal_binary_tree(liczby)
obt.plot()

                8               
        4               12       
    2       6       10       14   
  1   3   5   7   9   11   13   15 


W tak wygenerowanym drzewie poszukiwanie konkretnych wartości jest już optymalne pod wzlędem długości ścieżki poszukiwań. 

Zauważmy jednak pewne niedostateczności tego rozwiązania:

* Cały proces zaczyna się od przesortowania całego zbioru $O(n \ln n)$;
* Postać tego drzewa będzie jednak optymalna tak długo jak nie będzie się zmieniać. Pod wpływem zmian kształtu zbioru, optymalność może zostać zaburzona.

Pomocne w naprawieniu tej sytuacji będzie - omawiana za jakiś czas technika balansowania drzew - i ostateczna postać w postaci struktury danych nazywanej drzewem czarno-czerwonym.

In [None]:
class BinaryTree:
    def __init__(self, data):
        self.left = None
        self.right = None
        self.data = data

    def insert(self, data):
        if self.data:
            if data < self.data:
                if self.left is None:
                    self.left = BinaryTree(data)
                else:
                    self.left.insert(data)
            elif data > self.data:
                if self.right is None:
                    self.right = BinaryTree(data)
                else:
                    self.right.insert(data)
        else:
            self.data = data

    def findval(self, lkpval):
        if lkpval < self.data:
            if self.left is None:
                return str(lkpval) + " brak elementu"
            return self.left.findval(lkpval)
        elif lkpval > self.data:
            if self.right is None:
                return str(lkpval) + " brak elementu"
            return self.right.findval(lkpval)
        else:
            return str(self.data) + " został znaleziony"

    def LongwisePrintTree(self, lvl):                 # przeglądanie wzdłóżne
        print(f"{lvl}: {self.data}")                  
        if self.left:
            self.left.LongwisePrintTree(lvl + 1)
        if self.right:
            self.right.LongwisePrintTree(lvl + 1)

    def TransverseAlongPrintTree(self, lvl):          # przeglądanie poprzeczne
        if self.left:
            self.left.TransverseAlongPrintTree(lvl + 1)
        print(f"{lvl}: {self.data}")                  
        if self.right:
            self.right.TransverseAlongPrintTree(lvl + 1)

    def ReversePrintTree(self, lvl):                  # przeglądanie wsteczne
        if self.left:
            self.left.ReversePrintTree(lvl + 1)
        if self.right:
            self.right.ReversePrintTree(lvl + 1)                        
        print(f"{lvl}: {self.data}")                              

root = BinaryTree(4)
root.insert(2)
root.insert(6)
root.insert(1)
root.insert(3)
root.insert(5)
root.insert(7)
print(root.findval(7))
print(root.findval(8))
print("Przeglądanie wzdłóżne")
root.LongwisePrintTree(0)
print("Przeglądanie poprzeczne")
root.TransverseAlongPrintTree(0)
print("Przeglądanie wsteczne")
root.ReversePrintTree(0)

7 został znaleziony
8 brak elementu
Przeglądanie wzdłóżne
0: 4
1: 2
2: 1
2: 3
1: 6
2: 5
2: 7
Przeglądanie poprzeczne
2: 1
1: 2
2: 3
0: 4
2: 5
1: 6
2: 7
Przeglądanie wsteczne
2: 1
2: 3
1: 2
2: 5
2: 7
1: 6
0: 4


In [None]:
class BSTNode:
    def __init__(self, val=None):
        self.left = None
        self.right = None
        self.val = val

    def insert(self, val):
        if not self.val:
            self.val = val
            return

        if self.val == val:
            return

        if val < self.val:
            if self.left:
                self.left.insert(val)
                return
            self.left = BSTNode(val)
            return

        if self.right:
            self.right.insert(val)
            return
        self.right = BSTNode(val)

    def get_min(self):
        current = self
        while current.left is not None:
            current = current.left
        return current.val

    def get_max(self):
        current = self
        while current.right is not None:
            current = current.right
        return current.val

    def delete(self, val):
        if self == None:
            return self
        if val < self.val:
            if self.left:
                self.left = self.left.delete(val)
            return self
        if val > self.val:
            if self.right:
                self.right = self.right.delete(val)
            return self
        if self.right == None:
            return self.left
        if self.left == None:
            return self.right
        min_larger_node = self.right
        while min_larger_node.left:
            min_larger_node = min_larger_node.left
        self.val = min_larger_node.val
        self.right = self.right.delete(min_larger_node.val)
        return self

    def exists(self, val):
        if val == self.val:
            return True

        if val < self.val:
            if self.left == None:
                return False
            return self.left.exists(val)

        if self.right == None:
            return False
        return self.right.exists(val)

    def preorder(self, vals):
        if self.val is not None:
            vals.append(self.val)
        if self.left is not None:
            self.left.preorder(vals)
        if self.right is not None:
            self.right.preorder(vals)
        return vals

    def inorder(self, vals):
        if self.left is not None:
            self.left.inorder(vals)
        if self.val is not None:
            vals.append(self.val)
        if self.right is not None:
            self.right.inorder(vals)
        return vals

    def postorder(self, vals):
        if self.left is not None:
            self.left.postorder(vals)
        if self.right is not None:
            self.right.postorder(vals)
        if self.val is not None:
            vals.append(self.val)
        return vals

In [None]:
nums = [12, 6, 18, 19, 21, 11, 3, 5, 4, 24, 18]
bst = BSTNode()
for num in nums:
  bst.insert(num)
print("preorder:")
print(bst.preorder([]))
print("#")

print("postorder:")
print(bst.postorder([]))
print("#")

print("inorder:")
print(bst.inorder([]))
print("#")

nums = [2, 6, 20]
print("deleting " + str(nums))
for num in nums:
  bst.delete(num)
print("#")

print("4 exists:")
print(bst.exists(4))
print("2 exists:")
print(bst.exists(2))
print("12 exists:")
print(bst.exists(12))
print("18 exists:")
print(bst.exists(18))

preorder:
[12, 6, 3, 5, 4, 11, 18, 19, 21, 24]
#
postorder:
[4, 5, 3, 11, 6, 24, 21, 19, 18, 12]
#
inorder:
[3, 4, 5, 6, 11, 12, 18, 19, 21, 24]
#
deleting [2, 6, 20]
#
4 exists:
True
2 exists:
False
12 exists:
True
18 exists:
True
