# 7. Gyakorlat (keresőfák)
A mai órán az egyik legfontosabb adatszerekezettel fogunk megismerkedni: a keresőfákkal. Már a nevük is sejteti azt, hogy milyen funkciókat fognak ezek kiválóan ellátni: Ha meg szeretnénk keresni egy, az adatszerkezetben fellelhető értéket, akkor a keresőfák fogják a leggyorsabb futási időt biztosítani. Természetesen a keresőfáknak számos variánsa létezik, a konkrét feladattól is függ, hogy pontosan melyiket kell majd használnunk. Az erre a kurzusra épülő Algoritmusok és Adatszerkezetek II. gyakorlaton sokkal részletesebben is kielemezzük a keresőfákat.
## Néhány definició
- **Fa:** Összefüggő, körmentes gráf
- **Levél:** A fa elsőfokú csúcsai
- **Belső csúcs:** Nem levél csúcs a fában
- **Gyökeres fa:** Kitüntetett csúccsal (gyökér) rendelkező fa
- **Bináris fa:** Gyökeres fa, ahol minden csúcsnak *legfeljebb* 2 gyereke van
- **Teljes bináris fa:** Olyan bináris fa, amelyben minden szint "teljesen ki van töltve".
- **Majdnem teljes bináris fa:** Olyan bináris fa, amelyben maximum a legalsó szint nincs teljesen kitöltve, csak balról jobbra haladva kitöltött néhány elemig
- **Kiegyensúlyozott bináris fa:** Olyan bináris fa, ahol minden csúcs bal és jobboldali részfáinak magassága max. 1-gyel tér el.


**Kérdés:** Hány éle van egy fának, ha $n$ csúcsa van?

**Válasz:** $n-1$, hiszen ennyi minimum kell ahhoz, hogy összefüggő legyen a gráf, $n$ él esetében viszont már kör képződik valahol.

**Feladatmegoldás:** Békési József PPT 7. gyakorlat 1. feladat (gyakorlaton megoldjuk)

## Fa ábrázolások
- Gyerek éllista
- Első gyerek, testvér
- Bináris fa

In [71]:
# Gyerek éllista ábrázolás
class Node_childListRepr(object):
    def __init__(self):
        self.key = None
        self.children = []

# Első gyerek, testvér ábrázolás
class Node_siblingRepr(object):
    def __init__(self):
        self.key = None
        self.sibling = None
        self.firstChild = None

# Leggyakoribb: bináris fa ábrázolás
class Node(object):
    def __init__(self, key):
        self.key = key
        self.left = None
        self.right = None
    
    def __repr__(self):
        # a __repr__ függvény megmondja, hogy milyen formátumban legyen kiírva egy Node típusú objektum.
        return f'[Key: {self.key}, Left: {self.left}, Right: {self.right}]'

a = Node(3)
b = Node(4)
c = Node(9)
a.left = b
a.right = c
print(a)

[Key: 3, Left: [Key: 4, Left: None, Right: None], Right: [Key: 9, Left: None, Right: None]]


## Bináris keresőfa (Binary search tree - BST)
**Def.:** Bináris keresőfának nevezünk minden olyan bináris fát, amelyre teljesül, hogy bármely, fában szereplő $x$ csúcsra igaz az, hogy ha $y$ az $x$ baloldai részfájának egy csúcsa, akkor $key(y) \leq key(x)$, ha pedig $y$ az $x$ jobboldali részfájának egy csúcsa, akkor $key(y) \geq key(x)$.

**Feladatmegoldás:** Próbáljuk kigondolni, hogyan lehet keresni, beszúrni egy ilyen adatszerkezetbe. Hogyan találjuk meg egy részfa minimális, maximális csúcsait? Ehhez felhasználjuk a gyakorlaton a Békési József PPT 7. gyakorlat feladatait. Van ötletünk a törlésre is?

In [63]:
def search(root, key):
    '''
    A keresés nagyon egyszerűen megvalósítható rekurzióval:
    inputunk egy csúcs, ahonnan indítjuk a keresést, és a keresett kulcs.
    '''
    # ha megtaláltuk a keresett kulcsot, térjünk vissza a csúccsal, 
    # ha pedig a fa aljára értünk, de nincs meg a csúcs, akkor null-lal térjünk vissza.
    if root.key == key or root is None:
        return root
    # ha az aktuális kulcsnál nagyobb értéket keresünk, keressünk tovább jobbra.
    if key > root.key:
        return search(root.right, key)
    # ha az aktuális kulcsnál kisebb értéket keresünk, keressünk tovább balra.
    if key < root.key:
        return search(root.left, key)

    
def insert(root, key):
    '''
    A beszúrás hasonlóan egyszerű:
    inputunk egy csúcs, ahonnan indítjuk a beszúrást (kezdetben a gyökér), és a beszúrandó kulcs.
    '''
    # ha elértünk egy olyan helyet, ahol még nincs csúcs, akkor erre a helyre mehet a beszúrás.
    if root is None:
        return Node(key)
    # ha az aktuális kulcsnál nagyobb a beszúrandó kulcs, akkor szúrjuk be a kulcsot rekurzívan a jobb részfába.
    if key > root.key:
        root.right = insert(root.right, key)
    # ha az aktuális kulcsnál kisebb a beszúrandó kulcs, akkor szúrjuk be a kulcsot rekurzívan a bal részfába.
    if key < root.key:
        root.left = insert(root.left, key)
        
    return root

# megkeresi az adott gyökérrel rendelkező fában a minimális csúcsot. 
# Folyamatos balra haladással meg fogjuk találni.
def minNode(root):
    currNode = root
    while (currNode is not None) and (currNode.left is not None):
        currNode = currNode.left
        
    return currNode

# megkeresi az adott gyökérrel rendelkező fában a maximális csúcsot. 
# Folyamatos jobbra haladással meg fogjuk találni.
def maxNode(root):
    currNode = root
    while (currNode is not None) and (currNode.right is not None):
        currNode = currNode.right
        
    return currNode

def remove(root, key):
    '''
    Törlésnél inputunk egy csúcs, ahonnan indítjuk a törlést (kezdetben a gyökér), és a törlendő kulcs.
    '''
    # ha az aktuális kulcsnál nagyobb a törlendő kulcs, akkor töröljük a kulcsot rekurzívan a jobb részfából.
    if key > root.key:
        root.right = remove(root.right, key)
    # ha az aktuális kulcsnál kisebb a törlendő kulcs, akkor töröljük a kulcsot rekurzívan a bal részfából.
    if key < root.key:
        root.left = remove(root.left, key)
    
    # ha megtaláltuk a törlendő kulcsot, akkor 3 esetet különböztetünk meg.
    if key == root.key:
        
        # ha nincs gyereke a csúcsnak, akkor egyszerűen null-ra állítjuk.
        if root.left is None and root.right is None:
            return None
        
        # ha csak jobb gyereke van, akkor berakjuk a jobb gyereket a helyére.
        elif root.left is None:
            return root.right
        
        # ha csak bal gyereke van, akkor berakjuk a bal gyereket a helyére.
        elif root.right is None:
            return root.left
        
        # ha két gyereke van, akkor megkeressük a megelőzőjét (vagy rákövetkezőjét),
        # beírjuk ennek a kulcsát a törlendő helyére, majd kitöröljük a megelőzőt (vagy rákövetkezőt).
        else:
            tmp = minNode(root.right)
            root.key = tmp.key
            root.right = remove(root.right, tmp.key)
        
    

In [66]:
a = Node(3)
insert(a,7)
insert(a,8)
insert(a,2)
print(a)

[Key: 3, Left: [Key: 2, Left: None, Right: None], Right: [Key: 7, Left: None, Right: [Key: 8, Left: None, Right: None]]]


In [65]:
remove(a,2)
print(a)

[Key: 3, Left: None, Right: [Key: 7, Left: None, Right: [Key: 8, Left: None, Right: None]]]


## Futási idők
Gondoljuk végig egy kicsit, hogy legrosszabb esetben milyen futási időket fogunk kapni beszúrásra, törlésre, keresésre. Ha emlékszünk még az első gyakorlatokra, pl. a bináris keresésre, mikor úgy kerestünk egy rendezett tömbben, hogy folyamatosan felezgettük a tömbünket, akkor gondolhatnánk, hogy tulajdonképpen itt is erről van szó: egy szép BST esetében egy jobbra, vagy balra lépéssel felezünk egyet az adathalmazon, tehát ha $n$ a BST-ben található csúcsok száma, akkor ezek a műveletek $O(\log_2 n)$-esek lesznek. Igenám, de mi van akkor, ha a fánk nagyon "csúnya", teljesen balra, vagy jobbra "lejt"? Ezekben az esetekben nem tudjuk kihasználni a BST előnyeit, az összes művelet $O(n)$ költségű lesz, tehát ennyi erővel listába is rakhattam volna őket. Arról, hogy ezt a problémát hogyan lehet kivédeni, és milyen módszerek vannak arra, hogy "egyensúlyban tartsuk" ezeket a keresőfákat, az Algoritmusok és adatszerkezetek II. kurzuson fogunk beszélni. Végül lássunk egy ilyen "rossz" példát:

In [67]:
a = Node(1)
insert(a,2)
insert(a,3)
insert(a,4)
insert(a,5)
insert(a,6)
print(a)

[Key: 1, Left: None, Right: [Key: 2, Left: None, Right: [Key: 3, Left: None, Right: [Key: 4, Left: None, Right: [Key: 5, Left: None, Right: [Key: 6, Left: None, Right: None]]]]]]
