# Gretige Algoritmen: theorie

## 1. Algemene beschouwingen

### 1.1 De gretige aanpak

Gretige algoritmen lossen optimalisatieproblemen op door bij elke stap de beste lokale keuze te maken, in de hoop het globale optimum te vinden. Gretige algoritmen zijn relatief eenvoudig en gemakkelijk te implementeren, en tegelijk efficiënt in termen van tijdscomplexiteit. Ze hebben meestal de voorkeur boven een ander algoritme bij problemen waar beiden tot een oplossing leiden. Een typisch voorbeeld is het kortstepad-probleem, dat voorkomt in elke routeplanner (bv. Google Maps). Het gretige algoritme van Dijkstra heeft de voorkeur boven het meer geavanceerde algoritme van Bellman-Ford.

Typisch werkt een gretig algoritme als volgt.

1. Begin met de begintoestand van het probleem. Dit is het startpunt van waaruit je keuzes begint te maken.

2. Evalueer alle mogelijke keuzes die je kunt maken vanuit de huidige toestand.

3. Kies de optie die op dat moment het beste lijkt, ongeacht de gevolgen op lange termijn. Dit is het ''gretige'' deel.

4. Ga naar de nieuwe toestand op basis van je gekozen optie. Dit wordt je nieuwe startpunt voor de volgende iteratie.

5. Herhaal stap 2-4 totdat je de eindtoestand bereikt of geen verdere vooruitgang meer mogelijk is.

<span style="color:#1569C7">**Voorbeeld.**</span> Neem aan dat je munten hebt met waarden `[1, 2, 5, 10]` en dat je met een minimaal aantal munten een geheel bedrag (bv. 39) moet vormen. Het gretige algoritme voor dit probleem ziet er als volgt uit.

1. Stel het 'nog te vormen bedrag' gelijk aan 39 en de 'lijst met gekozen munten' aan `[0, 0, 0, 0]`.

2. Neem de grootste muntwaarde die kleiner dan of gelijk aan het nog te vormen bedrag. In de eerste stap is dit 10.

3. Verlaag het bedrag met deze muntwaarde en voeg de munt toe aan de oplossing.

4. Herhaal stap 2-3 totdat het bedrag gelijk is aan nul. (We nemen aan dat muntwaarde 1 altijd beschikbaar is).

Een Python-programma hiervoor wordt hieronder weergegeven.  

```python
waarden = [1, 2, 5, 10]
munten = [0, 0, 0, 0]
restbedrag = 39

while restbedrag > 0:
    # overloop de lijst met munten van eind naar begin
    for i in range(n-1, -1, -1):
        # bereken het aantal gehele keren dat de volgende grootste munt in het restbedrag kan  
        aantal = restbedrag // waarden[i]
        # voeg dit aantal toe aan de lijst en verlaag het bedrag
        munten[i] = aantal
        restbedrag -= aantal * waarden[i]

print('Van de munten met waarden ', waarden, 'heb je er', munten, 'nodig om', restbedrag, 'te vormen.')
```

Het gretige algoritme leidt niet altijd tot de beste oplossing voor dit probleem. Ga dit algoritme maar eens na voor het bedrag 20 en muntwaarden `[1, 10, 16]`.

### 1.2 Technieken voor gretige algoritmen

https://www.geeksforgeeks.org/greedy-algorithms-general-structure-and-applications/

Een probleem kan vaak (benaderd) opgelost worden met een gretig algoritme, als het in kleinere delen kan worden opgesplitst. In het muntenprobleem hierboven bijvoorbeeld, kiezen we eerst zoveel mogelijk de grootste muntenwaarde, en verkleinen het bedrag vervolgens. Het resterende deelprobleem bestaat nu in het vormen van het kleinere bedrag.

Er zijn twee technieken die je concreet kan gebruiken om een gretig algoritme om te zetten in Python-code.

1. **Sortering.** In het muntenprobleem doorloopten we de lijst met muntwaarden van hoogste naar laagste waarde. Bij andere optimalisatieproblemen wil je eerst de meest dringende taak afwerken, de grootste zak opvullen, de goedkoopste leverancier nemen ...

2. **Prioriteitswachtrij.** Wanneer je bij het oplossen van het probleem de lijst dynamisch moet sorteren, bijvoorbeeld omdat je aan het begin nog niet alle gevallen kent of er gevallen worden toegevoegd, is het aangeraden om een specifieke datastructuur te gebruiken. Een ''prioriteitswachtrij'' is een geordende lijst waar elementen aan de achterzijde worden toegevoegd, en verwijdering aan de voorzijde. Op de werking hiervan gaan we in een volgende paragraaf in.

<span style="color:#1569C7">**Opgaven.**</span> Maak oefening 1 en 2.

## 2. Wachtrijen

Een wachtrij (*queue*) is een lineaire datastructuur die het FIFO-principe (First In First Out) volgt: het eerste element dat wordt ingevoegd, wordt er als eerste uitgehaald. Een wachtrij is dus net als een rij mensen die wachten om een kaartje te kopen, waarbij de eerste persoon in de rij de eerste persoon is die bediend wordt.

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_queue1.png' width='50%' >

Er zijn verschillende soorten wachtrijen.
* Een simpele FIFO-wachtrij laat toe om elementen na elkaar toe te voegen aan het einde, en element in hun volgorde van toevoeging te verwijderen.
* Een prioriteitswachtrij (*priority queue*) laat toe om elementen toe te voegen, maar plaatst ze in de wachtrij volgens hun prioriteit. Elementen met de hoogste prioriteit, worden eerst uit de wachtrij gehaald.

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_queue2.png' width='50%' >

### 2.1 Gebruik van de `heapq` library

We zullen werken met wachtrijen via de ingebouwde Python-library `heapq`. Je vertrekt steeds van een lijst:

```python
pq = [(3, "A"), (1, "C"), (7, "D")]
```
Deze lijst bevat drie elementen -- A, C en D -- voorzien van een prioriteitswaarde -- 3, 1 en 7. Deze waarde zal bepalen in welke volgorde de elementen worden afgehandeld: **het laagste getal komt overeen met de hoogste prioriteit**. Met de functie `heapify` wordt deze lijst omgezet naar een prioriteitswachtrij:

```python
# Maak de prioriteitswachtrij aan
pq = [(3, "A"), (1, "C"), (7, "D")]
heapify(pq)
```

We illustreren we de twee bewerkingen: verwijdering van een element (*pop*) en toevoeging van een element (*push*). 

* Eerst wordt C uit de wachtrij gehaald, omdat de waarde 1 de laagste is.

    ```python
    heappop(pq)
    ```
    > `(1, 'C')`

* Wanneer je `(0, B)` aan de wachtrij toevoegt, zal deze voorrang krijgen tegenover de al aanwezige elementen.

    ```python
    heappush(pq, (0, "B"))
    heappop(pq)
    ```
    > `(0, 'B')`

Merk op: nadat je een element verwijdert, maakt het niet langer deel uit van de wachtrij.

<span style="color:#1569C7">**Opgaven.**</span> Maak oefening 3 en 4.

## 3. Het kortstepad-algoritme van Dijkstra

### 3.1 Het algoritme uitgelegd
https://www.datacamp.com/tutorial/dijkstra-algorithm-in-python

Het kortstepad-algoritme van Dijkstra is het meest gebruikte algoritme voor het vinden van het kortste pad tussen twee punten in een netwerk. Het heeft vele toepassingen in de maatschappij, waaronder

* het vinden van de snelste route door een navigatiesysteem (bv. Google Maps);
* het routing van datapakketten in computernetwerken met variabele bandbreedtes;
* het optimaliseren van bezorging door pakjesdiensten;
* het suggereren van vrienden in social media-apps;
* en het bepalen van optimale investeringspaden in financiën.

#### Sleutelconcepten met betrekking tot grafen

Om Dijkstra's algoritme in Python te implementeren, moeten we een paar essentiële concepten uit de grafentheorie opfrissen. Allereerst hebben we de grafen zelf:

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_dijkstra1.png' width='50%' >

Grafen zijn verzamelingen van knopen (*vertices*) verbonden door bogen (*edges*). Knopen vertegenwoordigen entiteiten of punten in een netwerk, terwijl randen de verbinding of relaties tussen hen vertegenwoordigen.

Grafen kunnen gewogen of ongewogen zijn. In ongewogen grafen hebben alle randen hetzelfde gewicht (vaak ingesteld op 1). In gewogen grafen (je raadt het al) is aan elke rand een gewicht verbonden, dat vaak de kosten, afstand of tijd weergeeft.

We gebruiken gewogen grafen in de tutorial omdat ze nodig zijn voor het algoritme van Dijkstra.

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_dijkstra2.png' width='50%' >

Een pad in een graaf is een opeenvolging van knopen verbonden door randen, beginnend en eindigend op specifieke knopen. Het kortste pad, waar we in deze tutorial om geven, is het pad met het minimale totale gewicht (afstand, kosten, enz.).

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_dijkstra3.png' width='50%' >

#### Dijkstra's algoritme gevisualiseerd

Voor de rest van de tutorial gebruiken we de laatste graaf die we gezien hebben. Laten we proberen het kortste pad tussen de punten B en F te vinden uit ten minste zeven mogelijke paden. In eerste instantie zullen we de taak visueel uitvoeren en later in code implementeren.

Eerst initialiseren we het algoritme als volgt:

1. We stellen B in als het root (bron) knoop.
2. We stellen de afstanden tussen B en alle andere knopen in op oneindig als hun initiële, voorlopige afstandswaarden. We stellen de waarde voor B in op 0 omdat dit de afstand tot zichzelf is.

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_dijkstra4.png' width='50%' >

Vervolgens voeren we de volgende stappen iteratief uit:

1. Kies de knoop met de kleinste waarde als ''huidige knoop'' en bezoek al zijn buren. Terwijl we elke naburige knoop bezoeken, werken we hun voorlopige waarden bij van oneindig naar hun randgewichten, beginnend bij de bronknoop.
2. Nadat alle buren zijn bezocht, markeren we de huidige knoop als ''bezocht''. Zodra een knoop is gemarkeerd als ''bezocht'', is zijn waarde al het kortste pad vanaf het doel.
3. Het algoritme gaat terug naar stap 1 en kiest de knoop met de kleinste waarde.

In onze graaf heeft B drie buren: A, D en E. Laten we ze allemaal bezoeken vanaf de hoofdknoop en hun waarden bijwerken (iteratie 1) op basis van hun randgewichten:

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_dijkstra5.png' width='50%' >

In iteratie 2 kiezen we opnieuw de knoop met de kleinste waarde: deze keer E. Zijn buren zijn C, D en G. B is uitgesloten omdat we die al hebben bezocht. Laten we de waarden van E's buren bijwerken:

<img src='https://raw.githubusercontent.com/jonasvdw/IW_Teams/main/media/P6_project3_dijkstra6.png' width='50%' >

We stellen de waarde van C in op 5,6 omdat zijn waarde de cumulatieve som is van de gewichten van B tot C. Hetzelfde geldt voor G. Als je echter ziet dat de waarde van D 3,5 blijft terwijl het 3,5 + 2,8 = 6,3 had moeten zijn, net als bij de andere knopen.

De regel is dat als de nieuwe cumulatieve som groter is dan de huidige waarde van de node, we deze niet bijwerken omdat de node al de kortste afstand tot de wortel aangeeft. In dit geval noteert D's huidige waarde van 3,5 al de kortste afstand tot B omdat ze buren zijn.

We gaan op deze manier verder tot alle knopen bezocht zijn. Als dat uiteindelijk gebeurt, hebben we de kortste afstand tot elke knoop vanaf B en kunnen we eenvoudig de waarde van B naar F opzoeken.

Samengevat zijn de stappen

1. Initialiseer de graaf waarbij het bron de waarde 0 krijgt en alle andere knopen oneindig. Begin met de bron als ''huidige knoop''.
2. Bezoek alle buren van de huidige knoop en update hun waarden naar de cumulatieve som van gewichten (afstanden) vanaf de bron. Als de huidige waarde van een buur kleiner is dan deze som, blijft deze gelijk. Markeer de ''huidige knoop'' als klaar.
3. Markeer het onvoltooide knoop met de minimale waarde als ''huidige knoop''.
4. Herhaal stap 2 en 3 totdat alle knopen klaar zijn.

### 3.2 Implementatie in Python

#### Een nieuwe datastructuur: dictionaries

Eerst hebben we een manier nodig om grafen in Python weer te geven. Meestal gebruikt men een 'dictionary' (of 'dict'). Dit is een soort lijst, net als een array, maar de elementen zijn niet genummerd door 0, 1, 2 ..., maar 'sleutel-waardeparen'. 

Neem bijvoorbeeld aan dat je gegevens van een bepaalde persoon wilt bijhouden: de naam, leeftijd en nationaliteit. Dan zou je dit in een array kunnen doen:

```python
    lijst = ["Peter Verbrugghe", 47, "Belg"]
```
Als je nu de leeftijd wilt opvragen, moet je onthouden dat dit het element is op positie 1:

```python
    print( lijst[1] )
```
> `47`

Wanneer de dataopslag wordt herdacht (bv. door een nieuw kenmerk toe te voegen), moet je nagaan wat de nieuwe indices zijn van elk kenmerk. Met een dict worden de gegevens meer gestructureerd voorgesteld:
```python
    dict = {
        "naam" : "Peter Verbrugghe",
        "leeftijd" : 47,
        "nationaliteit" : "Belg"
    }
```
Let op: dicts worden genoteerd met gekrulde haken `{}`. Nu maakt de volgorde niet meer uit elke **waarde** (`"Peter Verbrugghe"`, `47` ...) is namelijk gekoppeld aan een **sleutel** (`"naam"`, `"leeftijd"` ...).

#### Voorstelling van grafen als dicts

Als dit onze graaf is



dan zullen we deze voorstellen met de volgende dict:

In [8]:
adj = {
   "A": {"B": 3, "C": 3},
   "B": {"A": 3, "D": 3.5, "E": 2.8},
   "C": {"A": 3, "E": 2.8, "F": 3.5},
   "D": {"B": 3.5, "E": 3.1, "G": 10},
   "E": {"B": 2.8, "C": 2.8, "D": 3.1, "G": 7},
   "F": {"G": 2.5, "C": 3.5},
   "G": {"F": 2.5, "E": 7, "D": 10}
}

Elke sleutel van het dict is een knoop en elke waarde is opnieuw een dict, met daarin buren van die knoop en de afstanden daartoe. Onze graaf heeft zeven knopen, wat impliceert dat het dict zeven sleutels moet hebben. Men noemt het bovenstaande dict een **adjacentielijst**.

Om onze code gemakkelijker en leesbaarder te maken, zullen we een *Graph* class implementeren. Een class wordt vaak gebruikt in conceptuele probleemstellingen (zoals het bepalen van het korste pad in een wegennetwerk). Onder de motorkap zal het een adjacentielijst gebruiken en het zal ook een functie hebben om bogen tussen twee knopen toe te voegen.

In [9]:
class Graaf:
    # Initialiseer de graaf door een dict mee te geven met de adjacentielijst
    def __init__(self, graaf: dict = {}):
       self.graaf = graaf

    # Functie om een boog met gewicht tussen twee knopen toe te voegen
    def nieuwe_boog(self, knoop1, knoop2, gewicht):
       if knoop1 not in self.graaf:              # Controleer als knoop 1 al behoort tot de graaf 
           self.graaf[knoop1] = {}               # Zo niet, voeg hem toe
       self.graaf[knoop1][knoop2] = gewicht        # Voeg vervolgens de boog toe

Nu kunnen we de graaf aanmaken met de dict van eerder.

In [10]:
G = Graaf(graaf = adj)
G.graaf

{'A': {'B': 3, 'C': 3},
 'B': {'A': 3, 'D': 3.5, 'E': 2.8},
 'C': {'A': 3, 'E': 2.8, 'F': 3.5},
 'D': {'B': 3.5, 'E': 3.1, 'G': 10},
 'E': {'B': 2.8, 'C': 2.8, 'D': 3.1, 'G': 7},
 'F': {'G': 2.5, 'C': 3.5},
 'G': {'F': 2.5, 'E': 7, 'D': 10}}

#### Afstanden berekenen vanaf de bron

We voegen nog een klassemethode toe, deze keer voor het algoritme zelf: `kortste_afstand`:

```python
class Graaf:
       
       # init() en nieuwe_boog() weggelaten

       def kortste_afstand(self, bron: str):
              # Initialize the values of all nodes with infinity
              afstanden = {node: float("inf") for node in self.graph}
              afstanden[bron] = 0  # Set the source value to 0
```

Het eerste wat we doen in de functie is een woordenboek definiëren dat knoop-waardeparen bevat. Dit dict wordt elke keer bijgewerkt als we een knoop en zijn buren bezoeken. Zoals we in de visuele uitleg van het algoritme hebben vermeld, worden de beginwaarden van alle knopen op oneindig gezet terwijl de waarde van de bron 0 is.

Wanneer we klaar zijn met het schrijven van de methode, wordt dit woordenboek geretourneerd en bevat het de kortste afstanden naar alle knopen vanaf de bron. Zo kunnen we de afstand van B naar F vinden:

```python
# vooruitblik - bepaal het kortste pad van B naar F 
afst = G.kortste_afstand("B")
afst_F = afst["F"]
print("De kortste afstand van B naar F is", afst_F)
```

#### Itereren over de knopen met een 'priority queue'

Nu hebben we een manier nodig om over de knopen in de graaf te itereren, op basis van de regels van het algoritme van Dijkstra. Herinner, in elke stap moet de knoop met de kleinste waarde gekozen worden en zijn buren bezocht worden. We zouden knopen dus dynamisch moeten kunnen sorteren op basis van hun waarde. Een for-loop en een eenvoudige array volstaat hiervoor niet. Om dit deel van het probleem op te lossen, zullen we iets gebruiken dat we een **prioriteitswachtrij** (*priority queue*) noemen.

Een prioriteitswachtrij is net als een gewone lijst (array), maar elk van de elementen heeft een extra waarde om hun prioriteit weer te geven. Dit is een voorbeeld van een prioritaire wachtrij:

```python
prior = [(3, "A"), (1, "C"), (7, "D")]
```
Deze wachtrij bevat drie elementen -- A, C en D -- en ze hebben elk een prioriteit, die bepaalt hoe bewerkingen over de wachtrij worden uitgevoerd. Python biedt een ingebouwde `heapq` library om te werken met prioriteitswachtrijen.

```python
# Maak de prioriteitswachtrij aan
pq = [(3, "A"), (1, "C"), (7, "D")]
heapify(pq)
# Haal het element met de hoogste prioriteit uit de wachtrij
heappop(pq)
```
> `(1, 'C')`

Zoals je ziet, konden we C uit de wachtrij halen ('poppen') op basis van zijn prioriteit. Laten we proberen een waarde te 'pushen':
```python
heappush(pq, (0, "B"))
heappop(pq)
```
> `(0, 'B')`

De wachtrij wordt correct bijgewerkt op basis van de prioriteit van het nieuwe element, omdat `heappop` het nieuwe element met prioriteit 0 terugstuurde. Merk op dat, nadat we een element poppen, het niet langer deel uitmaakt van de wachtrij.

Nu terug naar het algoritme. Nu je de graaf hebt geïnitialiseerd, maak je een prioriteitswachtrij aan, die aanvankelijk alleen de bron bevat. De prioriteit van elk element is de huidige waarde. Maak ook een lege 'set' `bezocht = set()` aan om bezochte knopen op te slaan.

<span style="color:#1569C7">**Opdracht.**</span> Vul de functie `kortste_afstand` aan, die je iets verder naar onder kan terugvinden.

#### Het algoritme als while-loop

Nu beginnen we met het overlopen van alle niet-bezochte knopen met behulp van een while-loop.
* Zolang de wachtrij niet leeg is, 'poppen' we de waarde met de hoogste prioriteit eruit: noem dit `huidige_afst, huidige_knoop`.
* Als `huidige_knoop` bezocht is (behoort tot `bezocht`), slaan we deze over. Anders markeren we het als bezocht en bezoeken we de buren:
```python
for buur, gewicht in self.graaf[huidige_knoop].items():
    #...
```
* Voor elke buur berekenen we de 'voorlopige afstand' tot `huidige_knoop`: tel `huidige_afst` op bij het gewicht van de verbindende boog.
* Vervolgens controleren we of deze 'voorlopige afstand' kleiner is dan het getal in `afstanden`. Zo ja, vervang het getal in `afstanden` hierdoor en voeg we de buur met zijn voorlopige afstand toe aan de wachtrij.

Onder de while-loop, retourneren we de lijst `afstanden`.

<span style="color:#1569C7">**Opdracht.**</span> Vul de functie `kortste_afstand` aan, die je hieronder kan terugvinden.

In [25]:
class Graaf:
    # Initialiseer de graaf door een dict mee te geven met de adjacentielijst
    def __init__(self, graaf: dict = {}):
       self.graaf = graaf

    # Functie om een boog met gewicht tussen twee knopen toe te voegen
    def nieuwe_boog(self, knoop1, knoop2, gewicht):
        if knoop1 not in self.graaf:              # Controleer als knoop 1 al behoort tot de graaf 
            self.graaf[knoop1] = {}               # Zo niet, voeg hem toe
        self.graaf[knoop1][knoop2] = gewicht        # Voeg vervolgens de boog toe

    def kortste_afstand(self, bron: str):
        # Initialize the values of all nodes with infinity
        afstanden = {knoop: float("inf") for knoop in self.graaf}
        afstanden[bron] = 0  # Set the source value to 0

        # Aanmaken van de prioriteitswachtrij

        
        # Aanmaken van een lege set


        # While-loop
        
        

Als je code correct is, krijg je hieronder de lijst met afstanden vanaf B. 

In [None]:
G = Graaf(graaf=adj)

afstanden = G.kortste_afstand("B")
print(afstanden, "\n")

afst_F = afstanden["F"]
print("De kortste afstand van B naar F is", afst_F)
