# Aufgabe 6 (Scala: Kruskal)

_Verwenden Sie ausschließlich aus der Lehrveranstaltung bekannte Scala-Konstrukte, dabei sind `var` und seiteneffektbehaftete Methoden/Klassen/Objekte strikt untersagt._

Der [Algorithmus von Kruskal](https://de.wikipedia.org/wiki/Algorithmus_von_Kruskal) berechnet den minimalen Spannbaum eines zusammenhängenden, ungerichteten, gewichteten Graphen. Hierzu werden die Kanten des Graphen von der billigsten bis zur teuersten betrachtet und zur Lösung hinzugefügt, falls ihre beiden Enden bisher noch nicht (direkt oder indirekt) verbunden waren.

In [None]:
// Knoten haben eindeutigen Namen (String)
case class Edge(a: String, b: String, cost: Int)
// Graph als Kantenliste
type Graph = List[Edge]

In [None]:
// Beispiel-Graph für die folgenden "Schnelltests"
// Quelle: Wikipedia-Artikel zum "Algorithmus von Kruskal"
val exGraph = List(
   Edge("A","B",7), Edge("A","D",5),
   Edge("B","C",8), Edge("B","D",9), Edge("B","E",7),
   Edge("C","E",5),
   Edge("D","E",15), Edge("D","F",6),
   Edge("E","F",8), Edge("E","G",9),
   Edge("F","G",11)
)
val exGraphWithoutDE = List(
   Edge("A","B",7),
   Edge("B","C",8),
   Edge("F","G",11)
)

**a)** Vervollständigen Sie die Funktion `withoutNode`. Sie erhält einen Graphen `g` und einen Knoten `i` und gibt denjenigen Graphen zurück, der aus `g` dadurch hervorgeht, dass alle Kanten weggelassen werden, die im Knoten `i` beginnen oder enden.

In [None]:
def withoutNode: Graph => String => Graph = g => i =>
   g. /*** IHR CODE HIER (Hinweis 1) ***/ (e => e match {
      /*** IHR CODE HIER (Hinweis 2) ***/
   })

In [None]:
// Beispiel und Schnelltest:
assert(withoutNode(exGraph)("D").forall(e=>exGraph.contains(e))); print("✅")
assert((for(Edge(a,b,c)<-exGraph)yield(a=="D"|b=="D")^withoutNode(exGraph)("D").contains(Edge(a,b,c))).forall(x=>x)); print("✅")

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Wenn _"dadurch hervorgeht, dass alle ... weggelassen werden, die ..."_ in der Aufgabenstellung steht, dann deutet alles auf die Verwendung der folgenden API-Funktion höherer Ordnung hin:
- `filter(p: A => Boolean): List[A]`

</div>
</details>

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 2</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Der vorgegebene Teil `e => e match` erzwingt _Pattern Matching_. Das Ergebnis davon muss einen Wahrheitswert ergeben. Man kann hier für die Kante `e` vom Typ `Edge(a,b,c)` drei getrennte Muster verwenden:
- die Kante `e` beginnt mit `i`, also Wächter prüft ob `a == i` => ergibt `false` (Kante muss weg)
- die Kante `e` endet mit `i`, also Wächter prüft ob `a == i` => ergibt `false` (Kante muss weg)
- nichts davon trifft zu => ergibt `true` (Kante behalten)

Eleganter und kürzer ist es, nur ein einziges Muster zu verwenden, das den Wahrheitswert auf der rechten Seite berechnet. Da in der Liste nur Kanten `Edge(a,b,c)` vorkommen, deren Kosten `c` uns gar nicht interessieren, genügt links von "=>" das Muster:
- `case Edge(a,b,_) => /*...*/`

Weil wir alle Kanten von/nach Knoten `i` weglassen sollen, muss der Ausdruck rechts von "=>" genau dann "`true`" werden, wenn weder `a` noch `b` mit Knoten `i` identisch sind:
- `/*...*/ => !(a == i || b == i)`

</div>
</details>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
def withoutNode: Graph => String => Graph = g => i =>
   g.filter(e => e match {
      case Edge(a,b,_) => !(a == i || b == i)
   }) 
```

</div>
</details>

**b)** Vervollständigen Sie nun die Funktion `directNeighbors`. Sie liefert für einen Graphen `g` und einen Knoten `i` alle Knoten zurück, die in `g` über genau eine Kante mit `i` verbunden sind.

In [None]:
def directNeighbors: Graph => String => List[String] = g => i =>
   for( /*** IHR CODE HIER (Hinweis 1) ***/ )
      /*** IHR CODE HIER (Hinweis 2) ***/

In [None]:
// Beispiel und Schnelltest:
assert(directNeighbors(exGraph)("B").forall(List("A","C","D","E").contains(_))); print("✅")
assert(List("A","C","D","E").forall(directNeighbors(exGraph)("B").contains(_))); print("✅")

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Wir benötigen aus `g` zunächst genau diejenigen Kanten `Edge(a,b,_)`, die von/nach Knoten `i` führen (also `a==i` oder `b==i`), um dann den jeweils anderen Knoten zurückzugeben.

Mit der vorgegeben `for`-comprehension traversieren wir also `g` und nutzen den Wächter für die obige Prüfung. Da `g` eine `List[Edge]` ist, können wir die Kante in der `for`-comprehension auch direkt "entpacken".

</div>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
for(Edge(a,b,_) <- g; if a == i || b == i) /*...*/
```

</div>
</details>
</details>

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 2</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Nach dem `yield` haben wir alle Kanten der Form `Edge(a,b,_)`, bei denen entweder `a==i` oder `b==i` ist. Wir müssen also entweder `a` im Falle von `Edge(a,i,_)` oder `b` im Falle von `Edge(i,b,_)` zurückgeben. Daher benötigen wir nach dem `yield` noch eine Fallunterscheidung.

</div>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
/*...*/ yield if(a == i) b else a
```

</div>
</details>
</details>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
def directNeighbors: Graph => String => List[String] = g => i =>
   for(Edge(a,b,_) <- g; if a == i || b == i) yield if(a == i) b else a 
```

</div>
</details>

**c)** Vervollständigen Sie die Funktion `connected`. Sie stellt _rekursiv_ fest, ob zwei Knoten `a` und `b` im Graphen `g` direkt oder indirekt verbunden sind. Ein Knoten `a` ist mit `b` verbunden, wenn `a` und `b` identisch sind, oder mindestens einer seiner direkten Nachbarn mit `b` verbunden ist.

_Hinweis:_ Knoten `a` muss für die Rekursion aus `g` entfernt werden, um eine Endlosrekursion zu vermeiden.

In [None]:
def connected: Graph => (String,String) => Boolean = g => (a,b) =>
   if( /*** IHR CODE HIER (Hinweis 1) ***/ ) /*** IHR CODE HIER (Hinweis 1) ***/
   else
      directNeighbors(g)(a).exists(n =>
         /*** IHR CODE HIER (Hinweis 2) ***/ )

In [None]:
// Beispiel und Schnelltest:
assert(connected(exGraphWithoutDE)("A","C")); print("✅")
assert(connected(exGraphWithoutDE)("F","G")); print("✅")
assert(!connected(exGraphWithoutDE)("A","G")); print("✅")
assert(!connected(exGraphWithoutDE)("B","F")); print("✅")

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Idee: Führe eine rekursive Tiefensuche ausgehend von `a` aus.

Die Aufgabenstellung verrät selbst den Basisfall der Rekursion: _"Ein Knoten `a` ist mit `b` verbunden, wenn `a` und `b` identisch sind ..."_

</div>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
if(a == b) true
```

</div>
</details>
</details>

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 2</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Der Rekursionsfall der Tiefensuche muss nun für jeden direkten Nachbarn `n` von `a` prüfen, ob es von `n` aus einen Weg zu `b` gibt.
Die direkten Nachbarn `ns` von `a` bekommen wir mit der Funktion `directNeighbors(g)(a)` aus Teilaufgabe **b)**.

Anstelle einer "Iteration" über alle `ns` können wir hier z.B. einfach die API-Funktion `exists(p: A => Boolean): Boolean` der Scala-List verwenden, um "irgendeinen" Nachbarn `n` zu finden, von dem aus es einen Pfad zu `b` gibt.

</div>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag 2: außen</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
directNeighbors(g)(a).exists(n =>
   connected(/*...*/)(n, b)) 
```

</div>
</details>

<details>
<summary><i><span style='background:#b2ebf2'>... Forsetzung 2: gesamt</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Hier weist die Aufgabenstellung auf die Gefahr der Endlosrekursion hin, wenn wir anstelle der `/*...*/` im vorangehenden _"Lösungsvorschlag 2: außen"_ den Original-Graphen `g` verwenden.

Da der Graph ungerichtet ist, würde man den "Zyklus" `a`-`b`-`a` unendlich ablaufen. Deshalb ist es bei `/*...*/` nötig, den Knoten `a` aus der rekursiven Betrachtung zu entfernen, was durch die Funktion `withoutNode(g)(a)` aus Teilaufgabe **a)** leicht geht.

</div>

<details>
<summary><i><span style='background:#c8e6c9'>... Lösungsvorschlag 2: gesamt</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
directNeighbors(g)(a).exists(n =>
   connected(withoutNode(g)(a))(n, b)) 
```

</div>
</details>
</details>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
def connected: Graph => (String,String) => Boolean = g => (a,b) =>
   if(a == b) true
   else
      directNeighbors(g)(a).exists(n =>
         connected(withoutNode(g)(a))(n, b)) 
```

</div>
</details>

**d)** Vervollständigen Sie schließlich die Funktion `kruskal`. Sie wendet den [Algorithmus von Kruskal](https://de.wikipedia.org/wiki/Algorithmus_von_Kruskal) auf den zusammenhängenden Graphen `g` an, und gibt den resultierenden Spannbaum zurück.

In [None]:
def kruskal: Graph => Graph = g => {
   val sorted = /*** IHR CODE HIER (Hinweis 1) ***/
   sorted.foldLeft[Graph]( /*** IHR CODE HIER (Hinweis 2) ***/ )((p,e) => e match {
      /*** IHR CODE HIER (Hinweis 2) ***/
   })
}

In [None]:
// Beispiel und Schnelltest:
assert(kruskal(exGraph).map({case Edge(_,_,c) => c}).sum == 5+5+6+7+7+9); print("✅")

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Zur Erinnerung (aus der Aufgabenstellung oben): _"Hierzu werden die Kanten des Graphen von der billigsten bis zur teuersten betrachtet und ..."_

Also besteht der erste Schritt darin, die Kanten aufsteigend nach den Kosten zu sortieren. Das geht z.B. mit den List-API-Funktionen:
- `sortWith(lt: (A, A) => Boolean): List[A]` oder
- `sortBy[B](f: A => B)(implicit ord: Ordering[B]): List[A] `

</div>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag 1</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
g.sortWith({case (Edge(_,_,a), Edge(_,_,b)) => a < b}) // oder
g.sortBy({case Edge(_,_,c) => c}) 
```

</div>

<div class="alert alert-block alert-danger">

**ACHTUNG:** `g.sortWith((a,b) => a.cost < b.cost)` ist die **objekt-orientierte** Punkt-Schreibweise, die in der Klausur **EXPLIZIT VERBOTEN** ist.

</div>

</details>
</details>

<details>
<summary><i><span style='background:#b2ebf2'>Hinweis 2</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-info">

Zur Erinnerung (aus der Aufgabenstellung oben): _"... und zur Lösung hinzugefügt, falls ihre beiden Enden bisher noch nicht (direkt oder indirekt) verbunden waren."_

Das "sequentielle Abarbeiten" der Kanten soll laut vorgegebenem Code mittels `foldLeft` erfolgen: `foldLeft[B](z: B)(op: (B, A) => B): B`

Das "neutrale Element" `z` dieser Faltung ist selbstverständlich die "leere Kanten-Liste" `Nil`.

Die Verknüpfungsoperation `op` bekommt zwei Parameter `(p,e)`:
- `p` ist die Liste der bereits nach Kruskal eingesammelten Kanten.
- `e` ist die nächste zu betrachtende Kante.

Die Kante `e` soll aber nur dann zu `p` hinzugefügt werden, wenn sie keinen Zyklus erzeugt! Daher ist eine Fallunterscheidung mittels _Pattern Matching_ nötig: `(p,e) => e match /*...*/`
- ist `e` eine Kante `case Edge(a,b,c)` und der Wächter `if !connected(p)(a,b)` erfüllt (d.h. im bisher nach Kruskal "eingesammelten" Spannbaum `p` erzeugt die Kante `(a,b)` **keinen** Zyklus), dann wird die Kante aufgenommen: `... =>  Edge(a,b,c) :: p`
- andernfalls wird die Kante übersprungen: `case _ => p`

</div>
</details>

<details>
<summary><i><span style='background:#c8e6c9'>Lösungsvorschlag</span> (anzeigen/verbergen)</i></summary>
<div class="alert alert-block alert-success">

```scala
def kruskal: Graph => Graph = g => {
   val sorted = g.sortWith({case (Edge(_,_,a), Edge(_,_,b)) => a < b})
   sorted.foldLeft[Graph](Nil)((p,e) => e match {
      case Edge(a,b,c) if !connected(p)(a,b) =>  Edge(a,b,c) :: p
      case _ => p
   })
} 
```

</div>
</details>