# Aufgabe 1 (Exponentielle Gesamtkosten)

## a) $Fib(n)$

$$\begin{align*}
T(0) =& \Omega(1) \\
T(1) =& \Omega(1) \\
T(2) =& T(1) + T(0) + \Omega(1) = 3 \Omega(1) > \sqrt{2}^2 \\ \\
T(n) =& T(n-1) + T(n-2) + \Omega(1) \\
=& T(n-2) + T(n-3) + \Omega(1) + T(n-2) + \Omega(1) \\
=& 2 T(n - 2) + T(n-3) + 2 \Omega(1) \\
\geq& 2 T(n - 2) \\ 
\geq& \sqrt{2} T(n-1) \\
\geq& \sqrt{2} \sqrt{2} T(n - 2) \\ \\
\Rightarrow c = \sqrt{2} \\ \\
Fib \in& \Omega(\sqrt{2}^n)
\end{align*}$$

## b) $OptJobs(n)$

Der Worst-Case wird erreicht, wenn für alle $n$ $p(n) = n - 1$ ist.

$$\begin{align*}
T(0) =& \Omega(1) \\
T(1) =& 2T(0) + \Omega(1) = 3 \Omega(1) > 2^1 \\ \\
T(n) =& T(p(n)) + T(n-1) + \Omega(1) \\
=& 2T(n-1) + \Omega(1) \\
\text{>}& 2T(n-1) \\ \\
\Rightarrow c = 2 \\ \\
OptJobs \in& \Omega(2^n)
\end{align*}$$

## c) $MIS(G)$

Der Worst-Case wird erreicht, wenn es z.b. keine Kanten gibt und für alle $x$ $|N(x)| = 1$ ist.

$$\begin{align*}
T(0) =& \Omega(1) \\
T(1) =& 3 \Omega(1) > \Omega(2^1) \\ \\
T(n) =& T(|G| - |N(x)|) + T(|G| - |\{x\}|) + \Omega(1) \\
=& T(n-1) + T(n-1) + \Omega(1) \\
=& 2 T(n-1) + \Omega(1) \\ \\
\Rightarrow c = 2 \\ \\
MIS \in& \Omega(2^n)
\end{align*}$$

# Aufgabe 2 (Greedy Algo: Gewichtetes Druckjob Scheduling)

## a)

```
|--1--|
    |--2--|
```

## b)

```
|--3--|
    |--4--|
        |--3--|
```

## c)

```
|----2----|
  |--1--|
```

# Aufgabe 3 (Einserblöcke finden)

## a) Größter quadratischer Einserblock in $O(n^2)$

**Idee:** Wir initialisieren das Array $M'$ mit den Dimensionen von $M$ mit $0$-en zum memoisieren. Nun wird vom Feld $(n,n)$ bis zum Feld $(1,1)$ reihenweise von rechts-unten nach links-oben über alle Felder iteriert.

Ist das Feld in $M$ eine Eins, so hohlen wir die Werte der Felder eins rechts von uns, eins unter uns und diagonal rechts unter uns aus $M'$. Das Minimum dieser drei Werte plus Eins entspricht der Länge des größten quadratischen Einserblocks, den wir vom aktuellen Feld nach unten-rechts aufspannen können. Da wir dies für alle Felder durchführen, finden wir so irgendwann die obere-linke Ecke des größten quadratischen Einserblockes und damit seine Länge. Da wir von unten-rechts nach oben-links iterieren, sind die drei Felder, die wir zum Berechnen der Länge benutzen bereits befüllt.

**Algorithmus:**

```
Input: Matrix M (n x n)
 1. Initialisiere Matrix M' (n x n) mit 0
 2. max_size = 0
 3. for i in n ... 1 do
 4.   for j in n ... 1 do
 5.     if M[i][j] == 0 then
 6.       continue
 7.     end if
 8.     size = min(M'[i+1][j], M'[i][j+1], M'[i+1][j+1]) + 1
 9.     M'[i][j] = size
10.     max_size = max(max_size, size)
11.   end for
12. end for
13. return max_size^2
```

**Laufzeit:** Der Algorithmus iteriert über alle $n \times n$ Felder. In jeder Iteration werden nur konstant teure Operationen gemacht. Die Gesamtlaufzeit ist damit in $O(n^2)$

### Korrektheit

**1. Alle Quadrate, die befüllt werden sind valide Quadrate:** Ein Feld wird nur dann als Quadrat markiert, wenn das Feld in $M$ eine Eins enthält. Sind zudem die Nachbarn unten, rechts und rechts-unten auch valide Quadrate, so kann unser aktuelles Feld nur Teil eines validen Quadrates der Größe des kleinsten Nachbarns plus Eins sein.

**2. Alle Quadrate werden gefunden:** Wenn es ein Quadrat der Seitenlänge $k$ gibt, so muss es auch drei Quadrate der Seitenlänge $k-1$ geben. Da wir alle Quadrate der Länge 1 finden, finden wir somit auch alle Quadrate der Länge 2, usw. Dadurch ist auch sichergestellt, dass wir immer das größte Quadrat finden.

## b) Größter Einserblock in $O(n^3)$

**Idee:** Wir können das Problem reduzieren auf das Finden der größten Fläche in einem Histogram (lößbar in $O(n)$). Für jede Reihe können wir für unsere Matrix ein Histogramm bauen. Das Histogramm einer Reihe enthält dabei für jedes Feld die Anzahl der Aufeinanderfolgenden Einsen in der Spalte nach oben (bis zur ersten Null, einschließlich des aktuellen Feldes). Für die untige Matrix $M$ wäre das Histogramm für die zweite Reihe daher `[2, 1, 0, 2, 1]`.

```
M: 1 0 1 1 0  H(2): x 0 x x 0  H(2): [2, 0, 2, 2, 1]
   1 0 1 1 1        x 0 x x x
   0 1 1 1 0        0 1 1 1 0
```

Das maximale Rechteck innerhalb des Histogramms dieser Reihe ist zugleich auch das maximal große Rechteck der ganzen Matrix $M$, dass in dieser Reihe endet. Das maximale Rechteck des Histogramms jeder Reihe muss somit auch das maximale Rechteck der gesamten Matrix $M$ sein, da das maximale Rechteck in $M$ in irgendeiner Reihe enden muss und somit Teil des Histogramms dieser Reihe wird.

**Algorithmus:**

(Der Algorithmus Größtes Rechteck im Histogramm `largest_area_in_hist` wird in **c)** beschrieben)

Initial erstellen wir die Hilfsmatrix $M'$ mit den selben Dimensionen wie $M$ ($n \times n$) zur Berechnung der Histogramme jeder Reihe. Nun wird von oben nach unten durch die Reihen von $M$ iteriert. Für jedes Feld zählen wir die Anzahl der aufeinanderfolgenden Einsen in der aktuellen Spalte nach oben. Da wir mit der obersten Reihe anfangen, müssen wir für die folgenden Reihen lediglich in dem  Feld in der Spalte darüber den Wert nachgucken. Dadurch kann $M'$ in $O(n^2)$ gebaut werden. 

Beispiel:

```
M: 1 0 1 1 0  M': 1 0 1 1 0
   1 0 1 1 1      2 0 2 2 1
   0 1 1 1 0      0 1 3 3 0
```

Anschließend berechnen wir für jede Histogramm-Reihe aus $M'$ das maximale Rechteck im Histogramm und speichern das globale Maximum, welches wir am Ende ausgeben.

```
Input: Matrix M (n x n)
 1. Initialisiere M' mit Dimensionen n x n
 2. for i in 1 ... n do
 3.   for j in 1 ... n do
 4.     if M[i][j] == 1 do
 5.       M'[i][j] = M'[i-1][j] + 1
 6.     end if
 7.   end for
 8. end for
 9. return M'
10.
11. max_size = 0
12. for i in 1 ... n do
13.   size = largest_area_in_hist(M'[i])
14.   max_size = max(max_size, size)
15. end for
16. return max_size
```

**Laufzeit:**

Die Berechnung von $M'$ liegt in $O(n^2)$, da in jeder Iteration der $n \times n$ Felder nur konstant viel Arbeit gemacht wird.

Das Berechnen des größten Recheckts auf Basis von $M'$ liegt in $O(n * \text{largest_area_in_hist})$. Da wie in **c)** gezeigt `largest_area_in_hist` in $O(n)$ liegt, ergibt sich eine gesamte Laufzeit für diesen Teil von $O(n^2)$.

Somit liegt die gesamte Laufzeit in $O(n^2)$.

## c) Größter Einserblock in $o(n^3)$

Der Algorithmus aus **b)** liegt bereits in $O(n^2) \in o(n^3)$. Zu zeigen bleibt jedoch, dass `largest_area_in_hist` in $O(n)$ liegt.

Ein bekannter Algorithmus zum finden des größten Rechtecks in einem Histogramm in $O(n)$ ist ein Stack basierender Ansatz. Die Eingabe hierfür ist eine Reihe wie z.b. aus $M'$, welche die Höhe jeder Spalte angibt. Beispiel:

```
                  x   x   x
                  x x x   x
[3, 2, 3, 1, 3]:  x x x x x
```

Der Stack managed nun Indices von Spalten. Ist der Index einer Spalte im Stack, bedeutet dies, dass wir von diesem Index ein Rechteck so weit nach Rechts, wie wir bisher gekommen sind, aufspannen können ohne eine andere Spalte mit einer kleineren Höhe zu treffen. Durch diese Invariante können wir relativ einfach die Fläche des Rechteckes mit der aktuellen Spalte als minimale höhe des Rechteckes ausrechen (ein Rechteck ist nach oben hin durch die kleinste Spalte beschränkt). Tut man dies für alle minimalen Spalten des Rechteckes, so kann man durch vergleichen der Flächen das maximal-große Rechteck ermitteln.

Durch die Invariante des Stacks, ergibt sich, dass die Elemente im Stack aufsteigend nach der Höhe ihrer Kanten sortiert liegen. Um den Stack zu verwalten, fügen wir die aktuelle Spalte hinzu, wenn sie höher als die aktuelle Spalte am Kopf des Stacks ist. Andererseits entfernen wir solange Spalten aus dem Stack, bis die aktuelle Spalte höher als der Kopf des Stacks ist.

Dadurch ergibt sich, dass in jeder iteration $i$ über die Spalten, der Kopf des Stacks der Index der kleinsten Spalte der Fläche ist, die wir vom aktuellen Index nach links aufspannen können. Die Fläche ist hierbei begrenzt nach rechts durch $i$ und nach links durch den Index unter dem aktuellen Kopf des Stacks bzw 0 wenn der Stack leer ist. Da wir nun die beiden Indices sowie die Höhe der kleinsten Spalte haben, können wir nun die Größe der aufgespannten Fläche berechnen mit $fläche = höhe * (rechts - links + 1)$.

**Algorithmus:**

```
Input: Array A der Länge n
 1. Initialisiere Stack S
 2. max_area = 0
 3. for i in 1 ... n do
 4.   while S ist nicht leer und A[S.peek()] >= A[i] do
 5.     height = A[S.peek()]
 6.     S.pop()
 7.     right = i - 1
 8.     left = S.peek() + 1 oder 0 wenn S leer ist
 9.     area = height * right - left + 1
10.     max_area = max(max_area, area)
11.   end while
12.   S.push(i)
13. end for
14. return max_area
```

**Laufzeit:**

Insgesamt hat der Algorithmus eine amortisierte Laufzeit in $O(n)$. Dies liegt daran, dass jedes der $n$ Elemente nur genau einmal in den Stack eingefügt und aus dem Stack entfernt wird. Da die while-Schleife nur solange läuft, wie Elemente im Stack sind und in jeder ihrer Iterationen ein Element entfernt aber keines hinzugefügt wird, hat die while-Schleife über die gesamte Dauer des Algorithmus nur genau $n$ Iterationen. Dadurch ist es auch egal, dass diese innerhalb der for-Schleife liegt, da die amortisierte Laufzeit bei $O(n)$ bleibt.

# Aufgabe 4 (Pfade zählen)

**Idee:** Ähnlich wie bei einer Tiefensuche, gehen wir für jede Node ohne eingehende Kanten alle Pfade ab (nur an solchen Nodes können Pfade beginnen). Hierbei geben wir den aktuellen String des Pfades an die nächste Node weiter (ausgehend mit einem leeren String). Erreichen wir das Ende eines Pfades (eine Sink-Node), so wird geprüft, ob der aktuelle String des Pfades mit $s$ übereinstimmt. Ist dies der Fall, erhöhen wir den Pfad-Counter um Eins. Weiterhin, können wir vorzeitig für einen Pfad abbrechen, wenn der aktuelle Pfad-String nicht mehr zu $s$ passt.

Um doppeltes Traversieren zu vermeiden, wird für jede Node gespeichert, ob sie für den aktuellen Pfad-String zu einem Validen Pfad wird. Dies müssen wir abhängig aktuellen Pfad-String speicher, da eine Node teil von mehreren Pfaden sein kann, von denen nur manche einen validen Pfad-String bilden. Die Information für die Node, ob der weitere Pfad ausgehend vom aktuellen Pfad-String valide ist, wird rekursiv berechnet und über den Call-Stack zurück gegeben.

**Algorithmus:**

* **Haupt-Algorithmus:**

```
Input: Liste aller Nodes (nodes), Eingabe String (input_str)
Output: Anzahl aller Pfade, die input_str ergeben.
 1. Initialisiere globales Set visited
 2. Initialisiere globale Variable path_count = 0
 3. Initialisier start_nodes mit allen Nodes ohne eingehende Kanten
 3. for node in nodes do
 4.   count_valid_paths(node, "")
 5. end for
 6. return path_count
```

* **Rekursive Methode `count_valid_paths`, welche gegeben einer Node alle Pfade dieser Node prüft:**

```
Input: Node (node) and the substring build so far (current_str)
Output: True if it can complete the substring build so far starting from the node else false

count_valid_paths(node, current_str):
 1. if (node, current_str) in visited do
 2.   return visited[(node, current_str)]
 3. end if
 4.
 5. next_str = current_str + node.letter
 6.
 7. if s beginnt nicht mit next_str do
 8.   visited[(node, current_str)] = false
 9.   return false
10. end if
11.
12. if node ist Sink do
13.   if next_str == s do
14.   visited[(node, current_str)] = true
15.   path_count += 1
16.   return true
17. end if
18. else do
19.   has_valid_path = false
20.   for child in node.children do
21.     if count_valid_paths(child, next_str) == true do
22.       has_valid_path = true
23.     end if
24.   end for
25.   visited[node, current_str] = has_valid_path
26.   return has_valid_path
27. end else
```

**Laufzeit:** Insgesamt wird einmal über alle Nodes traversiert. Durch Memoisierung fangen wir doppeltes Traversieren von Pfaden ab, solange beide Pfade den selben Anfang haben. Sei $S$ die Anzahl aller Nodes ohne eingehende Kanten, so lässt sich die Laufzeit nach oben hin durch $O(S * |V|)$ abschätzen.

# Aufgabe 5 (Median per D&C)

## a) Median in $O(n)$

Wir setzen auf den Start jedes Arrays einen Pointer. Ähnlich wie bei Mergesort, verschieben wir nun immer den Pointer um eins weiter, der auf das kleinere Element zeigt. Dabei merken wir uns die ingesamte Anzahl der Pointer-Verschiebungen. Da wir insgesamt $2n$ Elemente haben, wissen wir, dass nach $n$ Pointer-Verschiebungen die nächst kleinere Zahl der Median ist (Für gerade $m$ ist der Median das $\frac{m}{2} + 1$-kleinste Element).

Da wir insgesamt nur $n$ Pointer-Verschiebungen machen, liegt die Laufzeit in $O(n)$.

## b) Median in $O(\log n)$

Für eine $O(\log n)$ Lößung, können wir uns das Wissen zunutze machen, dass wir die Arrays $A$, $B$ den Median direkt bestimmen können (da beide Arrays sortiert sind).

Vergleichen wir nun die beiden Mediane $M_A$ und $M_B$ von $A$ und $B$, so können wir folgendes Beobachten:

1. **$M_A$ und $M_B$ sind gleich groß:** Der Median beider Arrays muss einer der beiden Teil-Mediane sein. Wir können einfach $M_A$ oder $M_B$ zurückgeben.
2. **$M_A$ ist größer als $M_B$:** Der Median muss in einem der folgenden Subarrays liegen:
    * $A'$ welches alle Elemente vom kleinsten Element aus A bis zum Median aus A enthält
    * $B'$ welches alle Element vom Median aus B bis zum größten Element aus B enthält
3. **$M_A$ ist kleiner als $M_B$:** Genau vor wie bei **2.**, jedoch mit vertauschten Arrays.

Für die neuen Teilarrays $A'$ und $B'$ können wir dies solange wiederholen, bis beide Arrays die Größe zwei haben, oder beide den selben Median haben.

Im schlimmsten Fall, müssen wir solange neue Teilarrays bilden, bis diese die Größe zwei haben. Da sich die Größe beider Arrays jedoch in jeder Iteration halbiert, können wir maximal $\log n$ viele Iterationen haben. Da in jeder Iteration der Aufwand konstant ist, ergibt sich eine insgesamte Laufzeit in $O(\log n)$