# Probleme und Komplexität

In den bisherigen Kapiteln wurden die verschiedensten Probleme behandelt. Für die meisten von ihnen haben wir einen effizienten Algorithmus gefunden. Effizient bedeutet dabei, dass die Laufzeit durch ein Polynom nach oben beschränkt werden konnte. Es gibt jedoch auch Probleme, für die das nicht der Fall ist. Beispielsweise konnte für das Rucksackproblemm selbst mit Dynamic Programming in Bezug auf die Stelligkeit der Eingabe nur ein Exponentialzeit Algorithmus gefunden werden. Es gibt auch viele Probleme, die für die Praxis von großer Bedeutung sind und ähnlich schwer sind, wie etwa die Primfaktorenzerlegung einer Zahl. Bei diesem Beispiel handelt es sich um ein *Suchproblem*.

Eine weitere Klasse von Problemen sind die *Optimierungsprobleme*, bei ihnen geht es darum ein Ergebnis zu finden, dass optimal (maximal bzw. minimal) ist, zu finden. Beispiel hierfür sind das Single Source Shortest Path-Problem, das Rucksackproblem und das Traveling Salesman Problem (TSP).

In der theoretischen Informatik werden hauptsächlich *Entscheidungsprobleme* (decision problems) betrachtet. Dies sind Probleme, bei denen die Lösung entweder *JA* (true) oder *NEIN* (false) lautet.

Auf der einen Seite sind Such- und Optimierungsprobleme für die Praxis besonders relevant unf auf der anderen Seite sind Entscheidungsprobleme theoretisch besonders gut erforscht. Dies führt zu der Frage, ob sich die Komplexität eines Optimierungsproblems auf die Komplexität eines zugehörigen Entscheidungsproblems zurückführen lässt. Dies ist in der tat möglich!

Das zu einem Optimierungsproblem $OP$ gehörende Entscheidungsproblem $EP$ konstruiert man unter Verwendung der Lösung von $OP$. Die Entscheidungsvariante des TSP lautet: "Gibt es eine Rundreise, deren Länge geringer ist als $S$ ?". $S$ wird also als Schranke eingebaut. Nun hat man ein Entscheidungsproblem, das genauso aufwändig ist und man im Sinne der theoretischen Informatik, genauer der Komplexitätstheorie und Berechnbarkeitstheorie, betrachten kann.

Die Komplexitätstheorie beschäftigt sich mit dem Aufwand von Problemen. In der Berechenbarkeitstheorie geht es um die Lösbarkeit eines Problems durch einen Computer. Da für das TSP alle möglichen Städtefolgen durchprobiert werden können, handelt es sich um ein entscheidbares Problem.

## P und EXP

__Definition 13.1__
Die Komplexitätsklassse $\mathcal{P}$ enthält alle Entscheidungsprobleme, die sich mit einer deterministischen Turing-Maschine mit polynomiellen Zeitaufwand lösen lassen.

Weniger abstrakt formuliert, sind es alle Probleme die mit einem gewöhnlichen Computer mit einem Zeitaufwand von $\mathcal{O} \left( n^{\mathcal{O}(1)} \right)$ lösen lassen.

Glücklicherweise fallen sehr viele Probleme in diese Kategorie, z.B. das Single Source Shortest Path-Problem oder das Problem des Minimalen Spannbaums.

__Definition 13.2__
Die Komplexitätsklassse $\mathcal{EXP}$ enthält alle Entscheidungsprobleme, die sich mit einer deterministischen Turing-Maschine mit exponentiellen Zeitaufwand lösen lassen.

Weniger abstrakt formuliert, sind es alle Probleme die mit einem gewöhnlichen Computer mit einem Zeitaufwand von $\mathcal{O} \left( \mathcal{O}(1)^{n^{\mathcal{O}(1)}} \right)$ lösen lassen.

Da jedes Polynom durch eine Exponentialfunktion nach oben beschränkt werden kann, ist offensichtlich, dass $\mathcal{P} \subset \mathcal{EXP}$.

<img src="img/P_subset_EXP.png" width="200">

## NP und NEXP

__Definition 13.3__
Die Komplexitätsklasse $\mathcal{NP}$ enthält alle Entscheidungsprobleme, die sich mit einer nicht-deterministischen Turingmaschine mit polynomiellen Zeitaufwand lösen lassen.

$\mathcal{NP}$ steht dabei für nicht-deterministisch polynomiell. Um zu verstehen, was dies bedeutet, muss man verstehen, in welcher Hinsicht sich der Nicht-Determinismus vom Determinismus unterscheidet. Eine nicht-deterministische Turingmaschine ist ein Berechenbarkeitsmodell, dass raten kann. Durch "magische Kräfte" ist es in der Lage, falls es eine Entscheidungsmöglichkeit gibt, immer die zu wählen, die im Entscheidungsproblem zur JA-Antwort führt, falls es sie gibt. Findet dieses Raten bloß polynomial oft von polynomial vielen Antwortmöglichkeiten statt, so ist das Problem nicht-deterministisch in Polynomialzeit lösbar, es liegt also in $\mathcal{NP}$.

Man kann zeigen, dass ein Problem in $\mathcal{NP}$ liegt, indem man einen nicht-determinitischen Algorithmus für das Problem angibt, dass in (nicht-deterministischer) Polynomialzeit läuft.

Für das 0/1-Rucksackproblem kann man folgenden Algorithmus angeben: man rät bei allen der $n$ Gegenstände, ob man es in den Rucksack legen soll oder nicht. Da die nicht-deterministische Turing-Maschine in der Lage ist, die Antwort immer so zu wählen, dass die Lösung optimal wird (bzw. in Form des Entscheidungsproblems den gegebenen Wert überschreitet), funktioniert der Algorithmus. Da das Raten $n$-mal von 2 Auswahlmöglichkeiten statfindet, handelt es sich um nicht-deterministische Polynomialzeit. Somit ist das 0/1-Rucksackproblem in $\mathcal{NP}$.

__Definition 13.4__
Die Komplexitätsklassse $\mathcal{NEXP}$ enthält alle Entscheidungsprobleme, die sich mit einer nicht-deterministischen Turing-Maschine mit exponentiellen Zeitaufwand lösen lassen.

<img src="img/P_NP_EXP_NEXP.png" width="250">

Alternativ gilt für $\mathcal{NP}$ auch die Definition, dass das Zertifikat einer Lösung mit einer deterministischen Turingmaschine in Polynomialzeit verifiziert werden kann. Das Zertifikat einer Lösung ist so etwas wie die genaue Zusammensetzung der Lösung, bzw. der Lösungsweg. Beim TSP wäre es die Abfolge der Knoten, beim Rucksackproblem, die Menge der Gegenstände, die in den Rucksack gepackt werden. Kann man nun deterministisch in Polynomialzeit diese Lösung auf Richtigkeit prüfen, so ist das Problem in $\mathcal{NP}$.

Auch anhand dieser Definition, ist offensichtlich dass $\mathcal{P}$ eine Teilmenge von $\mathcal{NP}$ ist, da wenn ein Problem in Polynomialzeit lösen kann, man es auch in Polynomialzeit verifizieren kann, indem man es einfach löst.

## R

__Definition 13.5__
Die Komplexitätsklasse $\mathcal{R}$ enthält alle Entscheidungsprobleme, die mit einer Turingmaschine in endlicher Zeit gelöst werden können. Sie stellt die Menge aller rekursiven Sprachen dar, welche eine Teilmenge aller rekursiv aufzählbaren Sprachen ist.

$\mathcal{R}$ enthält also alle entscheidbaren Probleme.

Es gibt in der Tat Probleme, die nicht in $\mathcal{R}$ liegen und somit nicht entscheidbar sind.

Ein Beispiel für ein unentscheidbares Problem ist das Halteproblem, bei dem bestimmt werden soll, ob eine Eingabe ein Programm darstellt, dass terminiert oder nicht. Ein weiteres unentscheidbares Problem ist das Wortproblem für rekursiv aufzählbare Sprachen.

<img src="img/R.png" width="270">

## NP-Schwere

__Definition 13.6__
Ein Problem ist $\mathcal{NP}$-Schwer ($\mathcal{NP}$-hard), wenn es mindestens so schwer ist, wie die schwersten Probleme in $NP$.

Wie zeigt man aber, dass kein Problem in $\mathcal{NP}$ schwerer ist als das Problem $X$, welches $\mathcal{NP}$-schwer ist?

## Polynomielle Reduktion

__Definition 13.7__
Seien $L$ und $L'$ zwei Entscheidungsprobleme mit $L, L' \subset \Sigma^*$.
$L$ ist auf die Sprache $L'$ polynomiell reduzierbar,w enn es eine in Polynomialzeit berechnbare Funktion $f: \Sigma^* \to \Sigma^*$ gibt, so dass für alle Wörter $w \in \Sigma^*$ die Äquivalenz $w \in L \equiv f(w) \in L'$ gilt. 
Eine Reduktion von $L$ zu $L'$ wird mit folgender Schreibweise angegeben: $L \leq_p L'$

Bei der polynomiellen Reduktion wird ein Verfahren angegeben, bei der eine Angabe eines Problems $L$ so abgeändert wird, dass es für das Problem $L'$ das gleiche Ergebnis liefert.

Liegt die Reduktion $A \leq_p B$ vor, so kann man sagen:

- $A$ ist im Wesentlichen nicht schwieriger als B
- $B$ ist mindestens so schwierig wie $A$

Lässt sich $A$ zu $B$ reduzieren, so schließen wir daraus, dass $A$ nicht schwerer ist als $B$. Dies liegt daran, dass wenn $B$ einfach ist, dann kann $A$ nicht schwer sein, da man durch die Reduktion ja einen Weg gefunden hat, $A$ einfach zu lösen. Damit muss $B$ mindestens so schwer sein wie $A$.

## NP-Vollständigkeit

__Definition 13.8__
Ein Problem ist $\mathcal{NP}$-Vollständig ($\mathcal{NP}$-complete), wenn es in $\mathcal{NP}$ ist und $\mathcal{NP}$-schwer ist.

Um zu zeigen, dass ein Problem $\mathcal{NP}$-vollständig ist, muss man also zeigen, dass es in $\mathcal{NP}$ ist und dass es $\mathcal{NP}$-schwer ist. Um zu zeigen, dass ein Problem in $\mathcal{NP}$ ist, reicht es aus einen nicht-deterministischen Polynomialzeit Algorithmus anzugeben. Um zu beweisen, dass ein Problem $A$ $\mathcal{NP}$-schwer ist, muss man zeigen, dass alle Probleme aus $\mathcal{NP}$ sich auf das Problem $A$ reduzieren lassen. Doch wie ist das möglich, schließlich gibt es serh viele Probleme in $\mathcal{NP}$? Es reicht aus zu zeigen, dass sich ein NP-vollständiges Problem $Y$ zu $A$ reduzieren lässt. Schließlich lässt sich per Definition jedes Problem aus $\mathcal{NP}$ auf das $\mathcal{NP}$-vollständige Problem $Y$ reduzieren. Und gelingt die Rduktion von $Y$ yu $A$, so ist durch die Transitivität der Reduktion die $\mathcal{NP}$-Schwere von $A$ gegeben. 

<img src="img/polynomial_reduction_from_NP.png" width="300">

__Die Komplexitätsklassen $\mathcal{P}$, $\mathcal{NP}$, $\mathcal{NPC}$, $\mathcal{NPH}$ und $\mathcal{EXP}$ unter der Annahme $\mathcal{P} \neq \mathcal{NP}$__

<img src="img/NPC_NPH.png" width="250">

- $\mathcal{NPC}$ - NP-complete
- $\mathcal{NPH}$ - NP-hard

## P vs. NP Problem

Das $\mathcal{P}$ vs. $\mathcal{NP}$ Problem ist ein ungelöstes Problem in der Informatik, welches von enormer Bedeutung ist. Es stellt die Frage, ob $\mathcal{P} = \mathcal{NP}$ oder $\mathcal{P} \neq \mathcal{NP}$ gilt, also ob $\mathcal{P}$ und $\mathcal{NP}$ die gleichen Mengen darstellen, oder ob es Probleme gibt, die in $\mathcal{NP}$ liegen, aber nicht in $\mathcal{P}$.

Man kann zeigen, dass die Menge $\mathcal{NP} \setminus (\mathcal{NPC} \cup \mathcal{P})$ unter der Annahme $\mathcal{P} \neq \mathcal{NP}$ nicht leer ist. Das Primzahlproblem ist vermutlich weder in $\mathcal{P}$ noch $\mathcal{NP}$-vollständig ($NPC$). Niemand weiß dies wirklich.

Die Komplexitätstheorie hat also für eine enorme Zuspitzung der Frage nach der Existenz von Polynomialzeitalgorithmen gesorgt, die (vermutlich) nicht effizient gelöst werden können. Die Tatsache, dass es trotz enormer Anstrengungen bis heute niemanden gelungen ist, auch nur ein einziges solche $\mathcal{NP}$-vollständiges Problem in Polynomialzeit zu lösen, stützt die Vermutung, dass es keine Polynomialzeit-Lösungen für alle $\mathcal{NP}$-Probleme gibt.

Bewiesen ist dies allerdings noch nicht, dass es noch niemanden gelungen ist, einen Polynomialzeitalgorithmus für ein $NP$-vollständiges Problem anzugeben, heißt nicht, dass es keinen geben kann. Würde es gelingen für ein einziges $\mathcal{NP}$-vollständiges Problem $A$ einen Polynomialzeitalgorithmus anzugeben, so würde daraus folgen, dass $\mathcal{P} = \mathcal{NP}$, da man jedes Problem aus $\mathcal{NP}$ auf das Problem $A$ reduzieren könnte, und dank dieses neuen Algorithmus in Polynomialzeit lösen könnte, was jedes Problem aus $\mathcal{NP}$ automatisch zu einem Problem in $\mathcal{P}$ machen würde.

Gelänge andererseits für ein einziges $\mathcal{NP}$-vollständiges Problem der Nachweis, dass die untere Schranke für den Berechnungsaufwand in $\mathcal{O}(\mathcal{O}(1)^n)$ liegt, so hätte man ein Problem gefunden, dass nachweislich in $\mathcal{NP}$ liegt, aber nicht in $\mathcal{P}$ und es wäre nachgewiesen, dass die Mengen $\mathcal{P}$ und $\mathcal{NP}$ nicht gleich sind. Wir wüssten also, dass $\mathcal{P} \neq \mathcal{NP}$ bzw. $\mathcal{P} \subsetneq \mathcal{NP}$.

## NP-Vollständige Probleme

### SAT Problem

Beim SAT-Problem, auch Boolean satisfiability problem genannt, ist eine aussagenlogische Formel gegeben, bei der zu entscheiden ist, ob es eine Belegung für die Variablen gibt, so dass der Wahrheitswert des aussagenlogische Formel wahr ist.

__Beispiel__

$$
(x_1 \lor x_2) \land x_3 \land \overline{x_2} \land (\overline{x_1} \lor \overline{x_3})
$$

Diese aussagenlogische Formel ist nicht erfüllbar.

Eine deterministische Lösung erfordert eine Tabelle für alle möglichen Belegungen der $n$ Variablen. Dies sind $2^n$ Stück. Eine Baumdarstellung unterstreicht optisch den exponentiellen Lösungsaufwand. Unter Nutzung des Nicht-Determinismus hingegen muss $n$ geraten werden, welche Belegung für die entsprechende Variable gewählt werden soll. Somit liegt das Problem in $\mathcal{NP}$.

#### Satz von Cook (1971)

Durch polynomielle Reduktion von einem $\mathcal{NP}$-vollständigen Problem $A$ zu einem Problem $B$ lässt sich zeigen, dass $B$ $\mathcal{NP}$-vollständig ist. Jedoch muss es (wenigstens) ein $\mathcal{NP}$-vollständiges Problem geben, dass nicht mit Hilfe polynomieller Reduktion eines anderen, schon vorhandenen, $\mathcal{NP}$-vollständigen Probelms als solches nachgewiesen wurde. Die $\mathcal{NP}$-Vollständigkeit des "ersten" $\mathcal{NP}$-vollständigen Problems wurde von Stephen Cook auf eine andere, sehr aufwändige Art und Weise nachgewiesen. Die Bedeutung des Cook'schen Beweises für die Komplexitätstheorie ist mit der Cantor'schen Diagonalisierung in der Berechenbarkeitstheorie zu vergleichen.

Die Beweisidee beruht darauf, dass jedes Merkmal einer Turing-Maschine als aussagenlogische Formel interpretiert wird.

Da man nun das "erste" $\mathcal{NP}$-vollständige Problem gefunden hat, kann man von diesem aus per polynomieller Reduktion die $\mathcal{NP}$-Vollständigkeit von Problemen nachweisen. Und von diesem "neuen" $\mathcal{NP}$-vollständigen Problem kann man nun per Reduktion weitere Probleme als $\mathcal{NP}$-vollständig beweisen.

### 3-SAT Problem

Beim 3-SAT Problem geht es wie beim SAT Problem um die Erfüllbarkeit einer aussagenlogischen Formel. Jedoch handelt es sich um eine aussagenlogische Formel, die in konjunktiver Normalform (CNF) mit maximal 3 Literalen vorliegt.

Ein Beispiel für einen solchen Ausdruck:

$$
(\overline{x_1} \lor x_2 \lor x_3) \land (x_2 \lor \overline{x_3} \lor x_4) \land (x_1 \lor \overline{x_2})
$$

Nun stellt sich die Frage, wie man zeigt, dass das 3-SAT Problem $\mathcal{NP}$-vollständig ist, genauer wie man von einem $\mathcal{NP}$-vollständigen Problem auf das 3-SAT Problem reduziert. Da da SAT Problem dem 3-SAT Problem sehr ähnlich ist, ist offensichtlich, dass dieses Problem als Ausgangspunkt für die polynomielle Reduktion geeignet ist. 

Man muss also einen Weg finden, eine beliebige aussagenlogische Formel in die konjunktive Normalform mit maximal 3 Literalen bringen. Dafür muss man zunächst die aussagenlogische Formel in konjunktive Normalform bringen. Hierfür werden die De Morganschen Regeln und das Ditributivgesetz angewandt. Zunächst werden alle Negationen in die Negationsnormalform gebracht, dafür werden folgende Umformungen vorgenommen:

$$
\begin{align*}
\overline{P \lor Q} & \rightarrow \overline{P} \land \overline{Q} \\
\overline{P \land Q} & \rightarrow \overline{P} \lor \overline{Q}
\end{align*}
$$

Anschließend wird das Distributivgesetz angewandt, bis nur noch Konjunktion (und-Verknüpfungen) über Disjunktionen (oder-Verknüpfungen) vorliegen.

$$
P \lor (Q \land R) \rightarrow (P \lor Q) \land (P \lor R)
$$