# Travelling Salesman Problem

### kombinatorisches Optimierungsproblem:
* minimale Tour auf vollständigen Graph
* TSP ist NP-vollständig
* Es ist kein Polynomialzeit Algorithmus bekannt
* $\dfrac{(n-1)!}{2}$ verschiedene mögliche Touren (symmetrisches TSP)

### Anwendungen:
* Logistik
* DNA Sequenzierung
* Layout integrierter Schaltkreise
* Bohrersteuerung bei Herstellung von Leiterplatten
* Teleskop-Planung von Stern zu Stern

### exakte Verfahren

| Typ | Algorithmus | Laufzeit |
| :-- | :---------- | :------- |
| vollständige Enumeration | | $$\mathcal{O}\left(n!\right)$$ |
| dynamische Programmierung | Held-Karp Algorithmus | $$\mathcal{O}\left(n^2 2^n\right)$$ |
| lineare Programmierung | Concorde und Gurobi | Concorde ist schnellster exakte TSP Solver für große TSP Instanzen |

### Heuristiken

| Typ | Algorithmus | Laufzeit | max. Abweichung vom Optimum |
| :-- | :---------- | :------- | :-------------------------- |
| Eröffnungsheuristik | Nearest Neighbor | $$\mathcal{O}\left(n^2\right)$$ | beliebig groß |
| Eröffnungsheuristik | MST-Heuristik | $$\mathcal{O}\left(n^2\log(n)\right)$$ | 2-Approx. für $\Delta$-TSP |
| Eröffnungsheuristik | Christofides-Heuristik | $$\mathcal{O}\left(n^3\right)$$ | 1.5-Approx. für $\Delta$-TSP |
| Verbesserungsheuristik | k-Opt-Heuristik | $$\mathcal{O}\left(k!\right)\text{ pro Schritt}$$ | beliebig groß |
| Metaheuristik | Ant Colony Optimization | | beliebig groß |
| Metaheuristik | genetische Algorithmen | | beliebig groß |
| Metaheuristik | lokale Suche | | beliebig groß |
| Metaheuristik | neuronale Netze | | beliebig groß |

### Neuronale Netze

| Name | Beschreibung | Literatur |
| :--- | :----------- | :-------- |
| Hopfield Network | erstes NN entwickelt für kleine TSP Instanzen | [Hopfield & Tank, 1985](https://link.springer.com/article/10.1007/BF00339943) |
| Pointer Network | Encoder-Decoder Model mit attention mechanism | [Vinyals et al., 2015](https://arxiv.org/abs/1506.03134)|
| Pointer Network + RL | Reinforcement Learning für Training | [Bello & Pham, 2016](https://arxiv.org/abs/1611.09940) |
| S2V-DQN | Graph Embedding Network (structure2vec) mit Reinforcement Learning (Deep Q-Learning Network) für Training | [Khalil et al., 2017](https://arxiv.org/abs/1704.01665)|
| QAP | TSP als Quadratic Assignment Problem formuliert; Graph Neural Network mit supervised learning | [Nowak et al., 2017](https://arxiv.org/abs/1706.07450v1) |
| Tranformer-encoder + RL + 2-Opt | Transformer als Encoder mit Reinforcement Learning (Actor-Critic) für Training und 2-Opt refinement | [Deudon et al., 2018](https://link.springer.com/chapter/10.1007/978-3-319-93031-2_12) |
| Tranformer-encoder + Attention-decoder | | [Kool et al., 2019](https://arxiv.org/abs/1803.08475) |
| CNN + RL | Convolutional Neural Network mit supervised learning und Reinforcement Learning für Good-Edge-Distribution | [Miki et al., 2019](https://ieeexplore.ieee.org/document/8659266) |
| GraphConvNet | Graph Convolutional Network mit beam search | [Joshi et al., 2019](https://arxiv.org/abs/1906.01227) |
| 2-Opt Learning + RL | transformer-based Network mit Reinforcement Learning (Actor-Critic) | [Wu et al., 2019](https://arxiv.org/abs/1912.05784) |
| 2-Opt Learning + DRL | Policy Gradient Neural Architecture mit Deep Reinforcement Learning (Markov Decision Process) als Training | [Costa et al., 2020](https://arxiv.org/abs/2004.01608) |
| PCN | Pixel-mapped Classification Network | [Miki & Ebara., 2020](https://ieeexplore.ieee.org/document/8995285)|
| GNNs + MCTS | Graph Neural Network mit Monte Carlo Tree Search | [XIng & Tu, 2020](https://ieeexplore.ieee.org/document/9109309) |
| CTAS | CNN | [Zhao et al., 2021](https://ieeexplore.ieee.org/document/9533538) |
| end-to-end | end-to-end neural combinatorial optimization pipeline | [Joshi et al., 2021](https://arxiv.org/abs/2006.07054) + [Video](https://www.youtube.com/watch?v=IL-EfHR7gJE) |
| Transformer Network + RL |  | [Bresson & Laurent, 2021](https://arxiv.org/abs/2103.03012) + [Video](https://www.youtube.com/watch?v=-WMHy0lAK3s) |

### Datensätze

| Datensatz | Beschreibung | Literatur |
| :-------- | :----------- | :-------- |
| TSPGEN | zufällige Probleminstanzen generieren für Training | [Bossek et al., 2019](https://dl.acm.org/doi/abs/10.1145/3299904.3340307) |
| TSPLIB | Benchmark Library mit schwierigen Probleminstanzen | [TSPLIB](http://comopt.ifi.uni-heidelberg.de/software/TSPLIB95/index.html) |

### Supervised Learning (SL) vs Reinforcement Learning (RL)

| Supervised Learning | Reinforcement Learning |
| :------------------ | :--------------------- | 
| - benötigt Probleminstanz und optimale Lösung | + benötigt nicht die optimale Lösung |
| - Datensätze nur für kleine Probleminstanzen möglich | + Datensätze mit größeren Probleminstanzen möglich |
| + sample efficient | - weniger sample efficent als SL |
| | - mehr Compute-Aufwand als SL |