## Dynamische Programmierung

Dynamische Programmierung ist ein Programmiermuster ('program paradigm'), das häufig dazu dient, alle Lösungen eines Problems auf systematische und effiziente Weise zu bestimmen. Die Anwendungsfälle haben in der Regel die folgenden Eigenschaften:

- overlapping subproblem: kleinere Problemgrößen werden wiederholt verwendet
- optimal substructure: eine optimale Lösung kann mit den optimalen Lösungen der kleineren Teilprobleme ermittelt werden.
 

### Top-down und Bottom-up

Es gibt zwei Möglichkeiten, einen DP Algorithmus zu implementieren:
- Bottom-up mittels einer Tabelle (Tabulation)
- Top-down mittels Rekursion und Memoization

Die Bottom-up Methode ist meistens etwas schneller, die Top-down Methode ist meistens einfacher zu programmieren.

#### Fibonacci-Zahlen

In [6]:
# Bottom-up
def fib(n):
    '''
    n: positive ganze Zahl
    returns: n-te Fibonacci Zahl
    '''
    if n <= 2: return 1
    a,b = 1,1
    for i in range(n-2):
        c = a+b
        a,b = b,c
    return c

fib(20)

6765

In [9]:
# Top-Down mit globaler Variablen memo
def fib(n):
    '''
    n: positive ganze Zahl
    returns: n-te Fibonacci Zahl
    '''
    if n in memo: return memo[n]
    if n <= 2: 
        result = 1
    else:
        result = fib(n-2) + fib(n-1)
    memo[n] = result
    return result

memo = {}
fib(20)

6765

Wir können die globale Variable vermeiden, wenn wir das dict in den rekursiven Aufrufen mitgeben.

In [63]:
# Top-Down ohne globale Variable
def fib(n,memo={}):
    '''
    n: positive ganze Zahl
    returns: n-te Fibonacci Zahl
    '''
    if n in memo: return memo[n]
    if n <= 2: 
        result = 1
    else:
        result = fib(n-2,memo) + fib(n-1,memo)
    memo[n] = result
    return result

fib(34)

5702887

In [66]:
# Rekursion ohne Memoization wird ab 34 spürbar langsam
# mit dem Dekorator lru-cache erfolgt eine automatische Memoization
from functools import lru_cache

@lru_cache
def fib(n):
    '''
    n: positive ganze Zahl
    returns: n-te Fibonacci Zahl
    '''
    if n <= 2: 
        result = 1
    else:
        result = fib(n-2) + fib(n-1)
    return result

fib(34)

5702887

### Wann dynamische Programmierung?

Auch mit den beiden oben gegebenen Eigenschaften eines DP-Problems ist es nicht immer einfach zu entscheiden, ob ein Problem mit dynamischer Programmierung lösbar ist. Hier ein paar Hilfestellungen:

1. Bei einem DP Problem wird häufig nach einem optimalen Wert gefragt, ein Minimum oder Maximum von etwas, oder nach der Anzahl von Möglichkeiten, etwas zu tun. Typische Fragestellungen:

- Was sind die minimalen Kosten für ...
- Welchen maximalen Gewinn kann man erzielen bei ...
- Wieviele Arten gibt es, um ... zu tun
- Was ist der längste Folge von ...
- Ist es möglich,  ... zu erreichen

2. Wenn wir uns eine Lösung als Folge von Entscheidungen vorstellen, hängen bei einem typischen DP-Problem zukünftige Entscheidungen von früheren Entscheidungen ab.

Wenn eine Problemstellung diese beide Eigenschaften hat, lohnt es sich, einen DP-Ansatz zu versuchen.

#### House Robber

Gegeben ist eine Liste von Zahlen, die die Wertsachen in einer Reihe von Häusern zeigen. Ein Räuber will möglichst viel erbeuten, darf aber in keine benachbarten Häuser einbrechen. Welches ist die maximal mögliche Beute?

```
Input: [2,7,9,3,1]
Output: 12

```

In [13]:
def rob(nums,i):
    '''
    returns: die maximale Beute, wenn nur bis einschließlich Index i geraubt werden darf.
    '''
    if i in memo:
        return memo[i]
    if i < 0:
        result = 0
    else:
        result = max(rob(nums,i-1),rob(nums,i-2)+nums[i])
    memo[i] = result
    return result

In [14]:
memo = {}
a = [2,7,9,3,1]
rob(a,len(a)-1)

12

#### Min Cost Climbing Stairs

Gegeben ist eine Liste *cost*, wobei *cost[i]* die Kosten dafür sind, die i-te Treppenstufe zu benutzen.
Man kann entweder eine oder zwei Stufen nehmen und entweder von der Stufe mit Index 0 oder Index 1 beginnen. Finde die  minimalen Kosten, um die Treppe zu besteigen.

In [22]:
def stairs(cost,i):
    '''
    returns: die minimalen Kosten, um es bis zur Stufe i zu schaffen.
    
    '''
    if i in memo:
        return memo[i]
    if i <= 1:
        result = 0
    else:
        result = min(stairs(cost,i-2)+cost[i-2], stairs(cost,i-1)+cost[i-1])
    memo[i] = result
    return result

In [23]:
memo = {}
cost = [10,15,20]
stairs(cost,len(cost))

15

#### Tribonacci-Zahlen

Die Tribonacci-Zahlen sind wie folgt definiert: <br>
$T_0 = 0, T_1 = 1, T_2 = 1$ und $T_{n+3}=T_n+T_{n-1}+T_{n-2}$ <br>
Schreibe eine Funktion, die die n-te Tribonacci-Zahl berechnet.

In [30]:
def tribonacci(n):
    if n in memo:
        return memo[n]
    if n == 0:
        result = 0
    elif n <= 2: 
        result = 1
    else:
        result = tribonacci(n-1)+tribonacci(n-2)+tribonacci(n-3)
    memo[n] = result
    return result

In [32]:
memo = {}
tribonacci(15)

3136

#### Delete and Earn

Gegeben sei eine Liste a. Berechne die maximal mögliche Punktzahl, wenn auf der Liste a beliebig oft folgende Operation durchgeführt wird:

Wähle eine Zahl a[i] und lösche diese Zahl aus der Liste, um a[i]-Punkte zu gewinnen. Anschließend müssen aus der Liste nums noch alle Elemente gelöscht werden, die den gleichen Wert wie a[i]+1 und a[i]-1 haben.



In [58]:
def earn(a, i):
    '''
    nums: sortierte Liste mit positiven Zahlen ohne doppeltes Vorkommen    
    '''
    if i in memo:
        return memo[i]
    if i == 0:
        result = a[0]*counter[a[0]]
    elif i == 1:
        if a[0]+1<a[1]:
            result = counter[a[0]]*a[0] + counter[a[1]]*a[1]
        else:
            result = max(counter[a[0]]*a[0],counter[a[1]]*a[1])
    else:
        if a[i-1] < a[i]-1:
            result = earn(a,i-1) + counter[a[i]]*a[i]
        else:
            result = max(earn(a,i-2)+counter[a[i]]*a[i],earn(a,i-1))
    memo[i] = result
    return result
        
#
# wir merken uns, wie häufig eine Zahl in der Ursprungsliste vorkommt, dann entfernen wir die mehrfachen
# Elemente und sortieren die Liste.
#
from collections import Counter
a = [8,3,4,7,6,6,9,2,5,8,2,4,9,5,9,1,5,7,1,4]
counter = Counter(a)
a = sorted(set(a))
memo = {}
earn(a,len(a)-1)            
 

61