### Das Rucksack Problem (Knapsack)

Das Rucksack-Problem: Fülle einen Rucksack so, dass der Wert der Dinge möglichst groß ist und die Gewichtsgrenze nicht überschritten wird.

#### Greedy

In [None]:
wert = [1,1,1,10,10,13,7]
gewicht = [2,2,2,5,5,8,3]
kapazitaet = 10

anzahl = len(wert)
taken = set()

wg = list(zip(wert,gewicht,range(anzahl)))     # Liste aus Tupels (wert,gewicht,nr)

#wg = sorted(wg, key=lambda x: x[1])                # die leichtesten zuerst
#wg = sorted(wg, key=lambda x: x[0], reverse=True)  # die wertvollsten zuerst
wg = sorted(wg, key=lambda x: x[0]/x[1], reverse=True) # die wertdichtesten zuerst

rucksack_gewicht = 0
rucksack_wert = 0

for item in wg:
    if rucksack_gewicht + item[1] <= kapazitaet:
        rucksack_gewicht+=item[1]
        rucksack_wert+=item[0]
        taken.add(item[2])

print('Items =',*taken)
print('Wert =',rucksack_wert, 'Gewicht =',rucksack_gewicht)

#### Rekursion


In [None]:
wert = [1,1,1,10,10,13,7]
gewicht = [2,2,2,5,5,8,3]
kapazitaet = 10

# wert = [5,6,3]
# gewicht = [4,5,2]
# kapazitaet = 9

def opt(k, j):
    '''
    returned den wert des optimalen Rucksacks mit Kapazität k, der
    nur Gegenstände mit Nummern 0...j enthält
    '''
    if j == -1: return 0
    elif gewicht[j] <= k:
        a = opt(k,j-1)
        b = wert[j]+opt(k-gewicht[j],j-1)
        return max(a,b)
    else:
        return opt(k,j-1)

print(opt(kapazitaet, len(wert)-1))

Der Rekursionsbaum zur Aufgabe mit den drei Items und die Reihenfolge der Auswertungen
 
<img src="./knapsack01.png" width=600>

```
opt(9,0)=5
opt(4,0)=5
opt(9,1)=11
opt(7,0)=5
opt(2,0)=0
opt(7,1)=6
opt(9,2)=11

```

---

Weiteres Beispiel mit Rekursionsbaum und der Reihenfolge der Auswertungen

<img src="./knapsack03.png" width=1000>

```
opt(15,0)=5
opt(8,0)=5
opt(15,1)=11
opt(13,0)=5
opt(6,0)=5
opt(13,1)=11
opt(15,2)=14
opt(7,0)=5
opt(0,0)=0
opt(7,1)=6
opt(5,0)=5
opt(5,1)=5
opt(7,2)=8
opt(15,3)=15

```

#### Dynamische Programmierung

In [None]:
wert = [1,1,1,10,10,13,7]
gewicht = [2,2,2,5,5,8,3]
kapazitaet = 10
anzahl = len(wert)

m = [[0 for j in range(kapazitaet+1)] \
     for i in range(anzahl)]

for j in range(1,kapazitaet+1):
    for i in range(anzahl):
        if gewicht[i] <= j:
            if i == 0:
                m[0][j] = wert[0]                      # Item 0 wird genommen, wenn es passt
            else:
                wert1 = m[i-1][j]                      # Item i wird nicht genommen
                wert2 = wert[i]+ m[i-1][j-gewicht[i]]  # Item i wird genommen
                m[i][j] = max(wert1,wert2)
        else:
            m[i][j] = m[i-1][j]

rucksack_wert = m[i][j]

# Rekonstruktion des optimalen Rucksacks
x = rucksack_wert
taken = set()

while i > 0:
    y = m[i-1][j]
    if x != y:
        taken.add(i)
        j = j-gewicht[i]
    i = i - 1
    x = m[i][j]
if m[0][j] != 0:
    taken.add(0)

rucksack_gewicht = sum([gewicht[i] for i in taken])
print('Items =',*taken)
print('Wert =',rucksack_wert, 'Gewicht =',rucksack_gewicht)



#### Beispieldaten

Hier sind __[Beispieldaten](./knapsack_data)__ für das Rucksack-Problem. Die beiden Zahlen in der ersten Zeile geben
die Anzahl Gegenstände und die Kapazität des Rucksacks an. Dann folgt für jeden Gegenstand eine Zeile mit seinem Wert und Gewicht.  


Welche der Greedy-Strategien die bessere ist, hängt von den Ausgangsdaten ab.

In [90]:
file = 'ks_100_0'              # die leichtesten
#file = 'ks_100_1'             # die wertvollsten
#file = 'ks_100_2'             # die wertdichtesten gewinnen

f = open('./knapsack_data/'+file)
anzahl, kapazitaet = [int(k) for k in f.readline().split()]
data = []
for i in range(anzahl):
    wert, gewicht = f.readline().split()
    data.append([int(wert),int(gewicht),i])
f.close()

def greedy(wg):
    rucksack_gewicht = 0
    rucksack_wert = 0
    for item in wg:
        if rucksack_gewicht + item[1] <= kapazitaet:
            rucksack_gewicht+=item[1]
            rucksack_wert+=item[0]
    print('Wert =',rucksack_wert, 'Gewicht =',rucksack_gewicht)
    

print('Kapazität =',kapazitaet)

print('Die leichtesten zuerst   :',end=' ')
wg = sorted(data, key=lambda x: x[1])                # die leichtesten zuerst
greedy(wg)

print('Die wertvollsten zuerst  :',end=' ')
wg = sorted(data, key=lambda x: x[0], reverse=True)    # die wertvollsten zuerst
greedy(wg)

print('Die wertdichtesten zuerst:',end=' ')
wg = sorted(data, key=lambda x: x[0]/x[1], reverse=True)
greedy(wg)


Kapazität = 10000
Die leichtesten zuerst   : Wert = 9628 Gewicht = 9751
Die wertvollsten zuerst  : Wert = 10547 Gewicht = 9999
Die wertdichtesten zuerst: Wert = 10892 Gewicht = 9999


Die Rekursion findet die optimale Lösung, kann aber zu langen Laufzeiten führen.

In [85]:
file = 'ks_19_0'             # die optimale Lösung wird von keiner der drei Greedy-Strategien gefunden
#file = 'ks_45_0'              # das dauert schon unerträglich lange

f = open('./knapsack_data/'+file)
anzahl, kapazitaet = [int(k) for k in f.readline().split()]
wert, gewicht = [], []
for i in range(anzahl):
    w, g = f.readline().split()
    wert.append(int(w))
    gewicht.append(int(g))

f.close()

def opt(k, j):
    '''
    returned den wert des optimalen Rucksacks mit Kapazität k, der
    nur Gegenstände mit Nummern 0...j enthält
    '''
    if j == -1: return 0
    elif gewicht[j] <= k:
        a = opt(k,j-1)
        b = wert[j]+opt(k-gewicht[j],j-1)
        return max(a,b)
    else:
        return opt(k,j-1)

print(opt(kapazitaet, len(wert)-1))

12248


Die dynamische Programmierung kann Fälle lösen, die rekursiv sehr lange dauern.

In [1]:
#file = 'ks_45_0'    # das geht gut          
#file = 'ks_50_0'    # das geht gut
#file = 'ks_100_0'   # das geht gut
#file = 'ks_100_1'   # das dauert unerträglich lange
file = 'ks_100_2'    # das geht und zeigt, dass greedy manchmal das Optimum findet


f = open('./knapsack_data/'+file)
anzahl, kapazitaet = [int(k) for k in f.readline().split()]
wert, gewicht = [], []
for i in range(anzahl):
    w, g = f.readline().split()
    wert.append(int(w))
    gewicht.append(int(g))

f.close()

anzahl = len(wert)

m = [[0 for j in range(kapazitaet+1)] \
     for i in range(anzahl)]

for j in range(1,kapazitaet+1):
    for i in range(anzahl):
        if gewicht[i] <= j:
            if i == 0:
                m[0][j] = wert[0]                      # Item 0 wird genommen, wenn es passt
            else:
                wert1 = m[i-1][j]                      # Item i wird nicht genommen
                wert2 = wert[i]+ m[i-1][j-gewicht[i]]  # Item i wird genommen
                m[i][j] = max(wert1,wert2)
        else:
            m[i][j] = m[i-1][j]

rucksack_wert = m[i][j]

# Rekonstruktion des optimalen Rucksacks
x = rucksack_wert
taken = set()

while i > 0:
    y = m[i-1][j]
    if x != y:
        taken.add(i)
        j = j-gewicht[i]
    i = i - 1
    x = m[i][j]
if m[0][j] != 0:
    taken.add(0)

    
rucksack_gewicht = sum([gewicht[i] for i in taken])
print('Items =',*taken)
print('Wert =',rucksack_wert, 'Gewicht =',rucksack_gewicht)

Items = 0 1
Wert = 11 Gewicht = 9
