# 0-1 Knapsack, ένα δύσκολο πρόβλημα

Το πρόβλημα knapsack ή πρόβλημα του σακιδίου είναι ένα κλασσικό πρόβλημα συνδυαστικής βελτιστοποίησης. Με δεδομένο ένα σύνολο αντικειμένων, το καθένα από τα οποία έχει ένα ορισμένο βάρος και αξία, θέλουμε να προσδιορίσουμε το πλήθος κάθε αντικειμένου που πρέπει να συμπεριλάβουμε σε ένα σακίδιο το οποίο έχει ένα μέγιστο όριο βάρους έτσι ώστε η συνολική αξία του σακιδίου να μεγιστοποιηθεί.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/f/fd/Knapsack.svg/486px-Knapsack.svg.png" width="30%">

Υπάρχουν διάφορες παραλλαγές του Knapsack. Το 0-1 (ή διακριτό) Knapsack θεωρεί ότι έχουμε ακριβώς ένα διαθέσιμο αντίτυπο από κάθε αντικείμενο και είτε θα το συμπεριλάβουμε στο σακίδιο είτε όχι, εξού και το 0-1 (υπάρχει και η παραλλαγή χωρίς όρια στο πλήθος του κάθε αντικειμένου και η παραλλαγή με ένα όριο $c$ το πλήθος για κάθε αντικείμενο). Επιπρόσθετα, θεωρούμε ότι κάθε αντικείμενο είναι αδιαίρετο. 

Με δεδομένο ένα σύνολο $n$ αντικειμένων αριθμημένα από 1 έως n, το καθένα με βάρος $w_i$ και αξία $v_i$, και μια μέγιστη χωρητικότητα W, θέλουμε να μεγιστοποιήσουμε την ποσότητα

$\sum\limits_{i=1}^{n}v_{i}x_{i}$

υπό τον περιορισμό to $\sum\limits_{i=1}^{n}w_{i}x_{i}\leq W$ και $x_{i}\in \{0,1\}$

## Δυσκολία

Η εύρεση του βέλτιστου συνδυασμού αντικειμένων είναι πρόβλημα NP-complete. Υπό ορισμένες συνθήκες (τα βάρη να είναι μη αρνητικοί ακέραιοι) το πρόβλημα μπορεί να επιλυθεί με δυναμικό προγραμματισμό σε ψεύδο-πολυωνυμικό χρόνο (δηλαδή πολυνωμιακό ως προς το μέγιστο αριθμό που αποτελεί μέρος της εισόδου, εκθετικό όμως σε σχέση με το μήκος της εισόδου).

## Επίλυση με Δυναμικό Προγραμματισμό

<img src="https://preview.ibb.co/bWewu6/knapsack_Page13s.jpg" width="40%">

Σε κάθε βήμα i, θεωρούμε διαθέσιμα τα i πρώτα αντικείμενα. Για όλα τα δυνατά βάρη w απο 0 έως W η τιμή της $V[i,w]$ είναι είτε ίση με $V[i-1,w]$ (αν η προσθήκη οποιουδήποτε αντικειμένου ξεπερνά το βάρος W αυτή είναι η μόνη δυνατότητα), είτε ίση με το μέγιστο που μπορούν να δώσουν τα i αντικείμενα για το βάρος w μείον το βάρος του αντικειμένου i συν την αξία του αντικειμένου i:

$V[0,w] = 0$, για $0 \leq w \leq W $

$V[i,w] = max(V[i-1,w], v_i+V[i-1,w-w_i])$

Η πολυπλοκότητα είναι $O(nW)$.

In [1]:
def DP_knapSack(W, items):
    wt = []
    val = []
    for key, value in items.iteritems():
        wt.append(value[0])
        val.append(value[1])
    n = len(val)
    
    K = [[0 for x in range(W+1)] for x in range(n+1)]
 
    # Build table K[][] in bottom up manner
    for i in range(n+1):
        for w in range(W+1):
            if i==0 or w==0:
                K[i][w] = 0
            elif wt[i-1] <= w:
                K[i][w] = max(val[i-1] + K[i-1][w-wt[i-1]],  K[i-1][w])
            else:
                K[i][w] = K[i-1][w]
 
    return K[n][W]

In [4]:
import random

# αρχικοποιήσεις
MAX_WEIGHT = 20000 # το μέγιστο βάρος (χωρητικότητα) του σακιδίου
NBR_ITEMS = 1000 # το πλήθος των διαθέσιμων αντικειμένων
MAX_ITEM_WEIGHT= MAX_WEIGHT # το μέγιστο ΄βάρος για κάθε αντικειμένου (το θέτουμε ίσο με το μέγιστο βάρος του σακιδίου). Ακέραιος.
MAX_ITEM_VALUE= 10 # η μέγιστη αξία κάθε αντικειμένου

SEED = 20000
# To assure reproductibility, the RNG seed is set prior to the items
# dict initialization. It is also seeded in main().
random.seed(SEED)

# Create the item dictionary: item name is an integer, and value is 
# a (weight, value) 2-uple.
items = {}
# Create random items and store them in the items' dictionary.
for i in range(NBR_ITEMS):
    items[i] = (random.randint(1, MAX_ITEM_WEIGHT), random.uniform(0, MAX_ITEM_VALUE))

| MAX_WEIGHT | NBR_ITEMS | COMPLEXITY | RESULT      | WALL TIME (sec) |
|------------|-----------|------------|-------------|-----------------|
| 20,000      | 500       | 10,000,000   | 163.289787279 | 3.76            |
| 20,000      | 1,000      | 20,000,000   | 277.29256589  | 7.72            |
| 100,000     | 2,000      | 200,000,000 | 404.624148539  | 77 |
| 100,000     | 10,000      | 1,000,000,000 | 804.926256691  | 397 |
| 100,000     | 50,000      | 5,000,000,000 |  Memory Error  | Memory Error  |

In [5]:
%time print DP_knapSack(MAX_WEIGHT, items )

277.29256589
CPU times: user 7.67 s, sys: 345 ms, total: 8.01 s
Wall time: 8.01 s


## Λύση με γενετικό αλγόριθμο πολυκριτηριακής βελτιστοποιήσης (επιλογή με NSGA-II)

Η επιλογή βασίζεται στο [μέτωπο Pareto](https://en.wikipedia.org/wiki/Pareto_efficiency). Τα σημεία που βρίσκονται στο μέτωπο Pareto κυριαρχούν (dominate) επί αυτών που δεν βρίσκονται επί του μετώπου δηλαδή αποτελούν καλύτερες λύσεις. Για δύο κριτήρια προς ελαχιστοποίηση το μέτωπο Pareto έχει ως εξής:
<img src="https://ascelibrary.org/cms/attachment/5545/34309/figure1.jpg" width="25%">
Ο αλγόριθμος επιλογής NSGA-II καταρχάς ξεχωρίζει ως καλύτερα άτομα για αναπαραγωγή τα άτομα που ανήκουν στο Pareto front. Στη συνέχεια ταξινομεί και αυτά με βάση την απόσταση που έχουν μεταξύ τους (τείνει να προτιμά λύσεις που βρίσκονται σε πιο αραιές περιοχές του front).

In [None]:
import numpy

from deap import algorithms
from deap import base
from deap import creator
from deap import tools

IND_INIT_SIZE = int(NBR_ITEMS/100) # το αρχικό πλήθος των αντικειμένων ενός ατόμου (θα αλλάξει κατά την αναπαραγωγή)

# ορίζουμε το πρόβλημα ως βελτιστοποίηση δύο κριτηρίων: ελαχιστοποίηση βάρους και μεγιστοποίηση αξίας
creator.create("Fitness", base.Fitness, weights=(-1.0, 1.0))
# το άτομο κληρονομεί την set και όχι την list
creator.create("Individual", set, fitness=creator.Fitness)

toolbox = base.Toolbox()

# Attribute generator
toolbox.register("attr_item", random.randrange, NBR_ITEMS) #ακέραιος αριθμός με μέγιστο τον αριθμό των αντικειμένων

# Structure initializers
toolbox.register("individual", tools.initRepeat, creator.Individual, toolbox.attr_item, IND_INIT_SIZE)
# σημειώστε ότι τα attr_items θα είναι μοναδικά: έαν στο set {1,2} προστεθεί το 2 το set παραμένει {1,2}. Έτσι επιβάλλουμε το 0-1
toolbox.register("population", tools.initRepeat, list, toolbox.individual)

# η καταλληλότητα υπολογίζεται από τα items (άθροισμα βαρών και αξίας)
def evalKnapsack(individual):
    weight = 0.0
    value = 0.0
    for item in individual:
        weight += items[item][0]
        value += items[item][1]
    if weight > MAX_WEIGHT:
        return MAX_WEIGHT, 0             # Ensure overweighted bags are dominated
    return weight, value

def cxSet(ind1, ind2):
    """Εφαρμόζουμε ένα τελεστή διασταύρωσης πάνω στα σύνολα εισόδου (γονείς). 
    Το πρώτο παιδί είναι η τομή των δύο συνόλων (η λίστα θεωρείται ως ένα σύνολο), το δεύτερο η διαφορά τους.
    """
    temp = set(ind1)                # Used in order to keep type
    ind1 &= ind2                    # Intersection (inplace)
    ind2 ^= temp                    # Symmetric Difference (inplace)
    return ind1, ind2
    
def mutSet(individual):
    """Η μετάλλαξη αφαιρεί ή προσθέτει τυχαία ένα αντικείμενο"""
    if random.random() < 0.5:
        if len(individual) > 0:     # We cannot pop from an empty set
            individual.remove(random.choice(sorted(tuple(individual))))
    else:
        tmp  = random.randrange(NBR_ITEMS)
        #ψάχνουμε ένα αντικείμενο που να μην υπάρχει στο άτομο
        while (tmp in individual):
            tmp  = random.randrange(NBR_ITEMS)
        individual.add(tmp)
    return individual,

toolbox.register("evaluate", evalKnapsack)
toolbox.register("mate", cxSet)
toolbox.register("mutate", mutSet)
# η επιλογή γίνεται με τον NSGA-II
toolbox.register("select", tools.selNSGA2)

def main():
    #random.seed(SEED)
    NGEN = 200
    MU = 50
    LAMBDA = 1600
    CXPB = 0.2
    MUTPB = 0.8
    
    pop = toolbox.population(n=MU)
    hof = tools.ParetoFront()
    stats = tools.Statistics(lambda ind: ind.fitness.values)
    stats.register("avg", numpy.mean, axis=0)
    stats.register("std", numpy.std, axis=0)
    stats.register("min", numpy.min, axis=0)
    stats.register("max", numpy.max, axis=0)
    
    # εφαρμόζουμε γενετικο αλγόριθμο στρατηγικής μ+λ. H επιλογή γίνεται στο σύνολο μ γονέων και λ παιδιών 
    algorithms.eaMuPlusLambda(pop, toolbox, MU, LAMBDA, CXPB, MUTPB, NGEN, stats,
                              halloffame=hof)
    
    return pop, stats, hof
                 
if __name__ == "__main__":
    %time pop, stats, hof = main()

| ALGORITHM | MAX_WEIGHT | NBR_ITEMS | COMPLEXITY | RESULT      | WALL TIME (sec) | VALUE (RESULT/TIME)|
|------------|------------|-----------|------------|-------------|-----------------|-----------------|
|DP| 20,000     | 500      |  10,000,000| 163.289787279 | 3.76             | **43.428**|
|GA (NGEN = 100, MU = 100, LAMBDA = 1900, CXPB = 0.6, MUTPB = 0.4)| 20,000     | 500      | 10,000,000 | 158.63303462 |     67        | 2.368  |
|DP|  20,000      | 1,000      | 20,000,000   | 277.29256589  | 7.72            | **35.919** |
|GA (NGEN = 100, MU = 100, LAMBDA = 1900, CXPB = 0.6, MUTPB = 0.4)| 20,000     | 1,000      | 20,000,000 | 228.68608541 |     78        | 2.932  |
|DP | 100,000     | 2,000      | 200,000,000 | 404.624148539  | 77 | **5.254** |
|GA (NGEN = 150, MU = 25, LAMBDA = 2000, CXPB = 0.8, MUTPB = 0.2)| 100,000     | 2,000      | 200,000,000 | 334.93656337 |     90        | 4.630  |
|DP| 100,000     | 10,000      | 1,000,000,000 | 804.926256691  | 397 | 2.0275 |
|GA (NGEN = 200, MU = 25, LAMBDA = 1800, CXPB = 0.8, MUTPB = 0.2)| 100,000     | 10,000      |1,000,000,000|  420.3180269 |     114        | **3.687**  |
|DP| 100,000     | 50,000      | 5,000,000,000 | Memory Error |
|GA (NGEN = 250, MU = 25, LAMBDA = 1600, CXPB = 0.8, MUTPB = 0.2)| 100,000     | 50,000      | 5,000,000,000 | 497.1761053 |     136        | **3.658**  |

## Άσκηση
Για MAX_WEIGHΤ = 100,000 και NBR_ITEMS = 10,000 (τρέξτε το μπλοκ με τις αρχικοποιήσεις των αντικειμένων με αυτές τις τιμές) δοκιμάστε διαφορετικές παραμέτρους στον γενετικό με NSGA-II για να βελτιώσετε τη μέγιστη αξία του knapsack (σε λογικό χρόνο - κρατήστε τον αριθμό των γενεών στο 200).