# Approximation algorithms

# PROBLEMA IN COMPUTER SCIENCE

- problema $π$ è relazione: 
	- $π \subseteq I_{\pi} x S_{\pi}$ dove:
	    - $I$ = insieme delle istanze di input
	    - $S$ = insieme delle soluzioni al problema

- tipi problemi:
	- **decisione**: $S$ = $\{true, false\}$, controllano se data proprietà vale o no per un certo input.
	- **ricerca**: data un'istanza $x \in I$, determinazione di una soluzione $Y \in S$, tale che coppia $(x,y) \in π$ appartiene a relazione che definisce problema. 
	- **ottimizzazione**: data un'istanza $x \in I$, determinazione di soluzione $Y \in S$ che ottimizza data misura di funzione costo.

## Complessità per algoritmi e problemi

- espressa in funzione della cardinalità dell'input
- cardinalità dell'input di $x$: 
    - quantità memoria necessaria per memorizzare $x$
    - lunghezza della stringa che codifica $x$ in un particolare codice naturale $c$

- codice naturale: 
	- stringhe che codificano istanze non devono essere ridondanti o allungate inutilmente.
	- numeri espressi in base $ \geq 2$

- $t_A(x)$: running time di algoritmo $A$ su input $x$

- worst case running time di $A$: sia $t_A(x)$ il running time dell'algoritmo $A$ per input $X$, allora il worst case running time di $A$ è: $T_A(n)$ = $max${$t_A(x)$ | $|x| \leq n$}, per ogni $n > 0$

- un algoritmo A ha time complexity:
	- $O(g(n))$ se $T_A(n)$ = $O(g(n))$: $g(n)$ limite superiore 
	- $Ω(g(n))$ se $T_A(n)$ = $Ω(g(n))$: $g(n)$ limite inferiore
	- $Θ(g(n))$ se $T_A(n)$ = $Θ(g(n))$: $g(n)$ limite stretto

- un problema ha complessità:
	- $O(g(n))$: se esiste un algoritmo $A$ che lo risolve e ha complessità $O(g(n))$
	- $Ω(g(n))$: se ogni algoritmo $A$ che lo risolve ha complessità $Ω(g(n))$
	- $Θ(g(n))$: se ha complessità $O(g(n))$ e $Ω(g(n))$

## Problemi di decisione e classi di complessità

- problemi di decisione sono descritti da istanza di input e una domanda sull'input.
- in problemi di decisione $I = Y \cup N$:
    - $Y$: insieme istanza positive
    - $N$: insieme istanze negative

- un algoritmo $A$ risolve $π$ SE E SOLO SE per ogni input $x \in I$, $A$ risponde 1 SE E SOLO SE $x \in Y$  

- $TIME(g(n))$ = classe di problemi di decisione con complessità $O(g(n))$

## Algoritmi non-deterministici per problemi di decisione

- 2 fasi:
	- fase 1: genera non-deterministicamente certificato $y$
	- fase 2: partendo da input $x$ e da certificato $y$, controlla se instanza $x$ è positiva.

- un algoritmo non-deterministico $A$ risolve $π$ SE:
	- si ferma per ogni possibile certificato $y$ ed
	- esiste certificato $y$ per il quale $A$ risponde 1 SE E SOLO SE $x$ appartiene ad $Y$

**Complessità**: costo fase 2, espressa come funzione sulla cardinalità dell'input

$NTIME(g(n))$: classe di problemi di decisione con complessità non-deterministica $O(g(n))$

- algoritmo deterministico meno potente di non-deterministico (non può eseguire fase 1)

- se c'è algoritmo deterministico $A$ che risolve $π$, c'è algoritmo non-deterministico $A'$ che risolve $π$ con la stessa complessità: esegue fase 1 e coincide con $A$ nella fase 2 ignorando certificato

$TIME(g(n)) \subseteq NTIME(g(n))$

- un problema è trattabile se è possibile risolverlo in modo efficiente (deterministico)(complessità delimitata da un polinomio della dimensione dell'input):
	- crescita funzioni polinomiali rispetto a funzioni esponenziali: esponenziale cresce rapidamente
	- robustezza concetto risolvibilità in tempo polinomiale: 
		- indipendenza da codice naturale usato
		- indipendenza da modello computazionale adottato, se modello computazionale adottato è ragionevole (tali modelli sono relazionati polinomialmente, possono simularsi a vicenda in tempo polinomiale)

## Codici relazionati polinomialmente

- 2 codici $c_1$ e $c_2$ per un problema $\pi$ sono relazionati polinomialmente se esistono 2 polinomi $p_1$ e $p_2$ tale che $|X|_{c_1} \leq p_1(|X|_{c_2})$ e $|X|_{c_2} \leq p_2(|X|_{c_1})$
- se complessità rispetto a $c_1$ è $O(q_1(|X|_{c_1}))$ allora rispetto a $c_2$ è $O(q_1(p_1(|X|_{c_2}))) = O(q_2(|X|_{c_2}))$
dove $q_1$ polinomio e $q_2$ polinomio tale che $q_2(l) = q_1(p_1(l))$
- quindi: 2 quantità sono relazionate polinomialmente se sono polinomi sulle stesse variabili

## Modelli computazionali simulabili polinomialmente

- 2 modelli computazionali $M_1$ ed $M_2$ sono mutualmente polinomialmente simulabili se esistono 2 polinomi $p_1$ e $p_2$ tali che:
	- ciascun algoritmo $A$ per $M_1$ con complessità $T_A(n)$ può essere simulato in $M2$ in tempo $p_1(T_A(n))$
	- ciascun algoritmo $A$ per $M_2$ con complessità $T_A(n)$ può essere simulato in $M1$ in tempo $p_2(T_A(n))$
- se $A$ è polinomiale per $M_1$ allora è polinomiale per $M_2$ e viceversa
- modelli computazionali ragionevoli sono mutualmente simulabli: risolvibiliità polinomiale non dipende da modello usato

## Classi P ed NP

$P$ = classe di tutti i problemi risolvibili deterministicamente in tempo polinomiale

$NP$ = classe di tutti i problemi risolvibili non-deterministicamente in tempo polinomiale

Problemi NP-completi:
- i più difficili di NP
- se uno di loro appartiene a P, allora $P=NP$
- congettura $P \neq NP$: nessuno fino ad ora è riuscito a trovare un algoritmo polinomiale per un problema NP-completo

# PROBLEMI DI OTTIMIZZAZIONE

- un **problema di ottimizzazione** $\pi$ è $(I, S, m, goal)$ con:
 	- $I$: insieme delle istanze di input di $\pi$
 	- $S(x)$: insieme delle soluzioni feasible dell'istanza $x \in I$
 	- $m(x,y)$: misura della soluzione $y \in S(x)$ per input $x \in I$
 	- $goal$: {min, max} specifica se abbiamo problema di minimo o di massimo

- **soluzione ottima**: data un'istanza $x$ che appartiene ad $I$, una soluzione $y^*$ appartenente ad $S(x)$ è ottima per $x$ se $m(x, y^*)$ = $goal${$m(x,y)$ | $y \in S(x)$}

- la **misura della soluzione ottima** di $x$ è denotata come $m^*$

## Problema di decisione sottostante

- tutti i problemi di ottimizzazione hanno un **problema di decisione sottostante**: introducendo intero $k$ all'istanza di input $x$ e chiedendo se esiste soluzione feasible che ha misura $ \leq k$ (MIN) oppure $ \geq k$ (MAX)

- **problema di ottimizzazione**: dato input $x$, trova $y$ appartente ad $S(x)$ tale che $m(x,y)$ soddisfi il $goal$
- **problema di decisione sottostante**: dato un input $x$ ed un intero $k$, esiste soluzione feasible $y$ che abbia misura $ \leq k $(MIN) o $ \geq k$ (MAX) ?

- SE esiste algoritmo polinomiale $A$ per problema di ottimizzazione, ALLORA esiste algoritmo polinomiale $A'$ per problema di decisione sottostante che lavora così:
	- esegue $A$ per determinare soluzione ottima $y^*$ per l'input $x$
	- risponde $1$ se $m(x,y^*) \leq k$ (MIN) o se $m(x,y^*) \geq k$ (MAX)

- il problema di ottimizzazione è difficile **almeno quanto** il problema di decisione sottostante.

## Classi di complessità per problemi di ottimizzazione: PO

- un **problema di ottimizzazione** $\pi$ appartiene alla classe $PO$ se:
	- per ogni input $x$, $x \in I$ può essere controllato in tempo polinomiale
	- esiste un polinomio $p$ tale che per ogni $x \in I$ e $y \in S(x)$, $|y| \leq p(|x|)$
	- per ogni $x \in I$ ed $y \in S(x)$, $m(x,y)$ può essere computato in tempo polinomiale
	- per ogni $x \in I$, una soluzione ottima $y^*$ può essere computata in tempo polinomiale

## Classi di complessità per problemi di ottimizzazione: NPO

- un **problema di ottimizzazione** $\pi$ appartiene alla classe $NPO$ se:
	- tutto come sopra ma NON abbiamo: per ogni $x \in I$, una soluzione ottima $y^*$ può essere computata in tempo polinomiale

$PO$ = classe di problemi di ottimizzazione per cui il problema di decisione sottostante appartiene a $P$

$NPO$ = classe di problemi di ottimizzazione per cui il problema di decisione sottostante appartiene ad $NP$

$PO \subseteq NPO$

- **NP-hard**: un problema di ottimizzazione in $NPO$ è NP-hard se il suo problema di decisione sottostante è NP-completo
- **TEOREMA**: Se $P \neq NP$, un problema di ottimizzazione NP-hard NON può essere risolto in tempo polinomiale.
- **TEOREMA**: Se $P = NP$, $PO = NPO$

- design di algoritmi che ritornano soluzioni **vicine** a quelle ottime.

# ALGORITMI DI APPROSSIMAZIONE

Vogliamo risolvere un problema **NP-hard**, cosa facciamo ?

Sacrifichiamo una delle feature desiderate:
- risolvi istanze arbitrarie del problema
- risolvi il problema all'ottimo* (sacrifichiamo questa feature: design di algoritmi di approssimazione)
- risolvi il problema in tempo polinomiale

- creazione di algoritmi capaci di restiuire soluzioni **vicine** a quelle ottime, cioè buone **approssimazioni**

- dato un problema di minimizzazione e un numero $r \geq 1$, un algoritmo $A$ è un algoritmo $r$-approssimante per il problema $\pi$ se per ogni input $x \in I$, l'algoritmo ritorna sempre una soluzione $r$-approssimata, cioè una soluzione feasible $y \in S(x)$ tale che: $${m(x,y) \over m^*(x)} \leq r$$

- dato un problema di massimizzazione e un numero $r \leq 1$, un algoritmo $A$ è un algoritmo $r$-approssimante per il problema $\pi$ se per ogni input $x \in I$, l'algoritmo ritorna sempre una soluzione $r$-approssimata, cioè una soluzione feasible $y \in S(x)$ tale che: $${m(x,y) \over m^*(x)} \geq r$$

- come determiniamo il fattore di approssimazione $r$ se non sappiamo valore $m^*$ di una soluzione ottima?
	- per problemi di minimizzazione compariamo il valore della soluzione ritornata $m(x,y)$ con lower bound $l(x)$ di $m^*(x)$
	- per problemi di massimizzazione compariamo il valore della soluzione ritornata $m(x,y)$ con upper bound $u(x)$ di $m^*(x)$

- se il rapporto è $\leq r$ per MIN o $\geq r$ per MAX, allora l'algoritmo è $r$-approssimante:
    - se ${m(x,y) \over l(x)} \leq r$ allora ${m(x,y) \over m*(x)} \leq {m(x,y) \over l(x)} \leq r$ 	(per MIN)
    - se ${m(x,y) \over u(x)} \geq r$ allora ${m(x,y) \over m*(x)} \geq {m(x,y) \over u(x)} \geq r$ 	(per MAX)

## Algoritmo di approssimazione per Min vertex cover

### Min vertex cover:
**INPUT**: grafo $G=(V,E)$

**SOLUZIONE**: $U \subseteq V$, tale che: $u \in U$ oppure $v \in U$, per ogni $\{u,v\} \in E$

**MISURA**: $|U|$

### Algoritmo approx-cover:
`BEGIN

	M = Ø  	// archi scelti dall'algoritmo
	U = Ø 	// nodi scelti nel cover
	REPEAT
		- seleziona arco {u,v} che appartiene ad E
		- U = U u {u,v}
		- E = E \ {e che appartiene ad E | e è incidente ad u OR è incidente a v}
		- M = M u {{u,v}}
	UNTIL(E=Ø)
	RETURN U
END`

**LEMMA**: alla fine di esecuzione dell'algoritmo approx-cover, $M$ forma un matching (gli archi in $M$ non condividono nessun endpoint)

**DIMOSTRAZIONE**:

- ogni volta che un arco $e$ viene messo in $M$, tutti gli archi incidenti sugli endpoints di $e$ sono rimossi da $E$. Perciò, nessun arco con estremo in comune con $e$ può essere scelto dall'algoritmo.

**TEOREMA**: approx-cover è $2$-approssimante

**DIMOSTRAZIONE**:

- valore della soluzione ritornata dall'algoritmo è:
     - $m = |U| = 2|M|$ 	// i nodi del matching M sono la soluzione U, per ogni arco ci sono 2 nodi ovviamente
- sia $U^*$ il cover ottimo. Dato che gli archi in $M$ non condividono nessun endpoint ($M$ è un matching) e ciascuno di quegli archi deve avere un endpoint in $U^*$ (vertex cover), allora:
	- $m^* = |U^*| \geq |M|$  // la grandezza di U* è almeno quella del matching M
    
perciò:
	$${m \over m^*} \leq {2|M| \over |M|} = 2$$

# TECNICHE ALGORITMICHE: GREEDY

- soluzione determinata in steps
- ad ogni step, effettua la scelta che sembra essere la migliore in quello step, senza pensare alle conseguenze negli step futuri

### Max 0-1 Knapsack:
**INPUT**: insieme finito di oggetti $O$, profitto intero $p_i$ e volume intero $a_i$ per ogni $o_i \in O$, intero positivo $b$

**SOLUZIONE**: insieme di oggetti $Q \subseteq O$ tale che:
	$$\sum_{o_i \in Q} a_i \leq b$$
    
**MISURA**: profitto totale oggetti scelti (stanno in Q):
	$$\sum_{o_i \in Q} p_i$$

- non possiamo considerare solo profitto, perchè oggetti potrebbero non entrare nello zaino
- non possiamo considerare solo volume, perchè profitto oggetti potrebbe essere troppo basso

- consideriamo oggetti in base a profitto per volume: rapporto $$p_i \over a_i$$

- l'algoritmo greedy seleziona gli oggetti in ordine non-crescente secondi il rapporto $p_i \over a_i$

### Algoritmo greedy-knapsack:
`BEGIN

	Q = Ø
	v = 0 	// v = volume corrente knapsack
	- ordina oggetti in ordine non-crescente secondo rapporto (p_i / a_i)
	- siano o_1,...,o_n gli oggetti listati in tale ordine
	FOR i = 1 to n DO:
		IF v + a_i <= b THEN:
			Q = Q u {o_i}
			v = v + a_i
	RETURN Q
END`

**TEOREMA**: per ogni $r < 1$, greedy-knapsack NON E' $r$-approssimante

**DIMOSTRAZIONE**:
- dato intero $k = {1 \over r}$, consideriamo seguente istanza di max 0-1 knapsack:
	- per ogni $n \geq 2$:
		- $b = k * n$
		- $n-1$ oggetti con profitto $p_i = 1$ e volume $a_i = 1$
		- $1$ oggetto con profitto $b-1$ e volume $b$

- soluzione ritornata dall'algoritmo: l'insieme dei primi $n-1$ oggetti, $m = n-1$
- soluzione ottima: l'insieme che contiene solamente l'ennesimo oggetto, $m^* = b-1 = k * n - 1$

- quindi:
	$${m \over m^*} = {(n-1) \over (k * n -1)} \leq {(n-1) \over (n/r - 1)} <^* {(n-1) \over (n/r - 1/r)} = {(n-1) \over (1/r * (n-1))} = r$$
    
(\*: ${1 \over r} > 1$)

(${m \over m^*} < r$ per un problema di MAX (invece di $\geq$))

- greedy-knapsack non ritorna una buona appossimazione perchè ignora l'oggetto con profitto massimo

### Algoritmo modified-greedy:
`BEGIN
	- computa la soluzione greedy-knapsack Q_gr e sia m_gr la sua misura
	- consideriamo l'oggetto o_max che ha il massimo profitto p_max
	- IF (m_gr >= p_max) THEN RETURN Q_gr, ELSE RETURN Q = {o_max}
END`

**LEMMA 1**: Sia $o_j$ il primo oggetto che l'algoritmo greedy-knapsack non mette nello knapsack e sia $m_j = \sum_{i=1}^{j-1} p_i$, allora $m^* \leq m_j + p_j$

**DIMOSTRAZIONE**:

$m^* \leq m_j + p_j$ viene direttamente osservando:
- sia $v$ la somma dei volumi dei primi $j-1$ oggetti scelti
- $m_j + p_j$ è il valore della soluzione ottima quando il volume dello knapsack è $v + a_j > b$

**LEMMA 2**: $m^* \leq m_{gr} + p_{max}$

**DIMOSTRAZIONE**:

- diretta conseguenza del **LEMMA 1**, osservando che $m_j \leq m_{gr}$ e $p_j \leq p_{max}$.
- quindi: $m^* \leq m_j + p_j \leq m_{gr} + p_{max}$

- l'algoritmo modified-greedy ritorna una soluzione di valore $max(m_{gr}, p_{max})$, che è almeno la metà di $m_{gr} + p_{max}$, cioè la metà di un upper bound di $m^*$ (**LEMMA 2**)

**TEOREMA**: modified-greedy è (${1 \over 2}$)-approssimante

**DIMOSTRAZIONE**:

$$m_{Mo} \geq max(m_{gr}, p_{max}) \geq {(m_{gr} + p_{max}) \over 2} \geq {m^* \over 2}$$

### Min multiprocessor scheduling:
**INPUT**: insieme $P$ di $n$ jobs, numeri di processori $h$, running time $t_j$ per ogni $p_j \in P$

**SOLUZIONE**: uno schedule per $P$, cioè una funzione $f:P \rightarrow \{1,\dots,h\}$

**MISURA**: makespan o completion time di $f$, cioe:
	$$\max_{i \in [1,\dots,h]} \sum_{p_j \in P | f(p_j) = i} t_j$$

## Algoritmo greedy di Graham

- Ad ogni passo, assegna un job al processore meno carico

$T_i(j)$ = completion time (somma dei running times dei jobs assegnati) del processore $i$ alla fine dell'istante $j$ (cioè, una volta schedulati i primi $j$ jobs (in qualsiasi ordine))

### Algoritmo greedy di Graham:
`BEGIN
	- siano p_1,...,p_n i jobs listati in qualsiasi ordine
	FOR j = 1 to n DO:
		- assegna p_j al processore i con minimo T_i(j - 1) 	// cioè f(p_j) = i
	RETURN schedule f
END`

- se i jobs sono schedulati in ordine di arrivo: online $\rightarrow$ algoritmo assegna ogni job senza conoscere job futuri

**FATTO**: dato $s \geq 0$ e $h$ numeri $a_1,\dots,a_h$ tale che $a_1 + \dots + a_h = s$, esiste $j$ con $1 \leq j \leq h$, tale che $a_j \geq {s \over h}$ (altrimenti $a_1 + a_2 + \dots + a_h < h \cdot {s \over h} = s$, contraddizione) e analogamente esiste $j'$ con $1 \leq j' \leq h$, tale che $a_{j^{'}} \leq {s \over h}$: un numero è al più la media ed uno è almeno la media

- quindi: $min_j a_j \leq {s \over h}$ e $max_j a_j \geq {s \over h}$

**TEOREMA**: L'algoritmo di Graham è ($2 - {1 \over h}$)-approssimante, con $h$ numero di processori

**DIMOSTRAZIONE**:

- sia $T$, la somma di tutti i running time dei jobs, cioè $\sum_{j=1}^{n} t_j$.
- sia $T^*_1,\dots,T^*_h$ i completion times degli h processori in una soluzione ottima.
- dato che $T^*_1 + \dots + T^*_h = T$, dal precedente **FATTO** sappiamo che $T^*_j \geq T/h$. Quindi $m^* \geq T^*_j \geq T/h$
- sia $k$ un processore con massimo completion time nello schedule $f$ ritornato dall'algoritmo, cioè massimo $T_k(n)$
- sia $p_l$ l'ultimo job assegnato al processore $k$.
- dato che, per la scelta greedy, il processo $p_l$ è stato assegnato al processore meno carico all'inizio dello step l, dal precedente **FATTO** abbiamo che:
	$$T_k(l - 1) \leq {\sum_{j < l} t_j \over h} \leq {T - t_l \over h}$$

- dato che la somma dei running times di tutti i jobs assegnati prima di $p_l$ è al più $T - t_l$:

$$m = T_k(n) \leq T_k(l - 1) + t_l \leq {T - t_l \over h} + t_l \leq {T \over h} + ({(h - 1) \over h}) * t_l \leq^*  m^* + ({(h - 1) \over h}) * m^* = (2 - {1 \over h}) * m^*$$

(\*: perchè ${T \over h} \leq m^*$ e $t_l \leq m^*$)

Quindi:

$${m \over m^*} \leq {(2 - {1 \over h}) * m^* \over m^*} = 2 - {1 \over h}$$

- quando $h$ cresce, il rapporto tende a $2$

**TEOREMA**: L'algoritmo di Graham non è $r$-approssimante per $r < 2 - {1 \over h}$

**DIMOSTRAZIONE**:

- consideriamo seguente istanza:
	- $h * (h - 1)$ jobs con running time $1$
	- $1$ job con running time $h$
- L'algoritmo di Graham assegna i jobs. Avremmo che $m = h + h - 1 = 2h - 1$
- La soluzione ottima è invece assegnare il job più grande ad $1$ processore ed assegnare i restanti jobs ai restanti processori.
La misura della soluzione ottima è quindi $m^* = h$
- Quindi:
	$${m \over m^*} = {2h-1 \over h} = 2 - {1 \over h}$$ 
    
(non è $\leq$ come dovrebbe essere un'approssimazione per un problema di MIN) 

- possiamo migliorare il rapporto di approssimazione

- nella dimostrazione abbiamo fatto uso dei seguenti **lower bounds** ad $m^*$:
    - $m^* \geq T/h$: in ogni soluzione almeno un processore deve avere completion time $T/h$
    - $m^* \geq t_j$, per ogni job $p_j$: in ogni soluzione uno dei processori deve runnare $p_j$ (nel caso in cui prendiamo in considerazione l'ultimo job, $m^* \geq p_l$)

- Quindi:
    - $T/h \leq m^*$
    - $t_l \leq m^*$

- miglioramento:
    - diminuiamo $t_l$ quanto possibile e troviamo un miglior rapporto
- modificando l'algoritmo e/o migliorando l'analisi progressivamente possiamo limitare superiormente $t_l$ con $m^* \over 2$ ($3\over2$ - approssimato), $m^* \over 3$ ($4 \over 3$ - approssimato) e $\epsilon m^*$ (($1+\epsilon$) - approssimato, PTAS)

- primo miglioramento:
    - assegnamo i jobs dai più grandi ai più piccoli:
        - evitiamo così il caso peggiore dell'algoritmo di Graham (il job più lungo arriva per ultimo sbilanciando i carichi dei processori)

### Algoritmo ordered-greedy:
`BEGIN
    - sia p_1,...,p_n i jobs listati in ordine non-crescente rispetto ai loro running times (t_1 >= t_2 >= ... >= t_n)
    FOR j=1 TO n DO:
        - Assegna p_j al processore i con minimo T_i(j - 1)  // cioè: f(p_j)=i
    RETURN schedule f
END`

- questo algoritmo porterà ad un rapporto di approssimazione di circa $3 \over 2$

**LEMMA**: Se $n > h$, allora $t_{h+1} \leq {m^* \over 2 }$

**DIMOSTRAZIONE**:

- dall'ordinamento dei jobs, i primi $h+1$ hanno running time $\geq t_{h+1}$
- quindi $m^* \geq 2t_{h+1}$, dato che in ogni schedule almeno uno degli $h$ processori deve ricevere almeno 2 dei primi $h+1$ jobs

(quindi: $t_{h+1} \leq {m^* \over 2}$)

**TEOREMA**: ordered-greedy è (${3 \over 2} - {1 \over 2h}$) - approssimante

**DIMOSTRAZIONE**:

- sia $k$ uno dei processori più carichi (alla fine).
- se $k$ ha 1 solo job, allora la soluzione ritornata è quella ottima
- altrimenti: consideriamo l'ultimo job $p_l$ assegnato a $k$.
- $l \geq h+1$ e quindi $t_l \leq t_{h+1} \leq {m^* \over 2}$ (dall'ordinamento dei jobs e dal **LEMMA** precedente)
- e quindi:
$$ m \leq {T \over h} + { h - 1 \over h }*t_l \leq m^* + {h - 1 \over h} * {m^* \over 2} = ({3 \over 2} - {1 \over 2h})*m^*$$

(con ${T \over h} \leq m^*$ e $t_l \leq {m^* \over 2}$ (bound migliorato))

### Max cut:
**INPUT**: Grafo $G=(V,E)$

**SOLUZIONE**: partizione di $V$ in 2 sottoinsiemi $V_1$ e $V_2$, tale che: $V_1 \cup V_2 = V$ e $V_1 \cap V_2 = \emptyset$

**MISURA**: cardinalità del cut, cioè il numero di archi con un endpoint in $V_1$ ed un endpoint in $V_2$:
$$ | \{ \{u,v\} | u \in V_1 \land v \in V_2 \} | $$

### Algoritmo greedy-max-cut:

`BEGIN`

    V_1 = V_2 = Ø
    FOR i=1 to n DO:
    
        Δ_i = { {i,j} appartiene E | j < i }  //insieme degli archi {i, j<i}
        U_i = { j | {i,j} appartiene Δ_i }    // insieme dei nodi adiacenti ad i
        
        δ_i = |Δ_i| = |U_i|
        δ_1i = | V_1 intersezione U_i |
        δ_2i = | V_2 intersezione U_i |    // δ_1i + δ_2i = δ_i
        
        IF δ_1i > δ_2i:
            V_2 = V_2 unione {i}
        ELSE
            V_1 = V_1 unione {i}
    
    RETURN V1,V2
`END`

- l'algoritmo ad ogni step inserisce un nuovo nodo in $V_1$ oppure in $V_2$

- greedy: 
    - allo step $i$, il nodo $i$ è inserito in modo da massimizzare il numero di nuovi archi nel cut:
        - cioè inserisce in $V_1$ se il numero di archi che ha verso i nodi già inseriti in $V_2$ è $\geq$ al numero di archi che ha verso i nodi già inseriti in $V_1$, altrimenti inserisce in $V_2$

**TEOREMA**: l'algoritmo greedy-max-cut è ($1 \over 2$) - approssimante

**DIMOSTRAZIONE**:

- dato che il cut può solo contenere un sottinsieme di tutti gli archi in $E$:
$$m^* \leq |E|$$
- dimostreremo che la misura $m$ del cut ritornato dall'algoritmo è almeno la metà di tutti gli archi in $E$:
$$m \geq {|E| \over 2}$$
- questo dimostrerebbe l'affermazione, dato che:
$${m \over m^*} \geq { {|E| \over 2} \over |E| } = {1 \over 2}$$

- dato che gli insiemi $\Delta_i$ determinati dall'algoritmo formano una partizione di $E$ e $\delta_i = |\Delta_i|$, abbiamo che:
$$ \sum_{i=1}^{n} \delta_i = \sum_{i=1}^{n} |\Delta_i| = |E| $$

- inoltre, il numero di archi aggiunti al cut nello step $i$ è: 
$$max(\delta_{1i}, \delta_{2i}) \geq {(\delta_{1i} + \delta_{2i}) \over 2 } = {\delta_i \over 2} $$

- e quindi:

$$ m = \sum_{i=1}^{n} max(\delta_{1i}, \delta_{2i}) \geq \sum_{i=1}^{n} {\delta_i \over 2} = {|E| \over 2} $$

### conclusioni su tecnica greedy:
- buone performance nella pratica
- ma fare la scelta più conveniente ogni singolo step in generale non permette loro di trovare la soluzione ottima

# TECNICHE ALGORITMICHE: LOCAL SEARCH

- definiamo per ogni soluzione feasible $y$ un sottoinsieme di soluzioni feasible vicine chiamato neighborhood($y$)

- iniziando dalla soluzione iniziale, progressivamente switchamo ad una soluzione migliore nel neighborhood corrente, fino a quando è possibile

### Schema di un algoritmo local search:

`BEGIN
    - fissiamo una soluzione iniziale y feasible per input x
    WHILE (esiste y' appartiene neighborhood(y) migliore di y)
        - sia y = y'
    RETURN y
END`

- per definire un algoritmo di local search per un dato problema, dobbiamo definire:
    - la soluzione iniziale
    - il neighborhood delle soluzioni feasible

## Complessità:

- per avere complessità polinomiale nel tempo:
    - la soluzione iniziale deve essere determinata in tempo polinomiale
    - il test del WHILE e la determinazione di una soluzione migliore devono essere fatti in tempo polinomiale
    - il numero delle iterazioni WHILE deve essere polinomiale (ATTENZIONE: il neighborhood può avere taglia esponenziale rispetto alla grandezza dell'input)

## Approssimazione:
- la soluzione ritornata $y$ non ha soluzioni migliori nel suo neighborhood, cioè è un ottimo locale
- per limitare il rapporto di approssimazione bisogna limitare il rapporto tra il valore di un qualsiasi ottimo locale con quello della misura di un ottimo globale (soluzione ottima)

## Utilizziamo local search per risolvere max cut

### Algoritmo local search per max cut:
1. Soluzione iniziale: $V_1 = V$ e $V_2 = \emptyset$
2. Neighborhood: dati $V = \{v_i, \dots , v_n\}, V_1, V_2$, le soluzioni neighbor di $(V_1, V_2)$ sono tutte le coppie $(V_{1i}, V_{2i})$ con $1 \leq i \leq n$ che possono essere ottenute muovendo un nodo $v_i$ da $V_1$ a $V_2$ o viceversa che sono tale che:

- IF $v_i \in V_1$:
    - $V_{1i} = V_1 \backslash \{v_i\}$
    - $V_{2i} = V_2 \cup \{v_i\}$
- ELSE IF $v_i \in V_2$
    - $V_{1i} = V_1 \cup \{v_i\}$
    - $V_{2i} = V_2 \backslash \{v_i\}$

### Complessità:
- soluzione iniziale ottenuta in tempo polinomiale
- test guardia WHILE e determinazione di una migliore soluzione neighbor entrambe in tempo polinomiale:
    - per ciascuna delle $n$ soluzioni neighbor ($n$ iterazioni), controlliamo se la soluzione è migliore ($n^2$ iterazioni) -> $O(n^3)$
- numero di iterazioni WHILE al più $|E| = O(n^2)$, dato che ogni iterazione migliora la soluzione corrente, cioè incrementa di almeno 1 il numero di archi nel cut e ci sono $|E|$ archi nel taglio

- quindi l'algoritmo ha complessità temporale: $O(n^3 \cdot n^2) = O(n^5)$

### Approssimazione:

- proprietà utile per dimostrare il rapporto di approssimazione dell'algoritmo:

**FATTO**: Dato un grafo $G=(V,E)$, sia $\delta_i$ il grado di un generico nodo $v_i \in V$. Allora:
$$ \sum_{i=1}^{n} \delta_i = 2|E| $$

**DIMOSTRAZIONE**:

- vero, dato che ciascun arco viene contato 2 volte nella somma.

**TEOREMA**: l'algoritmo local search è ($1 \over 2$) - approssimante

**DIMOSTRAZIONE**:

- Dimostreremo che ciascun ottimo locale $(V_1, V_2)$ ha misura $m \geq {|E| \over 2}$
- questo implica che ${m \over m^*} \geq { { |E| \over 2 } \over |E| } = {1 \over 2}$, dato che $m^* \leq |E|$

- dato un ottimo locale $(V_1, V_2)$, denotiamo con $h$ il numero di archi interni, cioè con entrambi gli endpoints in $V_1$ oppure in $V_2$. Abbiamo che $m + h = |E|$
- per ogni nodo $v_i \in V$, definiamo i gradi interni ed esterni del nodo come segue:
    - $\delta_i^{int}$ = numero di archi che $v_i$ ha verso i nodi nella sua partizione.
    - $\delta_i^{ext}$ = numero di archi che $v_i$ ha verso i nodi nell'altra partizione.
- dato che la soluzione neighbor $(V_{1i}, V_{2i})$ ha misura non maggiore di quella di $(V_1, V_2)$ (l'ottimo locale), abbiamo quindi: $m - \delta_i^{ext} + \delta_i^{int} \leq m$ e quindi $\delta_i^{int} - \delta_i^{ext} \leq 0$
- sommando su tutti i nodi $v_i$:
$$\sum_{v_i \in V} \delta_i^{int} - \sum_{v_i \in V} \delta_i^{ext} = \sum_{v_i \in V} (\delta_i^{int} - \delta_i^{ext}) \leq 0$$
- dal precedente **FATTO** abbiamo che:
    - $\sum_{v_i \in V} \delta_i^{int} = 2h$
    - $\sum_{v_i \in V} \delta_i^{ext} = 2m$
    
- quindi:
$$ 0 \geq \sum_{v_i \in V} \delta_i^{int} - \sum_{v_i \in V} \delta_i^{ext} = 2h - 2m $$
- cioè:
$$ m \geq h $$
- aggiungendo m ad entrambi i lati e dividendo per 2:
$$ m + m \geq m + h \Rightarrow 2m \geq m + h \Rightarrow m \geq {m+h \over 2} \geq { |E| \over 2 }$$

### conclusioni su local search:
- come gli algoritmo greedy, gli algoritmo local search hanno buone performance nella pratica, ma di solito non hanno prestazioni garantite in termini di tempo o approssimazione.

# TECNICHE ALGORITMICHE: PROGRAMMAZIONE LINEARE

- il problema è formulato come un Integer Linear Program (ILP)
- ILP = linear program + vincoli di interezza
- esiste un algoritmo di tempo polinomiale per risolvere problemi lineari ma risolvere un ILP è un problema NP-hard
- la formulazione come ILP rende possibile utilizzare alcuni metodi che sono in grado di dare buoni algoritmi di approssimazione:
    - Rounding
    - Primale-Duale (soluzione ottima per primale è soluzione ottima per duale)

## PROGRAMMAZIONE LINEARE: ROUNDING

- il problema è formulato come un ILP
- il rilassamento lineare (LP) è ottenuto dall'ILP rilassando i vincoli di interezza, cioè sostituendoli con adatti vincoli lineari
- la soluzione ottenuta (ottima per LP) è arrotondata alla più vicina soluzione intera feasible per ILP
- la misura $m$ della soluzione ottenuta è poi comparata con $m_{LP}^*$ (misura della soluzione ottima di LP), che è il lower bound (per MIN) o upper bound (per MAX) di $m^*$

### Min weighted vertex cover:
**INPUT**: grafo $G=(V,E)$, costo intero $c_j$ associato ad ogni $v_j \in V$

**SOLUZIONE**: $U \subseteq V$, tale che $v_j \in U$ oppure $v_k \in U$ per ogni $\{v_j, v_k\} \in E$

**MISURA**: costo totale di $U$, cioè:
$$\sum_{v_j \in U} c_j$$

## ILP:
$$min \sum_{v_j \in V} c_j \cdot x_j$$ s.t.
$$x_j + x_k \geq 1$$ per ogni $\{v_j, v_k\} \in E$ 
$$x_j \in \{0,1\}$$ per ogni $v_j \in V$, per ogni $j$, con $1 \leq j \leq n$

## LP (rilassamento lineare):
$$min \sum_{v_j \in V} c_j \cdot x_j$$ s.t.
$$x_j + x_k \geq 1$$ per ogni $\{v_j, v_k\} \in E$ 
$$x_j \geq 0$$ per ogni $v_j \in V$

### Algoritmo round-vertex-cover:
`BEGIN
    - determina ILP associato all'istanza di input
    - risolvi il rilassamento lineare LP e sia <x*_1,...,x*_n> la soluzione ottima del LP
    - per ogni v_j, sia x_j = 1, IF x*_j >= 1/2 e
                  sia x_j = 0, IF x*_j < 1/2
    - ritorna il cover U associato a <x_1,...,x_n> cioè tale che U = {v_j appartiene V | x_j = 1}
END`

**TEOREMA**: round-vertex-cover è un algoritmo $2$-approssimante

**DIMOSTRAZIONE**:

- bisogna mostrare che:
    1. $x_1,\cdots, x_n$ è feasible per ILP (soddisfa tutti i vincoli), cioè U è cover
    2. ${m \over m_{LP}^*} \leq 2$ e quindi anche ${m \over m^*} \leq {m \over m_{LP}^*} \leq 2$

- dimostramo ***1***:
    - per la feasibility di $<x_1^*, \cdots, x_n^*>$ per LP, per ogni arco $\{v_j, v_k\} \in E$ abbiamo che $x_j^* + x_k^* \geq 1$, cioè $x_j^* \geq 0.5$ oppure $x_k^* \geq 0.5$, così che $x_j = 1$ oppure $x_k = 1$, e quindi $x_j + x_k \geq 1$ è soddisfatto nel ILP
- dimostriamo ***2***:
    - $$m = \sum_{j=1}^{n} c_j \cdot x_j \leq^* \sum_{j=1}^{n} c_j \cdot 2 \cdot x_j^* = 2 \cdot \sum_{j=1}^{n} c_j \cdot x_j^* = 2 \cdot m_{LP}^*$$
    (\*: per il rounding: $x_j \leq 2 \cdot x_j^*$)
    - cioè: $${m \over m^*} \leq {m \over m_{LP}^*} \leq 2$$

### Min weighted set cover:
**INPUT**: universo $U = \{o_1,\cdots,o_n\}$ di $n$ oggetti, famiglia $\hat{S}=\{S_1,\cdots,S_h\}$ di $h$ sottoinsiemi di $U$, costo intero $c_j$ associato ad ogni $S_j \in \hat{S}$ 

**SOLUZIONE**: cover di $U$, cioè sottofamiglia $\hat{C} \subseteq \hat{S}$ tale che:
$$ \bigcup_{S_j \in \hat{C}} S_j = U $$

**MISURA**: costo totale cover, cioè:
$$ \sum_{S_j \in \hat{C}} c_j $$

- **min wighted set cover**: identificare la più piccola sottocollezione di $S$, la cui unione è uguale all'universo $U$

$f$ = frequenza massima di un oggetto nei sottoinsiemi di $\hat{S}$, ogni oggetto occorre in al più $f$ sottinsiemi

## ILP:
$$min \sum_{j=1}^{h} c_j \cdot x_j$$ s.t.
$$\sum_{S_j | o_i \in S_j} x_j \geq 1$$ per ogni $o_i \in U$ 
$$x_j \in \{0,1\}$$ per ogni $S_j \in \hat{S}$

## LP:
$$min \sum_{j=1}^{h} c_j \cdot x_j$$ s.t.
$$\sum_{S_j | o_i \in S_j} x_j \geq 1$$ per ogni $o_i \in U$ 
$$x_j \geq 0$$ per ogni $S_j \in \hat{S}$

### Algoritmo round-set-cover:
`BEGIN
    - determina ILP associato all'istanza di input
    - risolvi il rilassamento lineare LP dell'ILP e sia <x*_1,...,x*_n> la soluzione ottima del LP
    - per ogni S_j, sia x_j = 1 IF x*_j >= 1/f e
                    sia x_j = 0 IF x*_j < 1/f
    - ritorna il cover risultante, cioè C^ = { S_j appartiene S^ | x_j = 1 }
END`

**TEOREMA**: round-set-cover è $f$-approssimante (per $f \geq 1$)

**DIMOSTRAZIONE**:

- bisogna dimostrare che:
    1. $x_1,\cdots,x_n$ è feasible per ILP
    2. ${m \over m_{LP}^*} \leq f$ e quindi: ${m \over m^*} \leq {m \over m_{LP}^*} \leq f$
- dimostriamo ***1***:
    - dalla feasibility di $<x_1^*,\cdots,x_n^*>$ per LP, per ogni $o_i \in U$ abbiamo che $\sum_{S_j | o_i \in S_j} x_j^* \geq 1$, dato che questa sommatoria ha al più $f$ termini, deve esistere $S_j$ che contiene $o_i$ tale che $x_j^* \geq {1 \over f}$ cioè, tale che, $x_j = 1$, e quindi: $\sum_{S_j | o_i \in S_j} x_j \geq 1$
- dimostriamo ***2***:
    - $$m = \sum_{j=1}^{h} c_j \cdot x_j \leq^* \sum_{j=1}^{h} c_j \cdot f \cdot x_j^* = f \cdot \sum_{j=1}^{h} c_j \cdot x_j^* = f \cdot m_{LP}^*$$
    (\*: dal rounding $x_j \leq f \cdot x_j^*$)
- cioè:
$${m \over m^*} \leq {m \over m_{LP}^*} \leq f$$

# TECNICHE ALGORITMICHE: PROGRAMMAZIONE DINAMICA

- **come paradigma divide et impera**: dividere un problema in piccoli sottoproblemi, risolvere ricorsivamente ciascun sottoproblema e combinare le soluzioni dei sottoproblemi per formare la soluzione al problema originale
- **differentemente dal divide et impera**: i sottoproblemi non sono indipendenti, ma sovrapposti (durante le decomposizioni, gli stessi sottoproblemi occorrono frequentemente)

- **ciascun sottoproblema è risolto solo 1 volta**, riducendo la complessità temporale
- **differentemente dal divide et impera** generalemente si ha un approccio bottom-up invece di top-down, cioè, partendo dai sottoproblemi più piccoli risolviamo progressivamente quelli più grandi, fino al problema iniziale

- il **paradigma divide et impera è basato sulla decomposizione dei problemi in sottoproblemi più piccoli**:
    - ricorsivamente risolvi i sottoproblemi
    - combina le soluzioni dei sottoproblemi per determinare la soluzione al problema iniziale
- se un problema di grandezza $n$ è decomposto in $k$ sottoproblemi, ognuno di grandezza $< n$, allora la complessità temporale può essere espressa dalla ricorrenza:
$$T(n) = T(n_1) + \cdots + T(n_k) + C(n)$$
dove $C(n)$ è il tempo per combinare le k sottosoluzioni

- la ricorrenza può essere risolta con il Teorema Master

- esempio dell'applicazione del divide et impera sono i numeri di Fibonacci:
    - caso base ($n \leq 2$): $F(1) = F(2) = 1$
    - caso induttivo ($n > 2$): $F(n) = F(n-1) + F(n-2)$

### Algoritmo Fibonacci(n):
`BEGIN
    IF (n = 1) OR (n = 2):
        RETURN 1
    ELSE:
        RETURN Fibonacci(n-1) + Fibonacci(n-2)
END`

- Complessità temporale:
    - $T(n) = T(n-1) + T(n-2) + \Theta(1)$, cioè: $T(n) = O(2^n)$
- inefficiente: stessi problemi risolti di nuovo varie volte

- programmazione dinamica: salva la soluzione ad ogni sottoproblema in una tabella, quindi evitiamo di risolverli di nuovo
- F array globale

### Algoritmo Fibonacci2(n):
`BEGIN
    IF (n = 1) OR (n = 2):
        F[n] = 1, RETURN F[n]
    ELSE:
        IF F[n] è stato assegnato:
            RETURN F[n]
        ELSE:
            F[n] = Fibonacci2(n-1) + Fibonacci2(n-2)
            RETURN F[n]
END`

### Algoritmo Fibonacci3(n):
`BEGIN
    F[1] = 1
    F[2] = 1
    FOR i=3 TO n DO:
        F[i] = F[i-1] + F[i-2]
    RETURN F[n]
END`

## Sintetizzando

- in programmazione dinamica:
    - problema iniziale ricorsivamente decomposto in sottoproblemi
    - stessi sottoproblemi occorrono molte volte ma sono risolti 1 sola volta
    - soluzione di un sottoproblema può essere ottenuta combinando quelle dei sottoproblemi più piccoli
    
    - 2 possibili implementazioni:
        - top-down con table annotation (memoization)
        - bottom-up

- top-down:
    - sfrutta table annotation
    - **pros**: risolve solo i sottoproblemi strettamente necessari
    - **cons**: overhead catena chiamate ricorsive
- bottom-up:
    - scelta tipica in programmazione dinamica
    - **pros**: elimina peso ricorsione (in generale questo lo rende più performante)
    - **cons**: risolve anche sottoproblemi non necessari

- divide et impera:
    - tecnica ricorsiva
    - approccio **top-down**
    - conveniente se sottoproblemi sono **indipendenti** (cioè, differenti), altrimenti stessi problemi risolti più volte
- programmazione dinamica:
    - tecnica iterativa
    - approccio **bottom-up**
    - conveniente se sottoproblemi si **sovrappongono** (cioè, coincidono)
    - ciascun sottoproblema risolto solo 1 volta

## Design di algoritmi di programmazione dinamica

1. fornisci decomposizione ricorsiva dei sottoproblemi
2. computa le sottosoluzioni **bottom-up** (partendo dai sottoproblemi più piccoli):
    - usa una tabella per salvare risultati dei sottoproblemi
    - evita computazione delle stesse soluzioni sfruttando tabella
3. combina la soluzioni dei sottoproblemi già risolti per costruire soluzioni per sottoproblemi sempre più grandi, fino a risolvere il problema originale

## Complessità degli algoritmi di programmazione dinamica

- (**grandezza tabella**) x (**tempo combinazione sottosoluzioni** = sempre polinomiale) 
- quindi: **polinomiale**, se la tabella ha grandezza **polinomiale** (solo se ci sono un numero polinomiale di sottoproblemi differenti)

### Max 0-1 Knapsack (recall):
**INPUT**: insieme finito di oggetti $O$, profitto intero $p_i$ e peso intero $w_i$ per ogni $o_i \in O$, intero positivo $b$

**SOLUZIONE**: insieme di oggetti $Q \subseteq O$ tale che:
	$$\sum_{o_i \in Q} w_i \leq b$$
    
**MISURA**: profitto totale oggetti scelti (stanno in Q):
	$$\sum_{o_i \in Q} p_i$$

## Algoritmo brute force

- semplice algoritmo:
    - enumera tutti i possibili $2^n$ sottoinsiemi di $n$ elementi
    - scegli la migliore combinazione (miglior profitto con vincolo di peso soddisfatto)
- algoritmo di programmazione dinamica generalmente esegue molto meglio

## Design dell'algoritmo (di programmazione dinamica)

- $OPT(i,w)$ = sottinsieme di massimo profitto di oggetti $1,\cdots,i$ con limite ($\leq$) di peso $w$

- $OPT(n,b)$ = soluzione ottima per problema iniziale

- ci sono 2 alternative per OPT (mutualmente esclusive):
    - OPT non seleziona oggetto $i$:
        - seleziona meglio di $\{1,\cdots,i-1\}$ usando limite peso $w$
    - OPT seleziona oggetto $i$:
        - seleziona meglio di $\{1,\cdots,i-1\}$ usando limite peso $w - w_i$

- $OPT(k,w)$ = soluzione ottima per elementi $\{o_1,\cdots,o_k\}$

- la soluzione ottima $OPT(k+1,w)$ potrebbe non corrispondere a $OPT(k,w)$, anche perchè $OPT(k+1,w)$ potrebbe non essere un superset di $OPT(k,w)$

## Definizione ricorsiva per OPT

- $OPT(i,w)$:
    - $\emptyset$ IF $i = 0$
    - $OPT(i-1,w)$ IF $w_i > w$
    - il meglio tra $OPT(i-1,w)$ e $OPT(i-1,w-w_i) \cup \{o_i\}$ ELSE

- misura $m(i,w)$ della soluzione ottima $OPT(i,w)$:
    - $0$ IF $i = 0$
    - $m(i-1,w)$ IF $w_i > w$
    - $max\{m(i-1,w),m(i-1,w-w_i)+p_i\}$ ELSE

- $m^* = m(n,b)$

- come risultato, il miglior sottoinsieme di $k$ oggetti con vincolo su peso $w$ è:
    - il miglior sottoinsieme di $k-1$ oggetti con peso totale $w$
    - il miglior sottoinsieme di $k-1$ oggetti con peso totale $w-w_k$ ($w+$ contributo (cioè, peso) del $k$-esimo oggetto)

- quindi, per quanto riguarda la formula ricorsiva $OPT(i,w)$:
    - il $k$-esimo oggetto non può essere parte della soluzione (dato che il suo peso è così grande che l'oggetto stesso non entra nello knapsack) [caso 2]
    - [caso 3] altrimenti, scegliamo la migliore soluzione tra:
        - la soluzione che include il nuovo oggetto
        - la soluzione migliore che non include il nuovo oggetto

### Algoritmo progr-dyn-knapsack:
`BEGIN
    FOR w=0 TO b DO:
        M[0,w] = 0
    FOR i=1 TO n DO:
        FOR w=0 to b DO:
            IF(w_i > w):
                M[i,w] = M[i-1,w]
            ELSE:
                M[i,w] = max{ M[i-1,w], M[i-1,w-w_i] + p_i }
    RETURN M[n,b]
END`

### Algoritmo nella pratica (esecuzione dell'esercizio di esempio):
#### Inizializzazione (passo 0):
`FOR w=0 TO W DO:
    B[0,w] = 0
FOR i=1 TO n DO:
    B[i,0] = 0`

#### Iterazione (ad ogni passo):
`IF w_i <= w:
    IF v_i + B[i-1,w-w_i] > B[i-1,w]:
        B[i,w] = v_i + B[i-1,w-w_i]
    ELSE:
        B[i,w] = B[i-1,w]
ELSE:
    B[i,w] = B[i-1,w]`

- l'algoritmo trova massimo profitto che può essere inserito nello knapsack, tale valore è memorizzato in $B[n,w]$

- per scoprire gli oggetti che sono stati inseriti nella soluzione ottima (trovare gli elementi della soluzione ottima):

`BEGIN
    i = n
    k = w
    WHILE i,k > 0:
        IF B[i,k] != B[i-1,k]:
            - marca oggetto i come nello zaino
            - k = k - w_i
            - i = i - 1
        ELSE:
            - i = i - 1
END`

## Complessità temporale

**TEOREMA**: la complessità temporale di progr-dyn-knapsack è $O(n \cdot b)$

**DIMOSTRAZIONE**:

- l'algoritmo impiega $O(1)$ per accedere a ciascuna entry della tabella
- ci sono $O(n \cdot b)$ entries nella tabella
- dopo aver computato i valori, possiamo risalire per trovare la soluzione ottima:
    - prendiamo item $o_i$ in $OPT(i,w)$ se $M[i-1,w] < M[i,w]$

- l'algoritmo è polinomiale ?
- per essere polinomiale, la complessità deve essere polinomiale nel logaritmo di valori codificati nell'istanza di input (cioè rispetto a $log(b)$). Questa complessità è chiamata PSEUDO-POLINOMIALE, cioè polinomiale nella dimensione dell'input **e nei valori** dell'input (non solo nella dimensione dell'input)

## Approccio duale

- $OPT(i,p)$ = sottoinsieme di peso minimo degli oggetti $1,\cdots,i$ con profitto almeno ($\geq$) $p$

- ci sono 2 alternative per $OPT(i,p)$:
    - OPT non seleziona oggetto $i$:
        - OPT seleziona il meglio di $\{1,\cdots,i-1\}$ usando il limite sul profitto $p$
    - OPT seleziona oggetto $i$:
        - OPT seleziona il meglio di $\{1,\cdots,i-1\}$ usando il limite sul profitto $p - p_i$

## Definizione ricorsiva per OPT

- $OPT(i,p)$:
    - UNDEF IF $i = 0$
    - migliore scelta tra $OPT(i-1,p)$ e $\{o_i\}$ IF $p_i \geq p$
    - migliore scelta tra $OPT(i-1,p)$ e $OPT(i-1,p-p_i) \cup \{o_i\}$ ELSE (UNDEF se entrambi UNDEF)

- in termini di peso $v(i,p)$ della soluzione ottima $OPT(i,p)$:
    - $v(i,p)$:
        - $\infty$ IF $i = 0$
        - $min\{v(i-1,p),w_i\}$ IF $p_i \geq p$
        - $min\{v(i-1,p),v(i-1,p-p_i)+w_i\}$ ELSE

### Algoritmo progr-dyn-knapsack-dual:
`BEGIN
    FOR p=1 TO P DO:
        V[0,p] = infinity
    FOR i=1 TO n DO:
        FOR p=1 to P DO:
            IF(p_i >= p):
                V[i,p] = min{V[i-1,p],w_i}
            ELSE:
                V[i,p] = min{V[i-1,p], V[i-1,p-p_i]+w_i}
    RETURN max p tale che V[n,p] <= b
END`

- come scegliere P ?
- abbastanza grande da includere l'ottimo (cioè ogni upper bound ad $m^*$), cioè $P \geq m^*$

- $P = n \cdot p_{max} \geq \sum_{i=1}^{n} p_i \geq m^*$ ($p_{max} = max \{p_j\}$)

## Complessità temporale

**TEOREMA**: la complessità di progr-dyn-knapsack-dual è $O(n^2 \cdot p_{max})$

**DIMOSTRAZIONE**:

- l'algoritmo impiega $O(1)$ per accedere a ciascuna entry della tabella
- ci sono $O(n \cdot P) = O(n^2 \cdot p_{max})$ entries nella tabella
- dopo aver computato i valori, possiamo risalire per trovare la soluzione ottima: prendi item $o_i$ in $OPT(i,p)$ IF $V[i-1,p] > V[i,p]$

# POLYNOMIAL TIME APPROXIMATION SCHEMES (PTAS)

- un algoritmo $A$ per un problema di ottimizzazione $\pi \in NPO$ è un PTAS per $\pi$ se, data un'istanza di input $x \in I$ e un numero razionale $\epsilon > 0$, ritorna una soluzione $(1+\epsilon)$-approssimata (Per MIN) o una soluzione $(1-\epsilon)$-approssimata (per MAX) in tempo polinomiale rispetto alla taglia dell'istanza $x$

- la complessità può essere esponenziale in $1 \over \epsilon$

- la complessità di un PTAS può crescere drasticamente quando $\epsilon$ descresce
- es. $O(n^{1 \over \epsilon})$

- per ogni valore fissato di $\epsilon$, un PTAS corrisponde ad un algoritmo di tempo polinomiale $(1+\epsilon)$-approssimato

### Min multiprocessor scheduling: (recall)
**INPUT**: insieme $P$ di $n$ jobs, numeri di processori $h$, running time $t_j$ per ogni $p_j \in P$

**SOLUZIONE**: uno schedule per $P$, cioè una funzione $f:P \rightarrow \{1,\dots,h\}$

**MISURA**: makespan o completion time di $f$, cioe:
	$$\max_{i \in [1,\dots,h]} \sum_{p_j \in P | f(p_j) = i} t_j$$

### Recap dell'algoritmo Greedy di Graham

- **scelta greedy**: ad ogni step, assegna un job ad uno dei processori meno carichi correntemente

- abbiamo fatto uso dei seguenti **lower bounds** ad $m^*$:
    - $m^* \geq {T \over h}$: in ogni soluzione almeno $1$ processore deve avere completion time $T \over h$
    - $m^* \geq t_j$ per ogni job $p_j$: in ogni soluzione $1$ dei processori deve runnare $p_j$

- per limitare superiormente **(upper bound)** il valore della soluzione ritornata, abbiamo utilizzato $p_l$, cioè l'ultimo job assegnato a $k$, uno dei processori più carichi, e abbiamo derivato le disuguaglianze

- abbiamo progressivamente migliorato la complessità:
    - decrementando $t_l$ fino a quando è possibile troviamo un rapporto migliore sfruttando le disuguaglianze
    - modificando l'algoritmo e migliorando l'analisi abbiamo limitato superiormente **(upper bound)** $t_l$ con ${m^* \over 2}$ ($3 \over 2$-approssimante)
    - ora, settiamo $t_l$ arbitrariamente piccolo, cioè $\epsilon \cdot m^*$, per produrre un algoritmo $(1+\epsilon)$-approssimante, cioè un PTAS

**LEMMA**: se $t_1,\cdots,t_n$ sono ordinati in modo non-crescente, allora per ogni $i$, $1 \leq i \leq n$: $t_i \leq {T \over i}$

**DIMOSTRAZIONE**: 

- assumiamo per contraddizione che non sia così: $t_i > {T \over i}$, allora:
$$t_1 + \cdots + t_i \geq i \cdot t_i > i \cdot {T \over i} = T$$
una contraddizione, dato che $T = \sum_{i=1}^{n} t_i$

## PTAS: idea sottostante

- computiamo la soluzione ottima per i primi $q$ jobs
- completiamo assegnando in modo greedy i restanti jobs
- se possiamo ottenere $t_l \leq \epsilon \cdot m^*$, allora:
$$m \leq {T \over h} + ({h-1 \over h})*t_l < {T \over h} + t_l \leq m^* + \epsilon \cdot m^* = (1+\epsilon) \cdot m^*$$
- usando il **LEMMA** precedente, è sufficiente impostare $q$ in modo giusto, dato che $l > q$
- questo vale per: $q = \lceil {h \over \epsilon} \rceil$, infatti le disuguaglianze:
$$t_l \leq {T \over l} \leq {T \over q+1} \leq \epsilon \cdot {T \over h} \leq \epsilon \cdot m^*$$
sono vere se $q \geq {h \over \epsilon} - 1$

### Algoritmo PTAS-scheduling:
`BEGIN
    - ordina i jobs in modo non-crescente rispetto ai running time t_i e sia p_1,...,p_n la sequenza risultante (t_1>=...>=t_n)
    - computa uno schedule ottimo f per i primi q = parte_intera_sup(h/epsilon) jobs
    FOR j=q+1 TO n DO:
        - assegna p_j al processore i con minimo T_i(j-1)  // cioè f(p_j) = i
    RETURN schedule f
END`

**TEOREMA**: PTAS-scheduling ritorna sempre una soluzione $(1+\epsilon)$-approssimata

**DIMOSTRAZIONE**:

- sia $t \leq m^*$ il completion time per la soluzione ottima per i primi $q$ jobs
- se $m \leq t$: la fase greedy non ha incrementato il completion time, allora l'algoritmo ritorna una soluzione ottima
- se $m > t$: denotiamo con $k$ il processore più carico alla fine dell'algoritmo e con $p_l$ l'ultimo job assegnato a $k$, allora:
$$ m = T_k(n) = T_k(l-1) + t_l \leq {T - t_l \over h} + t_l = {T \over h} + ({h-1 \over h})*t_l < {T \over h} + t_l \leq m^* + \epsilon \cdot m^* = (1+\epsilon) \cdot m^*$$
cioè:
$$ {m \over m^*} \leq 1+\epsilon $$

- l'algoritmo soddisfa il requisito di approssimazione di PTAS
- ma vediamo se è un PTAS

## Complessità

- ordinamento iniziale: $O(n \cdot log(n))$
- ricerca esaustiva di una soluzione ottima per i primi $q$ jobs: $O(h^{h \over \epsilon})$, dato che ci sono al più $h^q = h^{h \over \epsilon}$ soluzioni possibili ($h$ possibili scelte per ognuno dei $q$ jobs)
- il FOR esegue al più $n$ iterazioni, ciascuna richiede $O(h)$: $O(n \cdot h)$

- complessità totale = $O(n \cdot log(n) + h^{h \over \epsilon} + n \cdot h)$
- questa complessità è esponenziale in $h$, e quindi esponenziale nella dimensione dell'input
- NON abbiamo un PTAS, a meno che non fissiamo che $h$ debba essere una costante
- fissare $h$ costante è equivalente a dire che $h$ non dipende dall'input
- praticamente corrisponde a considerare questo nuovo problema:

### Min $h$-processor scheduling:
**INPUT**: insieme $P$ di $n$ jobs, running time $t_j$ per ogni $p_j \in P$

**SOLUZIONE**: uno schedule per $P$, cioè una funzione $f:P \rightarrow \{1,\dots,h\}$

**MISURA**: makespan o completion time di $f$, cioe:
	$$\max_{i \in [1,\dots,h]} \sum_{p_j \in P | f(p_j) = i} t_j$$

**TEOREMA**: PTAS-scheduling è un PTAS per Min $h$-processor scheduling

**DIMOSTRAZIONE**: 

- l'algoritmo ha complessità $O(n \cdot log(n) + h^{h \over \epsilon} + n \cdot h)$
- questa complessità è polinomiale nella grandezza di input ed esponenziale in $1 \over \epsilon$
- l'approssimazione è $1+\epsilon$

- Min $h$-processor scheduling con $h = 2$ è il Min partition problem, che ammette un PTAS

### Min partition:
**INPUT**: insieme $X$ di oggetti, un peso intero positivo $a_i$ per ogni $o_i \in X$

**SOLUZIONE**: una partizione di $X$ in 2 sottoinsiemi $X_1$ e $X_2$ tali che $X_1 \cap X_2 = \emptyset$ e $X_1 \cup X_2 = X$

**MISURA**: $$max\{ \sum_{o_i \in X_1} a_i , \sum_{o_i \in X_2} a_i \}$$

- gli oggetti corrispondono ai jobs, i pesi ai running times, i 2 sottoinsiemi sono i 2 processori

- è possibile estendere il risultato per ottenere un PTAS per Min multiprocessor scheduling (cioè, con $h$ NON costante)

- ricordiamo precedente dimostrazione di approssimazione per PTAS:
    - denotiamo con $t$ il completion time dello schedule ottimo ottenuto per i primi $q$ jobs, ci sono 2 casi:
        - $m \leq t$: la soluzione ritornata dall'algoritmo non ha incrementato $t$ $\rightarrow$ l'algoritmo ritorna la soluzione ottima
        - $m > t$: c'è stato un incremento
    - la dimostrazione di approssimazione continua ad essere valida se, invece di determinare l'ottimo per i primi $q$ jobs, determiniamo per loro una soluzione approssimata, cioè tale che $t \leq (1+\epsilon) \cdot m^*$
    

**LEMMA**: C'è un algoritmo di programmazione dinamica che determina in tempo polinomiale uno scheduling per i primi $q$ jobs, scheduling con completion time $t \leq (1+\epsilon) \cdot m^*$

**TEOREMA**: esiste un PTAS per Min multiprocessor scheduling

# FULLY POLYNOMIAL TIME APPROXIMATION SCHEMES (FPTAS)

- un algoritmo $A$ per un problema di ottimizzazione $\pi \in NPO$ è un FPTAS per $\pi$ se, data un'istanza di input $x \in I$ e un numero razionale $\epsilon > 0$, ritorna una soluzione $(1+\epsilon)$-approssimata (per MIN) o una soluzione $(1-\epsilon)$-approssimata (per MAX) in tempo polinomiale rispetto alla taglia dell'istanza $x$ e rispetto a $1 \over \epsilon$

- FPTAS mantiene una buona complessità quando $\epsilon$ decresce

## FPTAS-knapsack

- progr-dyn-knapsack-dual ha complessità pseudo-polinomiale: $O(n^2 \cdot p_{max})$, dove $p_{max} = max \{p_j\}$ è il profitto massimo di un oggetto

- cerchiamo di scalare i profitti originali ricavando profitti più piccoli in modo da ridurre la complessità ed ottenere un'approssimazione ancora migliore

1. approssimiamo i profitti a multipli di $k$ per $k > 0$:
$$ p'_i = \lfloor {p_i \over k} \rfloor \cdot k $$

2. se $k$ è sufficientemente piccolo, profitti nuovi $p'_i$ approssimano bene profitti originali $p_i$, quindi soluzione ottima per i nuovi profitti approssima bene soluzione ottima per profitti originali

3. scalando tutti i profitti $p'_i$ dividendo loro per $k$ otteniamo un'istanza equivalente con profitti più piccoli:
$$ p'_i = { \lfloor {p_i \over k} \rfloor \cdot k \over k } = \lfloor {p_i \over k} \rfloor $$

4. progr-dyn-knapsack-dual applicato a questa istanza porta ad una complessità più piccola

- complessità: $O(n^2 \cdot p'_{max}) = O(n^2 \cdot {p_{max} \over k})$

- approssimazione: errore al più $k$ per ogni oggetto scelto $\rightarrow$ $n \cdot k$ in totale
- perciò: $m \geq m^* - n \cdot k$

- Idea: scegliamo $k$ sufficientemente grande per portare ad una complessità polinomiale e sufficientemente piccolo per fornire una buona approssimazione:
$$ k = \lfloor { \epsilon \cdot p_{max} \over n } \rfloor $$

### Algoritmo FPTAS-knapsack:
`BEGIN
    - k = parte_intera_inf((epsilon*p_max) / n)
    - trova soluzione ottima per istanza con profitti scalati p'_i = parte_intera_inf(p_i / k) usando progr-dyn-knapsack-dual e 
    - sia S insieme di oggetti ritornati
    RETURN S
END`

## Complessità

$$O(n^2 \cdot p'_{max}) = O(n^2 \cdot {p_{max} \over k }) = O(n^2 \cdot {p_{max} \over {\epsilon \cdot p_{max} \over n}}) = O({n^3 \over \epsilon})$$

## Approssimazione o errore

$$ {m \over m^*} \geq {m^* - n \cdot k \over m^*} = 1 - {n \cdot k \over m^*} \geq^* 1 - {n \cdot k \over p_{max}} \geq 1 - { n \cdot ({\epsilon \cdot p_{max} \over n}) \over p_{max} } = 1 - \epsilon$$

(\*: $m^* \geq p_{max}$)

- perciò:

$$ {m \over m^*} \geq 1 - \epsilon $$

- non abbiamo scalato i pesi, perchè non è garantito che tornando ai pesi originali la soluzione rimanga feasible (potrebbe eccedere peso $b$)

**LEMMA**: $m \geq m^* - n \cdot k$

**DIMOSTRAZIONE**: 

- sia $S = \{o_{j1},\cdots,o_{jh}\}$ e $S^* = \{o_{i1}, \cdots, o_{il}\}$ una soluzione ottima, allora:
$ m = p_{j1} + \cdots + p_{jh} $ e $m^* = p_{i1} + \cdots + p_{il}$

- assumiamo per contraddizione che $m < m^* - n \cdot k$, allora:

$$ \lfloor {p_{i1} \over k} \rfloor + \cdots + \lfloor {p_{il} \over k} \rfloor \geq ({p_{i1} \over k}-1) + \cdots + ({p_{il} \over k} - 1) \geq {p_{i1} + \cdots + p_{il} \over k} - l \geq {p_{i1} + \cdots + p_{il} \over k} - n =$$ 
$$= {m^* \over k} -n >^* {m + n \cdot k \over k} - n = {m \over k} = {p_{j1} + \cdots + p_{jh} \over k} \geq \lfloor {p_{j1} \over k} \rfloor + \cdots + \lfloor {p_{jh} \over k} \rfloor$$

(\*: dall'ipotesi: $m < m^* - n \cdot k$)

- ma questa è una contraddizione: $S^*$ sarebbe una soluzione STRETTAMENTE MIGLIORE di $S$ per l'istanza con profitti scalati, ma questo contraddice l'ottimalità di progr-dyn-knapsack-dual per l'istanza con profitti scalati

**TEOREMA**: FPTAS-knapsack è un FPTAS per Max 0-1 knapsack

**DIMOSTRAZIONE**: 

- complessità: $$ O({n^2 \cdot p_{max} \over k }) = O({n^2 \cdot p_{max} \over {\epsilon \cdot p_{max} \over n}}) = O({n^3 \over \epsilon}) $$

- approssimazione: $$ {m \over m^*} \geq^* {m^* - n \cdot k \over m^*} = 1 - {n \cdot k \over m^*} \geq^{**} 1 - {n \cdot k \over p_{max}} \geq 1 - {n \cdot ({\epsilon \cdot p_{max} \over n }) \over p_{max}} = 1 - \epsilon $$

(\*: da precedente **LEMMA**)

(\*\*: $m^* \geq p_{max} $)

- $p_{max}$ è un lower bound ed $n \cdot p_{max}$ è un upper bound per $m^*$, cioè: $p_{max} \leq m^* \leq n \cdot p_{max}$
- ma $p_{max}$ può essere molto più basso e $n \cdot p_{max}$ molto più grande di $m^*$

## come migliorare i bounds per $m^*$ ?

- utilizziamo l'algoritmo $({1 \over 2})$-approssimato modified-greedy
- sia $m_{mg}$ la misura della sua soluzione ritornata
- dato che abbiamo che ${m \over m^*} \geq {1 \over 2}$ (approssimazione modified-greedy) e dato che $m_{mg} \leq m^*$:
$$ m_{mg} \leq m^* \leq 2 \cdot m_{mg}$$
- quindi, ora consideriamo $P' = \lceil {2 \cdot m_{mg} \over k} \rceil$ come profitto massimo in progr-dyn-knapsack-dual
- settiamo parametro: $k = \lfloor { \epsilon \cdot m_{mg} \over n } \rfloor$
- eseguiamo progr-dyn-knapsack-dual modificato sull'istanza con i profitti scalati $p'_i = \lfloor {p_i \over k} \rfloor$

## Complessità
$$ O({n \cdot m_{mg} \over k}) = O({n \cdot m_{mg} \over {\epsilon \cdot m_{mg} \over n}}) = O({n^2 \over \epsilon})$$

## Approssimazione

$$ {m \over m^*} \geq 1 - {n \cdot k \over m^*} \geq^* 1 - {n \cdot k \over m_{mg}} \geq 1 - { n \cdot ({\epsilon \cdot m_{mg} \over n}) \over m_{mg} } = 1 - \epsilon$$

(\*: $m_{mg} \leq m^*$)

### New FPTAS-knapsack:
`BEGIN
    - computa m_mg eseguendo l'algoritmo modified-greedy e sia k = parte_intera_inf((epsilon*m_mg) / n)
    - trova soluzione ottima per istanza con profitti scalati p'_i = parte_intera_inf(p_i / k) usando progr-dyn-knapsack-dual modificato* e
    - sia S l'insieme di oggetti ritornato
    RETURN S
END`

\*: progr-dyn-knapsack-dual con P' = parte_intera_sup(2\*m_mg / k)

# APPROCCI ALTERNATIVI

- fino ad ora abbiamo considerato **approcci con performance garantite**:
    - pro:
        - approssimazione garantita per ogni input
        - running time garantito per ogni input
        - caso peggiore preso in considerazione
    - contro:
        - molti problemi non ammettono algoritmi con performance garantite o non sono ancora conosciuti
        - a volte cattivo comportamente nella pratica

#### ci sono approcci alternativi:

- **restrizione sull'insieme delle istanze di input**:
    - performance garantite solo su un sottoinsieme dell'input di interesse
    - pro:
        - permette di applicare l'approccio performance garantite su tale sottoinsieme
    - contro:
        - performance garantite solo su tale sottoinsieme

- **analisi probabilistica o media**:
    - in generale, assumiamo distribuzione di probabilità delle istanze, essa valuta prestazioni medie o attese
    - pro:
        - può rilevare buon comportamento pratico di algoritmo
        - metodo analitico basato su dimostrazioni matematiche
    - contro:
        - non ha performance garantite
        - analisi spesso complessa
        - distribuzione delle istanze di input spesso sconosciuta

- **euristiche**:
    - algoritmi con un buon comportamento pratico ma con performance non dimostrabili
    - pro:
        - buon comportamento pratico
    - contro:
        - performance non dimostrabili

- **algoritmi randomizzati**

## Algoritmi randomizzati

- fanno scelte randomiche durante la loro esecuzione
- soluzioni ritornate differenti per esecuzioni differenti sulla stessa istanza di input

- è dimostrato che, fissata qualsiasi istanza, il valore atteso delle performance è buono $\rightarrow$ performance è buona con alta probabilità

- pro: 
    - semplici e veloci
- contro: 
    - incertezza del risultato per ogni istanza fissata
    - scelte realmente randomiche sono impossibili (si possono però simulare)

- $m$ $\rightarrow$ variabile random
- $E(m)$ $\rightarrow$ valore atteso di $m$ computato secondo le scelte randomiche dell'algoritmo

- Un algoritmo randomizzato $A$ è $r$-approssimante SE:
    - ${E(m) \over{m^*}} \leq r$ (MIN)
    - ${E(m) \over{m^*}} \geq r$ (MAX)

### Max weighted cut:
**INPUT**: grafo $G=(V,E)$, con peso non-negativo $w_{ij}$ per ogni arco $\{v_i, v_j\} \in E$

**SOLUZIONE**: partizione di $V$ in $2$ sottoinsiemi $V_1$ e $V_2$ tali che: $V_1 \cap V_2 = \emptyset$ e $V_1 \cup V_2 = V$

**MISURA**: peso del cut, cioè:
$$\sum_{\{v_i, v_j\} \in E | v_i \in V_1 \wedge v_j \in V_2} w_{ij} $$

### Algoritmo random-cut:
`BEGIN

    V_1 = Ø
    V_2 = Ø
    FOR i=1 TO n:
        - metti v_i in V_1 con probabilità 1/2 indipendentemente dagli altri nodi, altrimenti in V_2
    RETURN V_1 e V_2
END`

- L'algoritmo è polinomiale

**TEOREMA**: random-cut è un algoritmo $1 \over 2$ - approssimato

**DIMOSTRAZIONE**: 

- Sia $x_{ij}$ la variabile randomica "L'arco $\{v_i, v_j\}$ è nel cut"
- Allora: $$ m = \sum_{\{v_i, v_j\} \in E} w_{ij} \cdot x_{ij}$$
- Quindi: $$ E(m) = E(\sum_{\{v_i, v_j\} \in E} w_{ij} \cdot x_{ij}) = \sum_{\{v_i, v_j\} \in E} w_{ij} \cdot E(x_{ij}) = \sum_{\{v_i, v_j\} \in E} w_{ij} \cdot P(x_{ij} = 1) =$$
$$= \sum_{\{v_i, v_j\} \in E} w_{ij} \cdot P(( v_i \in V_1 \wedge v_j \in V_2 )\vee(V_i \in V_2 \wedge v_j \in V_1)) = \sum_{\{v_i, v_j\} \in E} w_{ij} \cdot ({1 \over 2} \cdot {1 \over 2} + {1 \over 2} \cdot {1 \over 2}) = {1 \over 2} \cdot \sum_{\{v_i, v_j\} \in E} w_{ij} \geq {m^* \over 2} $$
- Perciò: $${E(m) \over m^*} \geq {1 \over 2}$$

### Min weighted set cover: (recall)
**INPUT**: universo $U = \{o_1,\cdots,o_n\}$ di $n$ oggetti, famiglia $\hat{S}=\{S_1,\cdots,S_h\}$ di $h$ sottoinsiemi di $U$, costo intero $c_j$ associato ad ogni $S_j \in \hat{S}$ 

**SOLUZIONE**: cover di $U$, cioè sottofamiglia $\hat{C} \subseteq \hat{S}$ tale che:
$$ \bigcup_{S_j \in \hat{C}} S_j = U $$

**MISURA**: costo totale cover, cioè:
$$ \sum_{S_j \in \hat{C}} c_j $$

- **min wighted set cover**: identificare la più piccola sottocollezione di $S$, la cui unione è uguale all'universo $U$

$f$ = frequenza massima di un oggetto nei sottoinsiemi di $\hat{S}$, ogni oggetto occorre in al più $f$ sottinsiemi

### Algoritmo Greedy per Min weighted set cover

- nella scelta dei sottoinsiemi da inserire nel cover: 
    - non possiamo prendere in considerazione solo i costi (perchè potremmo coprire troppo pochi elementi di $U$) 
    - non possiamo prendere in considerazione solo il numero di oggetti coperti (perchè potremmo incorrere in un costo eccessivo)

- **scelta greedy**: ad ogni step scegliamo il sottoinsieme che ha costo minimo per nuovi oggetti coperti

### Scelta Greedy

- Ad un dato step $j$ nel quale in ordine l'algoritmo ha selezionato $j - 1$ sottoinsiemi $S_1,\dots,S_{j-1}$, l'efficacia di un non scelto ancora sottoinsieme $S_k$ è definita come:
$$ eff(S_k) = {{c_k} \over { |S_k \cap \overline{C_{j-1}}| }} $$ dove:
- $c_k$ = costo di $S_k$
- $C_{j-1}$ = $(S_1 \cup \dots \cup S_{j-1})$
- $\overline{C_{j-1}} = U \backslash C_{j-1}$ (insieme di elementi che mancano nella soluzione)
- (denominatore di $eff(S_k)$ = insieme di elementi che sto per inserire nella soluzione: numero di nuovi oggetti coperti)

- Allo step $j$ scegliamo un sottoinsieme $S_j$ di efficacia minima, cioè, tale che:
$eff(S_j) = min\{eff(S_k) | S_k$ non è stato ancora scelto $\}$ (cioè, con $c_k$ piccolo e denominatore grande)

### Algoritmo greedy-min-weighted-set-cover:
`BEGIN

    C = Ø
    cap(C) = Ø
    j = 1
    WHILE C != U:
        - Sia S_j un sottoinsieme di efficacia minima (S_j = min{eff(S_k) | S_k non scelto})
        - metti S_j in cap(C)
        - per ogni oggetto o_i in (S_j intersezione C barrato)*, sia price(o_i) = eff(S_j)
        - C = C unione S_j
        - j = j + 1
    RETURN cap(C)
END`

\*: elementi o_i che sono in S_j e NON sono in C; cioè, elementi appena scelti che non sono mai stati scelti prima: gli elementi che sto per andare a coprire

**LEMMA**: $$m = \sum_{S_j \in \hat{C}} c_j = \sum_{i=1}^{n} price(o_i)$$

**DIMOSTRAZIONE**:

- banale: la somma dei prezzi degli oggetti coperti nello step $j$ è $c_j$.

(nello step $j$ abbiamo scelto l'insieme $S_j$ di efficacia minima, la somma dei $price(o_i)$ degli oggetti contenuti in $S_j$ è in totale $c_j$, dato che per definizione $price(o_i) =$ costo totale dell'insieme scelto diviso numero di oggetti che vado a coprire con l'insieme scelto: costo totale dell'insieme scelto è diviso tra gli oggetti scelti, sommando i costi dei singoli oggetti torniamo a $c_j$)

- in altre parole, il costo totale è diviso tra gli oggetti coperti.

**LEMMA**: 

Per ogni $j$, data qualsiasi scelta di sottoinsiemi $S_{j}^{'}, \cdots, S_{t}^{'}$ che formano un cover con i sottoinsiemi $S_{1}, \cdots, S_{j-1}$ scelti dall'algoritmo greedy all'inizio dello step $j$, per ogni oggetto $o_i$ non ancora coperto all'inizio dello step $j$, $price'(o_i) \geq eff(S_j)$. 

Dove $S_j$ è il sottoinsieme scelto dall'algoritmo greedy allo step $j$, $eff(S_j)$ la sua efficacia, $price'(o_i)$ è l'efficacia del sottoinsieme $S_{l}^{'}$ che copre $o_i$ assumento che, partendo dallo step $j$, la scelta greedy è fatta solo tra i sottoinsiemi $S_{j}^{'}, \cdots, S_{t}^{'}$

**DIMOSTRAZIONE**: 

- è sufficiente osservare che $eff(S_j)$ è il prezzo di copertura **minimo** per oggetto allo step $j$ e che, l'efficacia di un sottoinsieme non ancora scelto può solo incrementare durante gli steps.

(dato che il costo del sottoinsieme è fissato, mentre alcuni ulteriori oggetti al suo interno possono essere coperti durante gli steps a causa della scelta di altri sottoinsiemi, numeratore ($c_k$) fissato, denominatore ($|S_k \cap \overline{C_{j-1}}|$) diminuisce $\rightarrow$ $eff(S_j)$ aumenta)

- Quindi il prezzo di $o_i$, cioè l'efficacia del sottoinsieme $S_{l}^{'}$ con $l \geq j$ tra $S_{j}^{'}, \cdots, S_{t}^{'}$ che lo copre, è almeno uguale a $eff(S_j)$

**LEMMA**: sia $o_1, \cdots, o_n$ gli oggetti listati nell'ordine del covering dell'algoritmo greedy, cioè, tale che gli oggetti coperti durante lo step $j$ sono listati dopo quelli coperti negli step precedenti e prima di quelli coperti negli step successivi, allora, per ogni $i$ tale che $1 \leq i \leq n$: 
$$ price(o_i) \leq {{m^*} \over {n - i + 1}}$$

**DIMOSTRAZIONE**:

- consideriamo qualunque oggetto $o_i$ e sia $j$ lo step nel quale è coperto.
- all'inizio dello step $j$, dato che i non ancora scelti sottoinsiemi di una soluzione ottima possono coprire tutti gli oggetti non coperti con costo totale al più $m^*$, DEVE esistere un sottoinsieme $S_k$ con efficacia al più ${{m^*} \over {|\overline{C_{j-1}}|}}$. 

Dove $\overline{C_{j-1}}$ sono i sottoinsiemi di oggetti non ancora coperti all'inizio dello step $j$.

- Infatti, se questo non è il caso, dato che il prezzo di $o_i$ è uguale all'efficacia $eff(S_j)$ del sottoinsieme $S_j$ scelto dall'algoritmo greedy, dal precedente lemma, per ogni possibile scelta dei sottoinsiemi rimanenti per completare il cover, cioè, per ogni possibile prezzo degli oggetti rimanenti:
$$ \sum_{o_i \in \overline{C_{j-1}}} price'(o_i) \geq \sum_{o_i \in \overline{C_{j-1}}} eff(S_j) >^* \sum_{o_i \in \overline{C_{j-1}}} {{m^*} \over { |\overline{C_{j-1}}| }} = |\overline{C_{j-1}}| \cdot {{m^*} \over { |\overline{C_{j-1}}| }} = m^* $$

\*: "al più" negato $\rightarrow$ prova per assurdo

- una CONTRADDIZIONE all'ipotesi che esiste una scelta di sottoinsiemi che coprono i rimanenti oggetti con costo al più $m^*$.

Quindi: $$price(o_i) \leq {{m^*} \over { |\overline{C_{j-1}}| }}$$

Ma: $|\overline{C_{j-1}}| \geq n - i + 1$ dato che $o_i, \cdots, o_n \in \overline{C_{j-1}}$,

E come conseguenza:
$$ price(o_i) \leq {{m^*} \over {|\overline{C_{j-1}}|}} \leq {{m^*} \over {n - i + 1}}$$

**TEOREMA**: l'algoritmo greedy-min-weighted-set-cover è $H_n$-approssimante, dove $H_n = 1 + {1 \over 2} + {1 \over 3} + {1 \over 4} + \dots + {1 \over n}$

**RECAP**

- serie armonica = $\sum_{n=1}^{\infty} {1 \over n}$
- forma generica: $$\sum_{n=1}^{\infty} {1 \over {n^\alpha}}$$
- converge: Se $\alpha > 1$
- diverge: Se $ 0 < \alpha \leq 1$

**FINE RECAP**

**DIMOSTRAZIONE**:

$$ m = \sum_{i=1}^{n} price(o_i) \leq \sum_{i=1}^{n} {{m^*} \over {n - i + 1}} =^* m^* \cdot ({1 \over n} + {1 \over {n - 1}} + {1 \over {n - 2}} + \dots + 1) = m^* \cdot H_n $$

Da cui:
$${m \over {m^*}} \leq {H_n}^{**}$$

\*: $\sum_{i=1}^{n} {{1} \over {n - i + 1}} = ({1 \over n} + {1 \over {n - 1}} + {1 \over {n - 2}} + \dots + 1) = H_n$ ($H_n$ perchè anche se letto al contrario, la somma è comunque commutativa (l'ordine non importa))

\*\*: ${{m} \over {m^*}} \leq {{m^* \cdot H_n} \over {m^*}} \leq H_n$

**NOTA**: per ogni $n > 1$, $ln(n+1) \leq H_n \leq ln(n) + 1$, quindi $r$ ha dipendenza logaritmica dalla dimensione dell'input.

- Il rapporto di approssimazione dell'algoritmo greedy è almeno $H_n$.
- La misura della soluzione ritornata dall'algoritmo greedy per qualche istanza è $H_n$ volte quella ottima.

# Esercizi

## 0-1 Knapsack

- Supponiamo di dover prendere un volo Lufthansa per Los Angeles. Il limite di peso imposto da Lufthansa è 23 kg. assumiamo che siamo interessati a portare i seguenti items: (item, weight, profit)

![image.png](images/knapsack_1_part1.png)

1. applica l'algoritmo greedy-knapsack per risolvere questa istanza del problema 0-1 knapsack (listando e facendo vedere tutti gli steps differenti)
2. la soluzione cambia quando applichiamo l'algoritmo modified-greedy?
3. computa la soluzione applicando l'algoritmo FPTAS-knapsack

- Supponiamo di avere la seguente istanza del problema 0-1 knapsack, con la capacity dello knapsack uguale a 5 ($b = 5$): (item, weight, profit)

![image.png](images/knapsack_2_part1.png)

1. applica l'algoritmo progr-dyn-knapsack per risolvere questa istanza del problema 0-1 knapsack (riempi la tabella, ritorna la soluzione con il massimo profitto e lista gli items che sono inseriti nello knapsack in tale soluzione)

## Min set cover

- Consideriamo la seguente istanza del problema min-weighted set cover:
    - $U = \{1,2,3,4,5,6\}$
    - $S_1 = \{1,6\},\\
      S_2 = \{1,2,6\},\\
      S_3 = \{1,4\},\\
      S_4 = \{1,5\},\\
      S_5 = \{1,3,5\},\\
      S_6 = \{2,6\}$
    - $c_1 = 3,\\
      c_2 = 4,\\
      c_3 = 2,\\
      c_4 = 3,\\
      c_5 = 5,\\
      c_6 = 2$
1. applica l'algoritmo greedy-min-weighted-set-cover per risolvere l'istanza del problema (lista e mostra tutti gli steps differenti)
2. computa la soluzione ottima dell'istanza del problema

## Min multiprocessor scheduling

- Supponiamo di avere la seguente istanza del problema Min multiprocessor scheduling, con 3 CPU disponibili ($h=3$): (process, running time)

![image.png](images/min_mprocessor_scheduling_part1.png)

1. risolvi l'istanza del problema applicando l'algoritmo greedy di Graham
2. risolvi l'istanza del problema applicando l'algoritmo ordered-greedy
3. risolvi l'istanza del problema applicando l'algoritmo PTAS-scheduling, con valori differenti di $\epsilon$