# Resolviendo el modelo de Ising y el problema de la mochila con un ordenador de D-Wave

## Carlos García Gutiérrez (UO139393)

En este bloc de notas vamos a utilizar un ordenador cuántico de D-Wave para resolver dos casos (uno trivial y otro un poco más complicado) del modelo de Ising que se corresponde con instancias del problema de la mochila con valores enteros.

El problema de la mochila con valores enteros (_knapsack integer problem_) se puede enunciar así:

- Tenemos una mochila con un límite de peso expresado en un valor entero.

- Tenemos varias piedras. Cada piedra tiene un peso (cantidad entera) y un valor (cantidad entera).

- La solución al problema pasa por encontrar la combinación de piedras a introducir en la mochila que, sin superar el peso máximo de la misma, maximice su valor. La solución no tiene por qué ser única.

El hamiltoniano del modelo de Ising es

$$H = \sum_{i,j=1}^n J_{i,j}Z_iZ_j + \sum_{i=1}^n h_iZ_i$$ 

Para el problema de la mochila la fórmula a minimizar [se puede expresar](https://arxiv.org/pdf/1302.5843.pdf) como

$$H = H_A + H_B$$

Siendo 

<img src="HA.png" width=40%>

y

<img src="HB.png" width=20%>

Donde $W$ es el peso máximo de la mochila, $w_a$ son los pesos de las piedras y $c_a$ son los valores de las mismas. $y_n$ son variables binarias que indican si el peso final de la mochila es el indicado ($1 \leq y_n \leq W$) y $w_n$ son variables binarias que indican la introducción o no de cada piedra en la mochila. $A$ y $B$ son dos constantes que tienen que cumplir que $0 < Bmax(c_a) < A$.

Para obtener los valores de los coeficientes $J_{i,j}$ y $h_i=0$ para todo $i,j$ debemos igualar lo anterior al hamiltoniano del modelo de Ising visto anteriormente.



Empecemos con un problema trivial:
- Peso máximo de la mochila: 1
- Piedra _t_
    - Peso: 1
    - Valor: 100
- Piedra _u_
    - Peso: 1
    - Valor: 100
    
Simplificando la notación, podemos expresar la fórmula a minimizar como
$$H_A = A(1 - a)^2 + A(a -1t - 1t)^2$$

$$H_B = -B(100t + 100u)$$

Tomando $A$ = 200 y $B$ = 1 tenemos

$$H = 200(1 - a)^2 + 200(a - t - u)^2 - (100t + 100u)$$

$$H = 100 (4 a^2 - 4 a t - 4 a u - 4 a + 2 t^2 + 4 t u - t + 2 u^2 - u + 2)$$

$$H = 400 a^2 - 400 a t - 400 a u - 400 a + 200 t^2 + 400 t u - 100t + 200 u^2 - 100u + 200$$

Como habíamos mencionado, las variables $a$, $t$ y $u$ son binarias, por lo que su cuadrado es 0 o 1, por lo tanto

$$H = 400 a - 400 a t - 400 a u - 400 a + 200 t + 400 t u - 100t + 200 u - 100u + 200$$

$$H = -400 a t - 400 a u + 100 t + 400 t u + 100 u + 200$$

$$H = -400 a t - 400 a u + 400 t u - 100 t + 100 u + 200$$

Ignorando el término independiente (que no afecta a ninguna variable), ahora ya podemos obtener directamente los valores de los coeficientes y generar un modelo binario (_dimod.BINARY_).

In [1]:
import numpy as np
import dimod

J = {('a', 't'): -400, ('a', 'u'): -400, ('t', 'u'): 400}
h = {'t': 100, 'u': 100}

model = dimod.BinaryQuadraticModel(h, J, 0.0, dimod.BINARY)

print(model)

BinaryQuadraticModel({'t': 100, 'u': 100, 'a': 0}, {('t', 'a'): -400, ('t', 'u'): 400, ('u', 'a'): -400}, 0.0, Vartype.BINARY)


Resolvemos el modelo de forma exacta

In [2]:
from dimod.reference.samplers import ExactSolver
sampler = ExactSolver()
solution = sampler.sample(model)
print(solution)

   a  t  u energy num_oc.
2  1  1  0 -300.0       1
6  1  0  1 -300.0       1
5  1  1  1 -200.0       1
0  0  0  0    0.0       1
1  1  0  0    0.0       1
3  0  1  0  100.0       1
7  0  0  1  100.0       1
4  0  1  1  600.0       1
['BINARY', 8 rows, 8 samples, 3 variables]


Las variable $a$ no nos interesa, sólo las que indican la presencia de las piedras ($t$ y $u$). Vemos que hay dos resultados de mínimia energía, que corresponden con las dos soluciones óptimas a este problema trivial: introducir en la mochila la piedra $t$ o la $u$, pero no las dos a la vez.

Ahora utilicemos *simulated annealing*.

In [6]:
sampler = dimod.SimulatedAnnealingSampler()
response = sampler.sample(model, num_reads=10)
print(response)

   a  t  u energy num_oc.
0  1  1  0 -300.0       1
1  1  0  1 -300.0       1
2  1  1  0 -300.0       1
3  1  1  0 -300.0       1
4  1  0  1 -300.0       1
5  1  1  0 -300.0       1
6  1  0  1 -300.0       1
7  1  0  1 -300.0       1
8  1  1  0 -300.0       1
9  1  0  1 -300.0       1
['BINARY', 10 rows, 10 samples, 3 variables]


Y, finalmente, el ordenador cuántico de D-Wave.

In [8]:
from dwave.system.samplers import DWaveSampler
from dwave.system.composites import EmbeddingComposite
sampler = EmbeddingComposite(DWaveSampler())
response = sampler.sample(model, num_reads=5000)
print(response)

   a  t  u energy num_oc. chain_b.
1  1  0  1 -300.0      10      0.0
0  1  1  1 -200.0    4990 0.333333
['BINARY', 2 rows, 5000 samples, 3 variables]


¡Algo ha pasado! El ordenador cuántico no proporciona las dos soluciones óptimas. La única explicación posible es que tengamos que aumentar el número de repeticiones de la ejecución.

In [9]:
from dwave.system.samplers import DWaveSampler
from dwave.system.composites import EmbeddingComposite
sampler = EmbeddingComposite(DWaveSampler())
response = sampler.sample(model, num_reads=10000)
print(response)

   a  t  u energy num_oc. chain_b.
1  1  0  1 -300.0      14      0.0
2  1  1  0 -300.0       4      0.0
0  1  1  1 -200.0    9982 0.333333
['BINARY', 3 rows, 10000 samples, 3 variables]


In [None]:
¡Ahora sí proporciona el resultado correcto!

Veamos ahora un caso un poco más complicado:
- Peso máximo de la mochila: 5
- Piedra _t_
    - Peso: 1
    - Valor: 40
- Piedra _u_
    - Peso: 2
    - Valor: 30
- Piedra _v_
    - Peso: 3
    - Valor: 20
- Piedra _w_
    - Peso: 4
    - Valor: 10
    
Vamos a aplicar exactamente el mismo proceso que en el caso anterior:

$$H_A = A(1-a-b-c-d-e)^2 + A(a + 2b + 3c + 4d + 5e -1t-2u-3v-4w)^2$$
$$H_B = -B(40t + 30u + 20v + 10w)$$

Tomando $A$ = 50 y $B$ = 1 tenemos

$$ H = 50(1-a-b-c-d-e)^2 + 50(a + 2b + 3c + 4d + 5e -1t-2u-3v-4w)^2-1(40t + 30u + 20v + 10w)$$

$$ H = 50 (2 a^2 + 2 a (3 b + 4 c + 5 d + 6 e - t - 2 u - 3 v - 4 w - 1) + 5 b^2 + 2 b (7 c + 9 d + 11 e - 2 t - 4 u - 6 v - 8 w - 1) + 10 c^2 + 2 c (13 d + 16 e - 3 t - 6 u - 9 v - 12 w - 1) + 17 d^2 + 2 d (21 e - 4 t - 8 u - 12 v - 16 w - 1) + 26 e^2 - 2 e (5 t + 10 u + 15 v + 20 w + 1) + t^2 + 2 t (2 u + 3 v + 4 w) + 4 u^2 + 4 u (3 v + 4 w) + 9 v^2 + 24 v w + 16 w^2 + 1)$$

$$ H = 100 a^2 + 300 a b + 400 a c + 500 a d + 600 a e - 100 a t - 200 a u - 300 a v - 400 a w - 100 a + 250 b^2 + 700 b c + 900 b d + 1100 b e - 200 b t - 400 b u - 600 b v - 800 b w - 100 b + 500 c^2 + 1300 c d + 1600 c e - 300 c t - 600 c u - 900 c v - 1200 c w - 100 c + 850 d^2 + 2100 d e - 400 d t - 800 d u - 1200 d v - 1600 d w - 100 d + 1300 e^2 - 500 e t - 1000 e u - 1500 e v - 2000 e w - 100 e + 50 t^2 + 200 t u + 300 t v + 400 t w + 200 u^2 + 600 u$$

Eliminando los cuadrados, finalmente tenemos

$$ H = 100 a + 300 a b + 400 a c + 500 a d + 600 a e - 100 a t - 200 a u - 300 a v - 400 a w - 100 a + 250 b + 700 b c + 900 b d + 1100 b e - 200 b t - 400 b u - 600 b v - 800 b w - 100 b + 500 c + 1300 c d + 1600 c e - 300 c t - 600 c u - 900 c v - 1200 c w - 100 c + 850 d + 2100 d e - 400 d t - 800 d u - 1200 d v - 1600 d w - 100 d + 1300 e - 500 e t - 1000 e u - 1500 e v - 2000 e w - 100 e + 50 t + 200 t u + 300 t v + 400 t w + 200 u + 600 u v + 800 u w + 450 v + 1200 v w + 800 w + 50$$

De donde podemos obtener directamente los coeficientes.


In [10]:
J = {('a', 'b'):  300, ('a', 'c'):  400, ('a', 'd'):  500, ('a', 'e'):  600, 
     ('a', 't'): -100, ('a', 'u'): -200, ('a', 'v'): -300, ('a', 'w'): -400, 
     ('b', 'c'):  700, ('b', 'd'):  900, ('b', 'e'): 1100, ('b', 't'): -200,
     ('b', 'u'): -400, ('b', 'v'): -600, ('b', 'w'): -800,
     ('c', 'd'): 1300, ('c', 'e'): 1600, ('c', 't'): -300, ('c', 'u'): -600,
     ('c', 'v'): -900, ('c', 'w'):-1200,
     ('d', 'e'): 2100, ('d', 't'): -400, ('d', 'u'): -800, ('d', 'v'):-1200,
     ('d', 'w'):-1600,
     ('e', 't'): -500, ('e', 'u'):-1000, ('e', 'v'):-1500, ('e', 'w'):-2000,
     ('t', 'u'):  200, ('t', 'v'):  300, ('t', 'w'):  400,
     ('u', 'v'):  600, ('u', 'w'):  800,
     ('v', 'w'): 1200}

h = {'a': 100-100, 'b': 250-100, 'c': 500-100, 'd': 850-100,'e': 1300-100, 
     't':  50- 40, 'u': 200- 30, 'v': 450- 20, 'w': 800- 10}

model = dimod.BinaryQuadraticModel(h, J, 0.0, dimod.BINARY)

print(model)

BinaryQuadraticModel({'a': 0, 'b': 150, 'c': 400, 'd': 750, 'e': 1200, 't': 10, 'u': 170, 'v': 430, 'w': 790}, {('a', 'b'): 300, ('a', 'c'): 400, ('a', 'd'): 500, ('a', 'e'): 600, ('a', 't'): -100, ('a', 'u'): -200, ('a', 'v'): -300, ('a', 'w'): -400, ('b', 'c'): 700, ('b', 'd'): 900, ('b', 'e'): 1100, ('b', 't'): -200, ('b', 'u'): -400, ('b', 'v'): -600, ('b', 'w'): -800, ('c', 'd'): 1300, ('c', 'e'): 1600, ('c', 't'): -300, ('c', 'u'): -600, ('c', 'v'): -900, ('c', 'w'): -1200, ('d', 'e'): 2100, ('d', 't'): -400, ('d', 'u'): -800, ('d', 'v'): -1200, ('d', 'w'): -1600, ('e', 't'): -500, ('e', 'u'): -1000, ('e', 'v'): -1500, ('e', 'w'): -2000, ('t', 'u'): 200, ('t', 'v'): 300, ('t', 'w'): 400, ('u', 'v'): 600, ('u', 'w'): 800, ('v', 'w'): 1200}, 0.0, Vartype.BINARY)


Lo resolvemos de forma exacta.

In [13]:
sampler = ExactSolver()
solution = sampler.sample(model)
print(solution)

     a  b  c  d  e  t  u  v  w  energy num_oc.
71   0  0  1  0  0  1  1  0  0  -120.0       1
207  0  0  0  1  0  1  0  1  0  -110.0       1
159  0  0  0  0  1  0  1  1  0  -100.0       1
479  0  0  0  0  1  1  0  0  1  -100.0       1
62   1  0  0  0  0  1  0  0  0   -90.0       1
160  0  0  0  0  1  1  1  1  0   -90.0       1
161  1  0  0  0  1  1  1  1  0   -90.0       1
179  0  1  0  1  0  1  1  1  0   -90.0       1
124  0  1  0  0  0  0  1  0  0   -80.0       1
419  0  1  0  0  1  1  1  0  1   -80.0       1
439  0  0  1  1  0  1  1  0  1   -80.0       1
66   1  1  0  0  0  1  1  0  0   -70.0       1
67   0  1  0  0  0  1  1  0  0   -70.0       1
79   0  0  0  1  0  1  1  0  0   -70.0       1
248  0  0  1  0  0  0  0  1  0   -70.0       1
295  0  0  1  0  1  1  0  1  1   -70.0       1
198  1  0  1  0  0  1  0  1  0   -60.0       1
199  0  0  1  0  0  1  0  1  0   -60.0       1
223  0  0  0  0  1  1  0  1  0   -60.0       1
367  0  0  0  1  1  0  1  1  1   -60.0       1
496  0  0  0 

La solución es la correcta: lo óptimo es introducir en la mochila las piedras $t$ y $u$.

Ahora, resolvámoslo con *simulated annealing*.

In [15]:
sampler = dimod.SimulatedAnnealingSampler()
response = sampler.sample(model, num_reads=10)
print(response)

   a  b  c  d  e  t  u  v  w energy num_oc.
6  0  0  0  1  0  1  0  1  0 -110.0       1
1  0  0  0  0  1  1  0  0  1 -100.0       1
7  0  0  0  0  1  0  1  1  0 -100.0       1
8  1  0  0  0  0  1  0  0  0  -90.0       1
0  0  1  0  0  0  0  1  0  0  -80.0       1
3  0  0  1  1  0  1  1  0  1  -80.0       1
2  0  0  0  1  1  0  1  1  1  -60.0       1
5  0  1  1  0  0  0  1  1  0  -50.0       1
4  0  1  0  1  0  0  1  0  1  -40.0       1
9  0  1  1  1  0  0  1  1  1   90.0       1
['BINARY', 10 rows, 10 samples, 9 variables]


!La solución no es la correcta! Igual que antes con el computador cuántico, debemos aumentar el número de ejecuciones (en este caso, simuladas).

In [16]:
sampler = dimod.SimulatedAnnealingSampler()
response = sampler.sample(model, num_reads=50)
print(response)

    a  b  c  d  e  t  u  v  w energy num_oc.
42  0  0  0  1  0  1  0  1  0 -110.0       1
3   0  0  0  0  1  0  1  1  0 -100.0       1
11  0  0  0  0  1  1  0  0  1 -100.0       1
12  0  0  0  0  1  0  1  1  0 -100.0       1
19  0  0  0  0  1  0  1  1  0 -100.0       1
20  0  0  0  0  1  1  0  0  1 -100.0       1
23  0  0  0  0  1  0  1  1  0 -100.0       1
32  0  0  0  0  1  0  1  1  0 -100.0       1
34  0  0  0  0  1  0  1  1  0 -100.0       1
38  0  0  0  0  1  0  1  1  0 -100.0       1
41  0  0  0  0  1  1  0  0  1 -100.0       1
47  0  0  0  0  1  0  1  1  0 -100.0       1
1   1  0  0  0  0  1  0  0  0  -90.0       1
6   1  0  0  0  0  1  0  0  0  -90.0       1
8   1  0  0  0  0  1  0  0  0  -90.0       1
14  1  0  0  0  0  1  0  0  0  -90.0       1
22  1  0  0  0  0  1  0  0  0  -90.0       1
28  1  0  0  0  0  1  0  0  0  -90.0       1
29  1  0  0  0  0  1  0  0  0  -90.0       1
31  1  0  0  0  0  1  0  0  0  -90.0       1
36  1  0  0  0  0  1  0  0  0  -90.0       1
45  1  0  

La solución sigue sinser la correcta. Volvamos a aumentar el número de ejecuciones.

In [17]:
sampler = dimod.SimulatedAnnealingSampler()
response = sampler.sample(model, num_reads=100)
print(response)

    a  b  c  d  e  t  u  v  w energy num_oc.
92  0  0  1  0  0  1  1  0  0 -120.0       1
0   0  0  0  0  1  0  1  1  0 -100.0       1
12  0  0  0  0  1  0  1  1  0 -100.0       1
19  0  0  0  0  1  0  1  1  0 -100.0       1
26  0  0  0  0  1  0  1  1  0 -100.0       1
35  0  0  0  0  1  1  0  0  1 -100.0       1
40  0  0  0  0  1  0  1  1  0 -100.0       1
46  0  0  0  0  1  0  1  1  0 -100.0       1
49  0  0  0  0  1  0  1  1  0 -100.0       1
53  0  0  0  0  1  0  1  1  0 -100.0       1
55  0  0  0  0  1  1  0  0  1 -100.0       1
59  0  0  0  0  1  1  0  0  1 -100.0       1
65  0  0  0  0  1  0  1  1  0 -100.0       1
68  0  0  0  0  1  0  1  1  0 -100.0       1
73  0  0  0  0  1  0  1  1  0 -100.0       1
85  0  0  0  0  1  1  0  0  1 -100.0       1
94  0  0  0  0  1  0  1  1  0 -100.0       1
95  0  0  0  0  1  0  1  1  0 -100.0       1
5   1  0  0  0  0  1  0  0  0  -90.0       1
10  1  0  0  0  0  1  0  0  0  -90.0       1
13  1  0  0  0  0  1  0  0  0  -90.0       1
17  1  0  

Ahora la solución ya es la correcta.

Finalmente, vamos a resolverlo con el computador cuántico.

In [18]:
sampler = EmbeddingComposite(DWaveSampler())
response = sampler.sample(model, num_reads=5000)
print(response)

    a  b  c  d  e  t  u  v  w energy num_oc. chain_.
29  1  0  1  0  0  1  0  1  0  -60.0       3     1.0
39  1  0  1  0  0  1  0  1  0  -60.0       1     1.0
24  0  0  0  1  0  1  0  0  1  -50.0       6 0.888889
44  0  0  0  1  0  1  0  0  1  -50.0       3 0.777778
5   0  1  0  1  0  0  1  0  1  -40.0      38 0.777778
10  0  1  0  1  0  0  1  0  1  -40.0       9 0.777778
32  0  1  0  1  0  1  1  0  1  -30.0       2 0.888889
61  0  1  0  1  0  1  1  0  1  -30.0       1 0.888889
64  1  0  0  0  1  1  1  0  1  -30.0       1     1.0
77  1  0  0  0  1  1  1  0  1  -30.0       1     1.0
18  0  1  0  1  0  1  0  0  1    0.0      42 0.888889
36  0  1  0  1  0  1  0  0  1    0.0       3 0.777778
38  0  1  0  1  0  1  0  0  1    0.0       5 0.888889
15  0  1  0  1  0  0  0  1  1   20.0       6 0.777778
56  0  1  0  1  0  0  0  1  1   20.0       1 0.777778
53  1  0  0  1  1  1  1  1  1   50.0      13     1.0
67  1  1  0  0  1  1  0  1  1   80.0       2     1.0
22  1  0  1  0  0  1  1  1  0  110.

Como cabría esperar, no proporciona la solución correcta. Aumentemos el número de ejecuciones.

In [19]:
sampler = EmbeddingComposite(DWaveSampler())
response = sampler.sample(model, num_reads=10000)
print(response)

    a  b  c  d  e  t  u  v  w energy num_oc. chain_.
0   1  1  0  0  0  1  1  0  0  -70.0    2205 0.888889
4   1  1  0  0  0  1  1  0  0  -70.0     184 0.888889
5   1  1  0  0  0  1  1  0  0  -70.0     182 0.888889
9   1  1  0  0  0  1  1  0  0  -70.0      19 0.777778
35  1  1  0  0  0  1  1  0  0  -70.0       1 0.888889
37  1  1  0  0  0  1  1  0  0  -70.0       1 0.888889
45  0  0  1  0  1  1  0  1  1  -70.0      57 0.777778
47  0  0  1  0  1  1  0  1  1  -70.0      35 0.777778
48  0  0  1  0  1  1  0  1  1  -70.0      15 0.777778
54  1  1  0  0  0  1  1  0  0  -70.0       1 0.888889
56  1  1  0  0  0  1  1  0  0  -70.0       1 0.888889
91  1  0  0  0  0  0  1  0  0  -30.0       1 0.888889
8   1  0  1  0  0  1  1  0  0  -20.0     186     1.0
12  1  0  1  0  0  1  1  0  0  -20.0     156     1.0
13  1  0  1  0  0  1  1  0  0  -20.0     125     1.0
79  1  0  1  0  0  1  1  0  0  -20.0       1 0.888889
1   1  1  0  0  0  0  1  0  0   20.0    1493 0.888889
2   1  1  0  0  0  0  1  0  0   

Sigue sin proporcionarla, volvamos a aumentar las ejecuciones.

In [20]:
sampler = EmbeddingComposite(DWaveSampler())
response = sampler.sample(model, num_reads=15000)
print(response)

SolverFailureError: Invalid num_reads value

El ordenador cuántico de D-Wave no permite tantas ejecuciones (de hecho, el límite es 10000). Así que, en este caso, no podemos verificar la solución del problema con el computador cuántico real.