# Introduction à la programmation linéaire en nombres entiers: résolution de Sudoku

Les problèmes linéaires en nombres entiers (PLNE) sont similaires à ceux abordés précédemment avec la contrainte supplémentaire que les variables doivent être des entiers naturelles.

Par exemple une forme standard d'un PLNE est:

\begin{align}
\min & \, \langle c, x \rangle \\
\text{s.c.} \quad 
& Ax = b, \\
& x \ge 0, \\
& x \in \mathbb{Z}^n.
\end{align}

Cette dernière contrainte rend les PLNE non-convexes, ce qui complique leur résolution et demande des technqiues particulières qui ne sont pas abordées cette année. 

Dans ce TP, nous allons utiliser la librairy `pulp` qui permet de résoudre de tels problèmes.


In [1]:
%pip install pulp 


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m25.1.1[0m[39;49m -> [0m[32;49m25.3[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpython -m pip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [2]:
import matplotlib.pyplot as plt
import pulp 

## 1. Utilisation de `pulp` sur le problème de transport

Nous considérons à nouveau l'exemple de la distribution de bières du TP2. 

Pour rappel, la modélisation du problème donnait:

### 1. Modélisation du problème

Les variables de decision représentent les volumes de bières (en L) livrés des usines aux bars (représentés par les flèches sur le schéma). Soient $U = \{a,b\}$ et $B = \{1,2,3,4,5\}$ et les variables :
$$
    x_{w,b} \geq 0, \quad \forall w \in W, b \in B
$$

Les contraintes viennent des besoins de chaque bar et des stocks de chaque usine. Le volume de bière distribué depuis une usine ne peut pas excéder son stock. On formule ainsi deux contraintes :
$$
    \sum_{b \in B} x_{w,b} \leq s_w, \quad \forall w \in W
$$
avec $s_a = 1000$ et $s_b = 4000$ représentant le stock de chaque usine.

Pour éviter les pertes de vente, le volume livré à un bar doit être superieur à sa demande qui peut stocker l'excèdent pour la semaine suivante. Ceci permet de formuler 5 contraintes :
$$
    \sum_{w \in W} x_{w,b} \geq d_b, \quad \forall b \in B
$$
avec $d_1 = 500$, $d_2 = 900$, $d_3 = 1800$, $d_4 = 200$, $d_5 = 700$ qui représentent les demandes de chaque bar.

Pour ce problème, nous supposerons que le coût de transport est proportionnel au volume transporté d'une usine à l'autre. Les coûts de transport entre les usine et les bars sont :
$$
\begin{array}{c | c c c c c}
    \hline
    & 1 & 2 & 3 & 4 & 5 \\ \hline
    a & 2 & 4 & 5 & 2 & 1 \\
    b & 3 & 1 & 3 & 2 & 3 \\
\end{array} = (c_{w,b})_{w \in W, b \in B}
$$
en euros par L de bière.
La fonction coût est donc 
$$
    \sum_{w \in W, b \in B} c_{w,b} x_{w,b}
$$




### 2. Modèle `pulp`

La librairy `pulp` permet d'ajouter les contraintes de manière plus simple que la création du dictionnaire en TP2.

On définit les entrepots et leurs productions ainsi que les bars et les demandes.

In [56]:
# Creates a list of all the supply nodes
Warehouses = ["A", "B"]

# Creates a dictionary for the number of units of supply for each supply node
supply = {"A": 1000, "B": 4000}

# Creates a list of all demand nodes
Bars = ["1", "2", "3", "4", "5"]

# Creates a dictionary for the number of units of demand for each demand node
demand = {
    "1": 500,
    "2": 900,
    "3": 1800,
    "4": 200,
    "5": 700,
}

# Creates a list of tuples containing all the possible routes for transport
Routes = [(w, b) for w in Warehouses for b in Bars]

Les couts de transport sont renseignées dans une liste puis dans un dictionnaire de sorte que:
- costs[0][0] = costs_dict["A"]["1"] correspond au cout de transport du warehouse A au bar 1
- costs[1][2] = costs_dict["B"]["3"] correspond au cout de transport du warehouse B au bar 3

In [57]:
# Creates a list of costs of each transportation path
costs = [  # Bars
    # 1 2 3 4 5
    [2, 4, 5, 2, 1],  # A   Warehouses
    [3, 1, 3, 2, 3],  # B
]

# The cost data is made into a dictionary
costs_dict = pulp.makeDict([Warehouses, Bars], costs, 0)

Le problème est créé dans `pulp` à l'aide de `LpProblem`, les variables à l'aide de `LpVariable` de la façon suivante.


In [58]:
prob = pulp.LpProblem("Beer", pulp.LpMinimize)

# A dictionary called 'Vars' is created to contain the referenced variables(the routes)
vars = pulp.LpVariable.dicts("Route", (Warehouses, Bars), 0, None)

La fonction cout doit être ajoutée en premier dans `prob`. Puis les contraintes. La fonction `pulp.lpSum` permet d'opérer des sommes sur les `pulp.lpVariables`, qui sera traduit en interne sous forme de contrainte.

In [59]:
# The objective function is added to 'prob' first
prob += (
    pulp.lpSum([vars[w][b] * costs_dict[w][b] for (w, b) in Routes]),
    "Sum_of_Transporting_Costs",
)

# The supply maximum constraints are added to prob for each supply node (warehouse)
for w in Warehouses:
    prob += (
        pulp.lpSum([vars[w][b] for b in Bars]) <= supply[w],
        f"Sum_of_Products_out_of_Warehouse_{w}",
    )

# The demand minimum constraints are added to prob for each demand node (bar)
for b in Bars:
    prob += (
        pulp.lpSum([vars[w][b] for w in Warehouses]) >= demand[b],
        f"Sum_of_Products_into_Bar{b}",
    )



Toutes les contraintes sont ajoutées. Il est maintenant possible de résoudre le problème.

In [60]:
# The problem data is written to an .lp file
prob.writeLP("BeerDistributionProblem.lp")

# The problem is solved using PuLP's choice of Solver
prob.solve()

# The status of the solution is printed to the screen
print("Status:", pulp.LpStatus[prob.status])

# Each of the variables is printed with it's resolved optimum value
for v in prob.variables():
    print(v.name, "=", v.varValue)

# The optimised objective function value is printed to the screen
print("Total Cost of Transportation = ", pulp.value(prob.objective))

Welcome to the CBC MILP Solver 
Version: 2.10.3 
Build Date: Dec 15 2019 

command line - /usr/local/python/3.12.1/lib/python3.12/site-packages/pulp/apis/../solverdir/cbc/linux/i64/cbc /tmp/0635e68106134e62a0ae95ad72ae5c3f-pulp.mps -timeMode elapsed -branch -printingOptions all -solution /tmp/0635e68106134e62a0ae95ad72ae5c3f-pulp.sol (default strategy 1)
At line 2 NAME          MODEL
At line 3 ROWS
At line 12 COLUMNS
At line 43 RHS
At line 51 BOUNDS
At line 52 ENDATA
Problem MODEL has 7 rows, 10 columns and 20 elements
Coin0008I MODEL read with 0 errors
Option for timeMode changed from cpu to elapsed
Presolve 7 (0) rows, 10 (0) columns and 20 (0) elements
0  Obj 0 Primal inf 4100 (5)
7  Obj 8600
Optimal - objective value 8600
Optimal objective 8600 - 7 iterations time 0.002
Option for printingOptions changed from normal to all
Total time (CPU seconds):       0.00   (Wallclock seconds):       0.00

Status: Optimal
Route_A_1 = 300.0
Route_A_2 = 0.0
Route_A_3 = 0.0
Route_A_4 = 0.0
Route_A

**TODO**: Vérifier que les résultats sont similaires à ceux obtenus au TP précédent. 

Maintenant, supposons que les quantités exprimées ne soient plus des réels (litres) mais des entiers (nombre de caisses). Cette contrainte peut facilement être intégré dans `pulp` en ajoutant `pulp.LpInteger` à déclaration de variables. C'est à dire en remplacant:
- `vars = LpVariable.dicts("Route", (Warehouses, Bars), 0, None)`
- par `vars = LpVariable.dicts("Route", (Warehouses, Bars), 0, None, pulp.LpInteger)`

Relancer la résolution avec cette contrainte et commenter.

# 2. Résolution de Sudoku à l'aide de la PLNE

Un sudoku est un problème consistant en une grille de nombres 9×9 incomplète qui doit être remplie selon plusieurs règles :
- Dans chacun des 9 blocs individuels de 3×3, chacun des nombres de 1 à 9 doit apparaître.
- Dans chaque colonne de la grille 9×9, chacun des nombres de 1 à 9 doit apparaître.
- Dans chaque ligne de la grille 9×9, chacun des nombres de 1 à 9 doit apparaître.

Nous allons résoudre ce Sudoku, mais avec quelques modifications mineurs, le code permettra de résoudre n'importe quel sudoku.

![image](https://coin-or.github.io/pulp/_images/wikisudokuproblem.jpg)

## 1. Modélisation

Pour formuler le sudoku en PL, on pourrait simplement créer une variable pour les 81 cases prenant une valeur entre 1 et 9. 
Néanmoins, il n'existe pas en PL d'opération "différent de" qui permettrait de modéliser les règles précédentes sur les lignes, colonnes, blocs.
Il existe des stratégies assez complexes permettant cette modélisation, mais il existe une facon plus élégante de procéder.

Pour chacune des 81 cases, on associe 9 variables binaires correspondant à chaque nombre entre 1 et 9. On les notera:
$$
    x_{v,i,j} \in \{0,1\}, \quad \forall v,i,j \in \{1,\ldots, 9\}.
$$
Ainsi $x_{v,i,j}$ décrit si la valeur $v$ est présente dans la case $(i,j)$ si elle vaut $1$ et absente sinon. Notons que pour une case fixée $(i,j)$ un seul $v$ peut donner lieu à une varaible $x_{v,i,j}$ à 1 et toutes les autres doivent être à 0.

Le problème du Sudoku consiste à trouver une solution satisfaisant toutes les contraintes. La "qualité" de la solution n'étant pas importante, aucune fonction coût n'est necessaire.

Dans la suite, on notera pour avoirs des notations plus compactes: 
- $I = \{ 1, \ldots, 9 \}$ 
- $B_{k,l} \subset I^2$ le $(k,l)$-ème bloc d'indice de taille $(3 \times 3)$. Le bloc $(1,1)$ est en haut à gauche de la grille, le $(1,2)$ en haut au centre, le $(1,3)$ en haut à droite, le $(2,1)$ au milieu à gauche, etc... Formellemt, cela correspond à $$B_{k,l} = \{ ( 3(k-1) + i, 3(l-1) + j ), \quad i,j \in \{1,2,3\}\}.$$

**TODO:** Formuler les contraintes sur les variables binaires $x_{v,i,j}$ pour qu'elles satifassent les règles du Sudoku. Ecrire une phrase et une équation pour chaque contrainte.


Le code suivant crée les ensemble d'indices $I$, les blocs et les nombres existants sous forme de liste contenant (valeur, indice ligne, indice colonne).

In [61]:
I = range(1, 10)

Blocs = [
    [(3 * i + k + 1, 3 * j + l + 1) for k in range(3) for l in range(3)]
    for i in range(3)
    for j in range(3)
]

# # The starting numbers are entered as constraints
# input_data = [
#     (5, 1, 1),
#     (6, 2, 1),
#     (8, 4, 1),
#     (4, 5, 1),
#     (7, 6, 1),
#     (3, 1, 2),
#     (9, 3, 2),
#     (6, 7, 2),
#     (8, 3, 3),
#     (1, 2, 4),
#     (8, 5, 4),
#     (4, 8, 4),
#     (7, 1, 5),
#     (9, 2, 5),
#     (6, 4, 5),
#     (2, 6, 5),
#     (1, 8, 5),
#     (8, 9, 5),
#     (5, 2, 6),
#     (3, 5, 6),
#     (9, 8, 6),
#     (2, 7, 7),
#     (6, 3, 8),
#     (8, 7, 8),
#     (7, 9, 8),
#     (3, 4, 9),
#     (1, 5, 9),
#     (6, 6, 9),
#     (5, 8, 9),
# ]

input_data = [
    (1,1,1),
    (7,1,6),
    (9,1,8),
    (3,2,2),
    (2,2,5),
    (8,2,9),
    (9,3,3),
    (6,3,4),
    (5,3,7),
    (5,4,3),
    (3,4,4),
    (9,4,7),
    (1,5,2),
    (8,5,5),
    (2,5,9),
    (6,6,1),
    (4,6,6),
    (3,7,1),
    (1,7,8),
    (4,8,2),
    (7,8,9),
    (7,9,3),
    (3,9,7)
]


Le problème `pulp` peut être créé de la facon suivante.

In [62]:
# The prob variable is created to contain the problem data
prob = pulp.LpProblem("Sudoku_Problem")
# The binary decision variables are created
x_vij = pulp.LpVariable.dicts("Choice", (I, I, I), cat="Binary")


**TODO:** Codes les contraintes

In [63]:
## contraintes
# 1. Constraint: Each cell (i, j) must contain EXACTLY ONE number
for r in I:
    for c in I:
        prob += pulp.lpSum([x_vij[v][r][c] for v in I]) == 1, f"Cell_constraint_{r}_{c}"

# 2. Constraint: Each number v must appear EXACTLY ONCE in each ROW
for v in I:
    for r in I:
        prob += pulp.lpSum([x_vij[v][r][c] for c in I]) == 1, f"Row_constraint_{v}_{r}"

# 3. Constraint: Each number v must appear EXACTLY ONCE in each COLUMN
for v in I:
    for c in I:
        prob += pulp.lpSum([x_vij[v][r][c] for r in I]) == 1, f"Col_constraint_{v}_{c}"

# 4. Constraint: Each number v must appear EXACTLY ONCE in each BLOCK
# (Note: 'Blocs' was defined in your earlier cell)
for k, block in enumerate(Blocs):
    for v in I:
        # block is a list of (r, c) tuples
        prob += pulp.lpSum([x_vij[v][r][c] for (r, c) in block]) == 1, f"Block_constraint_{k}_{v}"

# 5. Constraint: Respect the Initial Clues (The fixed numbers)
for (val, r, c) in input_data:
    prob += x_vij[val][r][c] == 1, f"Fixed_Constraint_{val}_{r}_{c}"

In [64]:
# The problem data is written to an .lp file
prob.writeLP("Sudoku.lp")

# The problem is solved using PuLP's choice of Solver
prob.solve()

# The status of the solution is printed to the screen
print("Status:", pulp.LpStatus[prob.status])

Welcome to the CBC MILP Solver 
Version: 2.10.3 
Build Date: Dec 15 2019 

command line - /usr/local/python/3.12.1/lib/python3.12/site-packages/pulp/apis/../solverdir/cbc/linux/i64/cbc /tmp/b031fc81131648c4b4a6176d46b354ca-pulp.mps -timeMode elapsed -branch -printingOptions all -solution /tmp/b031fc81131648c4b4a6176d46b354ca-pulp.sol (default strategy 1)
At line 2 NAME          MODEL
At line 3 ROWS
At line 352 COLUMNS
At line 4751 RHS
At line 5099 BOUNDS
At line 5830 ENDATA
Problem MODEL has 347 rows, 730 columns and 2939 elements
Coin0008I MODEL read with 0 errors
Option for timeMode changed from cpu to elapsed
Continuous objective value is 0 - 0.00 seconds
Cgl0003I 4 fixed, 0 tightened bounds, 0 strengthened rows, 6 substitutions
Cgl0004I processed model has 196 rows, 192 columns (192 integer (192 of which binary)) and 774 elements
Cbc0045I No integer variables out of 192 objects (192 integer) have costs
Cbc0045I branch on satisfied N create fake objective Y random cost Y
Cbc0038I In

(48) obj. 0 iterations 24
Cbc0038I Pass  49: suminf.   24.00000 (48) obj. 0 iterations 16
Cbc0038I Pass  50: suminf.   24.00000 (48) obj. 0 iterations 30
Cbc0038I Pass  51: suminf.   24.00000 (48) obj. 0 iterations 43
Cbc0038I Pass  52: suminf.   24.00000 (48) obj. 0 iterations 20
Cbc0038I Pass  53: suminf.   24.00000 (48) obj. 0 iterations 26
Cbc0038I Pass  54: suminf.   24.00000 (48) obj. 0 iterations 26
Cbc0038I Pass  55: suminf.   24.00000 (48) obj. 0 iterations 26
Cbc0038I Pass  56: suminf.   24.00000 (48) obj. 0 iterations 28
Cbc0038I Pass  57: suminf.   23.00000 (46) obj. 0 iterations 20
Cbc0038I Pass  58: suminf.   23.00000 (46) obj. 0 iterations 21
Cbc0038I Pass  59: suminf.   23.00000 (46) obj. 0 iterations 9
Cbc0038I Pass  60: suminf.   21.60000 (104) obj. 0 iterations 29
Cbc0038I Pass  61: suminf.   21.60000 (104) obj. 0 iterations 0
Cbc0038I Pass  62: suminf.   23.00000 (46) obj. 0 iterations 25
Cbc0038I Pass  63: suminf.   23.00000 (46) obj. 0 iterations 18
Cbc0038I Pass 

La fonction suivante permet d'afficher le résulat. Les chiffres en rouge sont ceux trouvés par l'algorithme.

In [65]:
from IPython.display import display, Latex

latex = []
latex.append(r"\[")
latex.append(r"\begin{array}{|ccc|ccc|ccc|}")
latex.append(r"\hline")

for r in I:
    row_vals = []
    for c in I:
        for v in I:
            if pulp.value(x_vij[v][r][c]) == 1:
                if not (v,r,c) in input_data:
                    row_vals.append(r"\textcolor{red}{" + str(v) + "}")
                else:
                    row_vals.append(str(v))
                break

    # Join columns and add row ending
    latex.append(" & ".join(row_vals) + r" \\")

    # Horizontal lines after rows 3 and 6
    if r in [3, 6]:
        latex.append(r"\hline")

latex.append(r"\hline")
latex.append(r"\end{array}")
latex.append(r"\]")

display(Latex("\n".join(latex)))

<IPython.core.display.Latex object>

**TODO:** Pour changer de grille de Sudoku, il suffit de changer la liste `input_data`.

In [66]:
# qualified as one of the hardest Sudoku problem
input_data = [
    (1,1,1),
    (7,1,6),
    (9,1,8),
    (3,2,2),
    (2,2,5),
    (8,2,9),
    (9,3,3),
    (6,3,4),
    (5,3,7),
    (5,4,3),
    (3,4,4),
    (9,4,7),
    (1,5,2),
    (8,5,5),
    (2,5,9),
    (6,6,1),
    (4,6,6),
    (3,7,1),
    (1,7,8),
    (4,8,2),
    (7,8,9),
    (7,9,3),
    (3,9,7)
]