<img src='./figures/logo-ecole-polytechnique-ve.jpg' style='position:absolute; top:0; right:0;' width='100px' height='' alt='' />

<center>**Ecole Polytechnique, Cycle ing√©nieur**</center>
<center>MAP572</center>

# R√©solution de k-SAT par Monte-Carlo

In [1]:
# css style
from IPython.core.display import HTML
def css_styling():
    styles = open("./style/custom2.css").read()
    return HTML(styles)
css_styling()

In [2]:
# load the libraries
import matplotlib.pyplot as plt # 2D plotting library
import numpy as np              # package for scientific computing  
import random
%matplotlib inline  

## Table des mati√®res

- [k-SAT et exploration al√©atoire](#kSAT)
  - k-SAT : D√©finition et Pr√©liminaires
  - [R√©solution de $2$-SAT avec <i>WalkSat</i>](#WalkSat)
  - [<i>WalkSat</i> : choix du param√®tre $T$](#ChoixT)  
- [Matrices de transitions : Calcul de $\mathbb{P}(\tau < 2n^2)$](#Annexe)
- [Application : Transition de phase pour $2$-SAT](#Transition)


Pour un probl√®me sur un espace fini, les m√©thodes <i>Monte-Carlo Markov Chain</i> (MCMC) consistent √† parcourir l'ensemble des solutions possibles de fa√ßon al√©atoire mais astucieuse. On cherche ainsi √† d√©terminer la solution optimale, ou proche de l'optimal.

L'objectif de ce TP est d'illustrer la puissance de la strat√©gie MCMC sur un probl√®me particulier : le probl√®me $k$-SAT en informatique th√©orique. C'est aussi un pr√©texte pour utiliser les matrices de transitions.

Une r√©f√©rence pour ce TP est :<br>
[1] MITZENMACHER, Michael et UPFAL, Eli. Probability and computing: Randomization and probabilistic techniques in algorithms and data analysis. Cambridge university press, 2017. (pages 156-159)


<a id="kSAT"></a>
# Le probl√®me k-SAT

Le probl√®me SAT en informatique th√©orique (aussi appel√© probl√®me de satisfaisabilit√© bool√©enne) est le probl√®me de d√©cision qui, √©tant donn√© une formule de logique bool√©enne, d√©termine s'il existe une assignation des variables qui rend la formule vraie.

Nous allons d√©finir tous les termes et restreindre le contexte.

Ici on va sp√©cifiquement s'int√©resser au probl√®me $k$-SAT. Soit $k$ fix√© (dans ce TP on va prendre uniquement $k\in \{2,3\})$ et √©tant donn√©es $n$ variables bool√©ennes $x_1,x_2,\dots,x_n \in \{\text{Vrai},\text{Faux}\}$, on consid√®re les formules bool√©ennes de la forme ($\vee$ signifie 'ou' et $\wedge$ signifie 'et')<br><br>
$$
(z_{1,1} \vee z_{1,2} \vee \dots \vee z_{1,k}) \wedge \dots \wedge (z_{M,1} \vee z_{M,2} \vee \dots \vee z_{M,k})
$$

<br>
o√π

* $M$ est un entier quelconque 
* pour chaque $1\leq m\leq M$ et chaque $i\leq k$ on a

<br>

$$
z_{m,i}\in \big\{x_1,x_2,\dots,x_n,\overline{x_1},\overline{x_2},\dots,\overline{x_n}\big\}.
$$

(La notation $\overline{x}$ d√©signe la n√©gation de $x$.)
Chaque terme $(z_{m,1} \vee z_{m,2} \vee \dots \vee z_{m,k})$ est appel√©e une clause. 

Par exemple pour $2$-SAT avec $n=5$ variables, une formule √† $M=3$ clauses est donn√©e par

<br><br>
$$
F=(x_1 \vee \overline{x_5}) \wedge (x_2 \vee x_3)  \wedge (\overline{x_1} \vee x_2) 
$$
<br>

Une <i>affectation</i> est une fonction $x_1,x_2,\dots,x_n \in \{\text{Vrai},\text{Faux}\}$. S'il existe une affectation qui rende $F$ vraie on dit que $F$ est **satisfiable**.

Dans le cas de l'exemple ci-dessus, une <i>affectation</i> des variables qui rende $F$ vraie est :
$$
x_1=\text{Faux},\ x_2=\text{Vrai},\ x_3=\text{Faux},\ x_4=\text{Faux},\ x_5=\text{Faux}.
$$

Sp√©cifiquement, le probl√®me $k$-SAT est de trouver un algorithme qui, √©tant donn√©e une formule $F$, trouve une affectation des variables qui rende $F$ vraie (ou qui retourne `impossible` si une telle affectation n'existe pas). Le probl√®me 2-SAT est polynomial alors que 3-SAT est NP-complet (voir par exemple : S.Perifel. Complexit√© algorithmique. Ellipses (2014))

<div markdown=1 class="DoIt"> 

Ecrire des fonctions `ClauseVraie(Clause,Affectation,nb_variables)` et `FonctionVraie(Formule,Affectation,nb_variables)` qui prennent en entr√©e des clauses ou formules et une affectation, et calcule si la clause/formule est vraie ou pas.

On pourra repr√©senter les formules sous la forme de liste :
```
Formule = [Clause1,Clause2,...,ClauseM]
```
o√π chaque `Clause` est de la forme
```
Clause = [z_1,...,z_k]
```
et chaque $z_i$ est un bool√©en. Dans les clauses on peut num√©roter les bool√©ens de $0$ √† $n-1$ pour $x_1, \dots,x_n$ et de $n$ √† $2n-1$ pour leurs n√©gations. Pour l'exemple plus haut :
```
F=[[0,9],[1,2],[5,1]]
```
car (par exemple) $\overline¬†{x_5}$ est cod√© par $9$. L'affectation donn√©e en exemple est alors
```
[0,1,0,0,0]
```

In [3]:
####################################
# ---- tester une clause
####################################

def ClauseVraie(
    Clause,
    Affectation,
    nb_variables
):
    
    for idx, val in enumerate(Clause):
        if val < nb_variables:
            if Affectation[val]:
                return True
        
        else:
            var = val - nb_variables
            if not Affectation[var]:
                return True
            
    return False


# Test
n=2
Clause1=[0,1]  # x_1 ou x_2
Clause2=[2,1]  # non(x_1) ou x_2
Clause3=[2,3]  # non(x_1) ou non(x_2)
        
Affectation1=[1,0] # x_1 vraie et x_2 fausse

print(ClauseVraie(Clause1,Affectation1,n)) # doit renvoyer True
print(ClauseVraie(Clause2,Affectation1,n)) # doit renvoyer False
print(ClauseVraie(Clause3,Affectation1,n)) # doit renvoyer True

True
False
True


In [5]:
####################################
# ---- tester une formule
####################################

def FormuleVraie(Formule,Affectation,nb_variables):
    for clause in Formule:
        if not ClauseVraie(clause, Affectation, nb_variables):
            return False
    
    return True
        

# test
Formule1=[Clause1,Clause2]
Formule2=[Clause1,Clause3]
Formule3=[Clause2,Clause3]
print([FormuleVraie(f,Affectation1,2) for f in [Formule1,Formule2,Formule3]]) # Doit renvoyer [False, True, False]

# test
Formule=[[0,9],[1,2],[5,1]]
Affectation=[0,1,0,0,0]
print(FormuleVraie(Formule,Affectation,5)) # Doit renvoyer True

[False, True, False]
True


<a id="WalkSat"></a>
## 2-SAT : l'algorithme WalkSat

Le probl√®me 2-SAT est polynomial, donc "simple" √† r√©soudre. Nous allons voir qu'un algorithme probabiliste extr√™mement na√Øf en vient (presque) √† bout.<br><br>
<b>Algorithme WalkSat</b> <br>
<b>entr√©es :</b> Formule $F$ √† $M$ clauses sur $n$ variables.<br>
<b>param√®tre :</b> $T$ entier<br>
<b>sortie :</b> 
* Si c'est possible, renvoyer une affectation qui rende $F$ vraie
* Sinon, renvoyer `je n'ai pas trouv√©`.

1. Initialisation : 
    - On tire une affectation `Affectation`$=(x_1,\dots,x_n)$ uniforme au hasard dans $\{\text{Vrai},\text{Faux}\}^n$
    - On pose Compteur $= 0$.
2. Tant que Compteur < $2Tn^2$  : 
  * 2a) Chercher la premi√®re clause non satisfaite
  * 2b) Dans cette clause, choisir une variable $x_i$ uniform√©ment au hasard et la changer de valeur : $x_i \leftarrow \text{non}(x_i)$.
  * 2c) Si `Affectation` rend la formule vraie, renvoyer `Affectation`
  * 2d) Compteur = Compteur $+ 1$.
3. Renvoyer `je n'ai pas trouv√©`

<i>(La raison pour laquelle on √©crit le nombre de boucles sous la forme $2Tn^2$ appara√Ætra √† la partie suivante.)</i>


<div markdown=1 class=Rmk>

**Attention** L'algorithme WalkSat n'est pas tout √† fait correct. Lorsque WalkSat renvoie `je n'ai pas trouv√©`, cela ne signifie pas forc√©ment que la formule n'est pas satisfiable mais peut-√™tre simplement que l'algorithme n'a pas cherch√© assez longtemps.

<div markdown=1 class="DoIt"> 

Ecrire une fonction `UneEtapeWalkSat(n_var,Formule,Affectation)` qui effectue une fois les op√©rations 2a)-2b)-2c) dans la description de l'Algorithme WalkSat.

In [34]:
np.random.randint(0,2, size = 10)

array([0, 0, 0, 0, 1, 0, 0, 0, 1, 0])

In [35]:
def UneEtapeWalkSat(
    n_var,
    Formule,
    Affectation
):
    if FormuleVraie(Formule, Affectation, n_var):
        return Affectation
    for clause in Formule:
        if not ClauseVraie(clause, Affectation, n_var):
            idx = np.random.randint(0, len(clause))
            clause[idx] = not clause[idx]
            break

    if FormuleVraie(Formule, Affectation, n_var):
        return Affectation

In [37]:
UneEtapeWalkSat(2, Formule1, [1,0])

[1, 0]

In [38]:
FormuleVraie(Formule1,
             [1,0],
             2)

True

<a id="ChoixT"></a>
## WalkSat : choix du param√®tre $T$

Rappelons les propri√©t√©s suivantes de l'algorithme WalkSat appliqu√© √† une formule $F$ √† $n$ variables :
   - Si $F$ est fausse, l'algorithme renvoie `impossible`
   - Si $F$ est satisfiable
      * Avec une proba que l'on va noter $p(n,T,F,\mathbf{x})$ o√π $\mathbf{x}=(x_1,\dots,x_n)$ est l'affectation initiale, l'algorithme se trompe et renvoie `impossible`
      * Avec une proba $1-p(n,T,F,\mathbf{x})$ il renvoie une affectation correcte.
   
On note 
$$
p_\star(n,T) = \max_{F\text{ satisfiable},\mathbf{x}} p(n,T,F,\mathbf{x}) 
$$
o√π $\mathbf{x}=(x_1,\dots,x_n)$ est l'affectation initiale.

Tout l'enjeu est d'avoir une bonne majoration de $p_\star(n,T)$ en fonction de $T$.

Fixons une formule $F$ satisfiable, et fixons √©galement une affectation $(y_1,\dots,y_n)$ correcte pour $F$. Pour $t\geq 0$ on note $(x_1^t,\dots,x_n^t)$ l'affectation de WalkSat √† l'instant $t$.<br>
<!--<i>(Rappelons que $(x_1^0,\dots,x_n^0)$ sont uniformes ind√©pendants.)</i><br>-->
Soit 
$$
D_t = \mathrm{card} \{ i \text{ tels que } x_i^t \neq y_i\}.
$$
Le processus $(D_t)_{t}$ est un processus al√©atoire √† valeurs dans $\{0,1,\dots,n\}$, lorsqu'il touche $0$ alors on a trouv√© une affectation pour $F$. On introduit le temps al√©atoire :

$$
\tau_E = \min\{t, (x_1^t,\dots,x_n^t)\text{ est une affectation correcte.}\}
$$

<div markdown=1 class="DoIt">

**(Th√©orie)** 

Soit $(S_t)_{t}$ le processus d√©fini de la fa√ßon suivante :

   - $S_0=n$ 
   - Si $S_t=n$, alors $S_{t+1}=n-1$ 
   - Si $S_t=0$ alors $S_{t+1}=0$
   - Sinon $S_t$ vaut $S_t -1$ ou $S_t + 1$ avec probabilit√© $1/2$, ind√©pendamment du pass√©.
   
Ainsi $(S_t)$ est la marche al√©atoire sym√©trique sur l'intervalle $[0,n]$, r√©fl√©chie en $n$ et absorb√©e en $0$. On note 
<br>
<br>
$$
\tau_S = \min\{t, S_t=0\}.
$$
<br>

D√©montrer que dans un certain sens $\tau_E$ a tendance √† arriver plus t√¥t que $\tau_S$. Formellement, pour tout $t$,
<br><br>

$$
\mathbb{P}(\tau_E\geq t) \leq \mathbb{P}(\tau_S\geq t).
$$
<i>(Il n'est pas facile de r√©diger soigneusement cette question, essayez plut√¥t de vous convaincre que c'est vrai!)</i>

<img src="figures/MarchesAleatoires.jpg" style="width:600px;"/>


Entre l'instant $t$ et l'instant $t+1$, il est plus probable que $D_{t+1}$ diminue de 1 unit√© par rapport √† $D_t$ que $S_{t+1}$ diminue de 1 unit√© par rapport √† $S_t$. Cette observation d√©coule du fait que:

$$
\mathbb{P}(S_{t+1} < S_t) = \frac{1}{2}
$$

Et pour $D_t$, chaque clause qui est fausse offre deux possibilit√©s : soit les deux √©l√©ments de la clause ne correspondent pas √† l'affectation, soit un seul √©l√©ment ne correspond pas. Par cons√©quent, nous avons :

$$
\mathbb{P}(D_{t+1} < D_t) \geq \frac{1}{2}
$$

Ainsi, il est plus probable que $D_t$ atteigne 0 avant que $S_t$ n'atteigne 0, ce qui signifie :

$$
\mathbb{P}(\tau_E\geq t) \leq \mathbb{P}(\tau_S\geq t).
$$


<div markdown=1 class="DoIt"> 

**(Th√©orie)**

Dans la section suivante vous allez v√©rifier num√©riquement que pour tout $n\geq 10$ alors
$$
\mathbb{P}(\tau_S\leq 2n^2) \geq  0.89.
$$
Gr√¢ce aux questions pr√©c√©dentes cela implique que
$$
\mathbb{P}(\tau_E\leq 2n^2) \geq  0.89.\qquad (\star)
$$

En utilisant $(\star)$, d√©terminer $T$ pour que pour toute formule satisfiable $F$ alors
$$
\mathbb{P}(\mathrm{WalkSat}\text{ trouve une affectation pour }F)\geq 1-\varepsilon.
$$
**Application num√©rique.**
Trouver $T$ pour que
$$
\mathbb{P}(\mathrm{WalkSat}\text{ trouve une affectation pour }F)\geq 99,99\%
$$

On si souvient que 

$$
    \tau_{E} = \min \{ t, (x_1^T, \dots, x_n^T)\} \text{ est vraie}
$$

Donc 

$$
\begin{aligned}
    \mathbb{P}(\text{WalkSat trouve une affectation pour } F) &= \mathbb{P}(\text{WalkSat trouve une affectation pour } F \text{ dans $2n^2T$ it√©rations}) \\
    & = \mathbb{P} (\tau_E < 2n^2 T) \\
    & = 1 - \mathbb{P}(\tau_E > 2n^2 T) \\
    & = 1 - \mathbb{P}(\tau_E > 2n^2 )^T
\end{aligned}
$$

Donc, il faut que 

$$
    \mathbb{P}(\tau_E > 2n^2)^T \leq \varepsilon
$$

$$ 
    T = \frac{\log{\varepsilon}} {\log \mathbb{P}(\tau_E > 2n^2)}
$$

In [41]:
# Application num√©rique
T = np.log(1e-4)/np.log(1 - 0.89)
T

4.172720088892945

<div markdown=1 class="DoIt"> 

**(Th√©orie)** Mais au fait, pourquoi la strat√©gie WalkSat ne marche pas pour $3$-SAT?

<div markdown=1 class="Answers"> 

<a id="Annexe"></a>
# Calcul de $\mathbb{P}(\tau_S\leq \lambda  ùëõ^2)$ (matrices de transition)

Rappelons que $(S_t)$ est la marche al√©atoire sym√©trique partant de $n$, r√©fl√©chie en $n$ et absorb√©e en $0$. On note $\tau_S = \min\{t, S_t=0\}$.

Pour d√©terminer $T$ nous avons eu besoin d'estimer num√©riquement la probabilit√© $\mathbb{P}(\tau_S\leq 2 ùëõ^2)$. Nous allons pour cela utiliser une matrice de transition. Pour $t\geq 0$ et $0\leq i,j\leq n$ on note
<br><br>
$$
p_{i,j}^{(t)}=\mathbb{P}\left(\text{ en partant de $i$, }S_t=j\right).
$$


<div markdown=1 class="DoIt"> 

1. Soit $0\leq i\leq n$, $1\leq j\leq n-1$ et $t\geq 0$. Justifier que
$$
p^{(t)}_{i,j}=\tfrac{1}{2}p^{(t-1)}_{i,j-1}+\tfrac{1}{2}p^{(t-1)}_{i,j+1}.
$$

2. R√©fl√©chir rapidement au cas $j=0$ ou $j=n$ dans l'√©quation suivante et en d√©duire qu'il existe une matrice $Q_n$ de taille $(n+1)\times (n+1)$ telle que pour tous $t,i,j$,

$$
p^{(t)}_{i,j}= (Q_n^t)_{i,j}.
$$
Cette matrice $Q_n$ est appell√©e matrice de transition du processus $(S_t)$.

3. Ecrire $\mathbb{P}(\tau_S\leq t)$ en fonction de $Q_n$. En d√©duire un code python qui calcule $\mathbb{P}(\tau_S\leq 2 n^2)$ de fa√ßon exacte et v√©rifier sur un graphique que cette probabilit√© semble converger lorsque $n\to +\infty$. 

1. 


√áa c'est a cause de que, √©tant donn√© que nous sommes √† la position $ S_t = j$ au temps $t$, on a une probabilit√© de $1/2$ d'√™tre √† la position $S_{t-1} = j+1$ et $1/2$ d'√™tre √† la position $S_{t-1} = j -1$. 

2. 

Quand $j = 0$

$$
    p^{(t)}_{i,0}=\frac{1}{2}p^{(t-1)}_{i,1}.
$$

Quand $ j = n $

$$
    p^{(t)}_{i,n}=\frac{1}{2}p^{(t-1)}_{i,n-1}.
$$

    

$$
    (Q_n^t)_{i,j} = \begin{cases} 
        \frac{1}{2} (Q_n^{(t-1)})_{i,j-1} + \frac{1}{2} (Q_n^{(t-1)})_{i,j+1} \text{ si $0 < j < n$} \\
        \frac{1}{2} (Q_n^{(t-1)})_{i,j-1} \text{ si $j = n$} \\
        \frac{1}{2} (Q_n^{(t-1)})_{i,j+1} \text{ si $j = 0$} 
    \end{cases}
$$

Et, pour la valeur initiale

$$
    (Q_n^0)_{i,j} = \mathbf{I}_{n+1}
$$

De plus, 

$$
    \mathbb{P}(\tau_S < t) = \sum_{k = 1}^t (Q_n^{t-1})_{n, 0}
$$

In [51]:
# Queston 3
n = 5
T = int(2*n**2)
Q_vec = [np.zeros([n+1,n+1]) for i in range(T)]


In [52]:
Q_vec[0] = np.eye(n+1)
for t in range(1,T):
    for i in range(n+1):
        for j in range(n+1):
            if j >1 and j < n-1:
                Q_vec[t][i][j] = Q_vec[t-1][i][j+1]*1/2 + Q_vec[t-1][i][j-1]*1/2 
            elif j ==0 :
                Q_vec[t][i][j] = Q_vec[t-1][i][j+1]*1/2
            elif j == 1:
                Q_vec[t][i][j] = Q_vec[t-1][i][0] + Q_vec[t-1][i][2]*1/2
            elif j == n:
                Q_vec[t][i][j] = Q_vec[t-1][i][j-1]*1/2
            elif j == n-1:
                Q_vec[t][i][j] = Q_vec[t-1][i][j-1]*1/2 + Q_vec[t-1][i][j+1]

In [67]:
Q_vec[25]

array([[0.        , 0.40323585, 0.        , 0.39876401, 0.        ,
        0.19800013],
       [0.20161793, 0.        , 0.40099993, 0.        , 0.39738214,
        0.        ],
       [0.        , 0.40099993, 0.        , 0.39961806, 0.        ,
        0.19938201],
       [0.19938201, 0.        , 0.39961806, 0.        , 0.40099993,
        0.        ],
       [0.        , 0.39738214, 0.        , 0.40099993, 0.        ,
        0.20161793],
       [0.19800013, 0.        , 0.39876401, 0.        , 0.40323585,
        0.        ]])

In [56]:
s = 0
for k in range(T):
    s+=Q_vec[k][n][0]

In [57]:
s

4.200023413292708

<a id="Transition"></a>
# Application : Illustration de la transition de phase

Le probl√®me $2$-SAT al√©atoire (lorsque les formules sont tir√©es al√©atoirement et uniform√©ment) pr√©sente un ph√©nom√®ne de <i>transition de phase</i>. Pour √™tre plus formel nous introduisons quelques notations.<br><br>
Il y a $\binom{2n}{2}^M$ formules diff√©rentes avec $M$ clauses et $n$ variables (on consid√®re que l'ordre des clauses compte, mais pas l'ordre des variables dans une clause). Notons
$$
p(n,M)
$$
la probabilit√© qu'une formule al√©atoire uniforme parmi les $\binom{2n}{2}^M$ formules diff√©rentes soit vraie. 
On a bien s√ªr $p(n,M)$ qui est d√©croissante en $M$ (plus il y a de clauses plus c'est difficile d'√™tre vraie).

Pour $c>0$ on a, lorsque $n\to +\infty$ :
$$
p(n,c\times n)\to
\begin{cases}
1 &\text{ si }c<1\\
0 &\text{ si }c>1
\end{cases}
$$

R√©f√©rence : GENT, Ian P. et WALSH, Toby. The SAT phase transition. In : <i>ECAI</i>, 1994. p. 105-109.

<div markdown=1 class="DoIt"> 

1. Ecrire une fonction `TirerClause(k,nb_variables)` qui prend en entr√©es deux entiers $k,n$ et renvoie une clause de $k$-SAT √† $n$ variables, uniform√©ment au hasard.
2. Ecrire une fonction `TirerFormule(k,nb_variables,M)` qui renvoie une formule de $M$ clauses de $k$-SAT √† $n$ variables, uniform√©ment au hasard.

<br>
<i>(On consid√®re qu'il y a $\binom{2n}{2}^M$ formules diff√©rentes avec $M$ clauses et $n$ variables : l'ordre des clauses compte, mais pas l'ordre des variables dans une clause.)</i>

<div markdown=1 class="DoIt"> 

1. Ecrire un solveur WalkSat qui avec le param√®tre $T$ choisi √† l'exercice pr√©c√©dent.
2. En utilisant des simulations et le solveur WalkSat, illustrer la transition de phase en $c=1$.