# Walnut
### une histoire d'écureuils $k$-reconnaissables 🐿

#### Nicolas Ollinger, LIFO, U. Orléans
<img style="width:15%; height: auto;" src="img/lifo.png">
<img style="display:block; position:absolute; float:right; right:0px; bottom:50px; z-index:2;" src="img/gobinder.png">

### Journées C_SyDiSi, 13 mars 2023

## tl;dr

<b class="cool">Walnut</b> est une calculatrice _open source_ pour les <b class="cool">arithmétiques de Büchi</b> développée par J. Shallit _et al_ pour servir d'assistant de preuve en <b class="cool">combinatoire des mots</b>.

https://cs.uwaterloo.ca/~shallit/walnut.html

Cet outil peut se révéler intéressant dans le contexte <b class="cool">automates cellulaires</b> / <b class="cool">pavages auto-similaires</b>.

**Aujourd'hui :** un peu de contexte + démonstration/TP

<img src="img/bru.png" width="60%" style="margin:auto">

# 1. Théorie

## Coloriages de l'espace

**Définition**  Un <b class="cool">coloriage</b> $\mathcal{C}$ de $\mathbb{N}^d$ est une application de $\mathbb{N}^d$ dans un alphabet fini $\Sigma$ (_les couleurs_).

**Remarque**  Un <b class="cool">prédicat</b> $P(x_1,\ldots, x_d)$ sur $\mathbb{N}^d$ est un <b class="cool">coloriage</b> à deux couleurs : **VRAI** et **FAUX**.

**Remarque**  Un <b class="cool">sous-ensemble</b> de $\mathbb{N}^d$ est donc lui aussi assimilable à un <b class="cool">coloriage bicolore</b> et un coloriage sophistiqué $\mathcal{C}$ est équivalent à une collection finie de sous-ensembles $\mathcal{C}_a$, $\mathcal{C}_b$, $\ldots$ qui <b class="cool">partitionnent</b> $\mathbb{N}^d$.

## Codage des entiers en base $k$

On peut coder les entiers <b class="cool">en base $k$</b> sur l'alphabet $\Sigma_k = \{0,1,\ldots,k-1\}$ avec la convention <b class="cool">grand-boutiste</b> ou petit-boutiste.

Pour coder des <b class="cool">tuples</b>, sous forme de mots, il suffit de considérer des mots sur l'alphabet $\Sigma_k^d$ obtenus en empilant les codages des éléments du tuple après avoir ajouté des <b class="cool">$0$ non significatifs</b> pour que tous les éléments à empiler aient même longueur.

$$
(54,100) \mbox{ en base 2 : } \begin{pmatrix}0\\1\end{pmatrix}\begin{pmatrix}1\\1\end{pmatrix}\begin{pmatrix}1\\0\end{pmatrix}\begin{pmatrix}0\\1\end{pmatrix}\begin{pmatrix}1\\1\end{pmatrix}\begin{pmatrix}1\\1\end{pmatrix}\begin{pmatrix}0\\0\end{pmatrix}
$$

## Coloriages en base $k$

**Définition**  La <b class="cool">$k$-représentation</b> d'un coloriage $\mathcal{C} : \mathbb{N}^d\rightarrow\Sigma$ associe à tout mot de $\Sigma_k^d$ la couleur de la case de $\mathcal{C}$ dont il code les coordonnées.

$$
R_2 :
\begin{pmatrix}0\\1\end{pmatrix}\begin{pmatrix}1\\1\end{pmatrix}\begin{pmatrix}1\\0\end{pmatrix}\begin{pmatrix}0\\1\end{pmatrix}\begin{pmatrix}1\\1\end{pmatrix}\begin{pmatrix}1\\1\end{pmatrix}\begin{pmatrix}0\\0\end{pmatrix} \mapsto \mathcal{C}(54,110)
$$

## Automates finis à sortie

**Définition**  Un <b class="cool">automate fini à sortie</b> est un tuple $(Q,\Sigma,\Gamma,\delta,q_0,\pi)$ où
 - $Q$ est l'ensemble fini des états ;
 - $\Sigma$ est l'alphabet fini d'entrée ;
 - $\Gamma$ est l'alphabet fini de sortie ;
 - $\delta : Q\times\Sigma \rightarrow Q$ est la fonction de transition ;
 - $q_0\in Q$ est l'état initial ;
 - $\pi : Q \rightarrow \Gamma$ est la fonction de sortie.

Un tel automate $(Q,\Sigma,\Gamma,\delta,q_0,\pi)$ <b class="cool">calcule</b> la fonction $f : \Sigma^* \rightarrow\Gamma$ qui à tout mot $u$ associe $\pi(\delta^*(q_0,u))$ où
$$
\begin{cases}\delta^*(q,\epsilon)&=&q\\\delta^*(q,au) &=& \delta^*(\delta(q,a),u)\end{cases}
$$

**Définition**  Un <b class="cool">coloriage</b> $\mathcal{C}$ de $\mathbb{N}^d$ est $k$-automatique s'il existe un automate fini à sortie qui calcule sa $k$-représentation.

## Étudier leurs propriétés

Comment vérifier les <b class="cool">propriétés</b> des coloriages automatiques ?

Comment indentifier les tuples qui pour lesquels une <b class="cool">propriété</b> est vraie ?

Les travaux de <b class="cool">Büchi</b> _et al_ dans les années 60 ont inité l'exploration des liens entre <b class="cool">automates finis</b>, <b class="cool">logiques</b>, <b class="cool">arithmétique</b>, ...

<img src="img/buchi.png" width="100%" style="margin:auto">

## Automates et logique

L'état de l'art _logic and $p$-recognizable sets of integers_ de <b class="cool">Bruyère</b> _et al_ synthétise de manière très lisible l’ensemble des résultats classiques sur la caractérisation des ensembles de nombres reconnaissables par automates en base $p$.

http://ftp.gwdg.de/pub/EMIS/journals/BBMS/Bulletin/bul942/BRU.PDF

<img src="img/bru.png" width="100%" style="margin:auto">

## Théorème d'équivalence

**Théorème 5.1** Soit $k\geqslant 2$ un entier et $\mathcal{C} : \mathbb{N}^d \rightarrow \Sigma$ un coloriage de $\mathbb{N}^d$. Les affirmations suivantes sont équivalentes :
 1. $s$ est engendré par une <b class="cool">$k$-substitution</b> ;
 2. $s$ est <b class="cool">$k$-automatique</b> ;
 3. $s$ est <b class="cool">$k$-définissable</b> ;
 4. $s$ est <b class="cool">$k$-algébrique</b> (uniquement si $k$ premier).

À défaut d'être profonde, l'équivalence $(1) \Leftrightarrow (2)$ est pratique : un automate à sortie en base $k$ n'est rien d'autre que le <b class="cool">codage</b> d'un <b class="cool">morphisme $k$-uniforme prolongeable</b>.

## Arithmétiques de Büchi

L'<b class="cool">arithmétique de Büchi</b> en base $k$ est la théorie du premier ordre des nombres entiers naturels munis de l'addition et de la fonction $V_k$ qui à $x\neq 0$ associe la plus grande puissance de $k$ qui divise $x$.

Un coloriage $\mathcal{C}$ est <b class="cool">$k$-définissable</b> si pour toute lettre $a\in\Sigma$ il existe une formule du premier ordre $\varphi_a$ de $\left<\mathbb{N},+,V_k\right>$ telle que

$$
\mathcal{C}^{-1}(a) = \left\{ z\in\mathbb{N}^d \middle| \left<\mathbb{N},+,V_k\right> \models \varphi_a(z) \right\}
$$

L'équivalence $(2) \Leftrightarrow (3)$ repose sur la transformation des automates en formules et réciproquement.

## Arithmétiques de Presburger, Peano, etc

**Théorème de Cobham-Semenov** Si un coloriage est reconnaissable dans deux bases <b class="cool">multiplicativement indépendantes</b> alors il est définissable dans $\left<\mathbb{N},+\right>$, l'<b class="cool">arithmétique de Presburger</b>.

La notion d'automaticité se généralise à d'autres <b class="cool">systèmes de numérations</b>. Le théorème liant reconnaissance et définissabilité se généralise dès lors qu'on dispose :
 - d'un <b class="cool">langage régulier</b> $R$ codant les entiers ;
 - d'un <b class="cool">automate réalisant l'addition</b> relationnelle $+_R(x,y,z)$ ;
 - d'un <b class="cool">automate réalisant l'ordre</b> relationnel $<_R(x,y)$.

<center style="font-size: 600%">🐿</center>

# 2. TP Walnut

## Walnut

Un outil pour manipuler :
 - des <b class="cool">coloriages automatiques</b> (DFAO, morphismes) ;
 - des <b class="cool">prédicats</b> (DFA, formules du premier ordre) ;
 - les combiner pour définir de nouveaux prédicats ;
 - vérifier la valeur de vérité d'un prédicat sans variable libre ;
 - calculer les valeurs qui satisfont un prédicat.

## Thue-Morse est sans recouvrement



$$
\begin{eqnarray*}
t &:& a \mapsto ab, \qquad b \mapsto ba\\
\mathcal{T} &=& abbabaabbaababbabaababbaabbabaab...
\end{eqnarray*}
$$

Un recouvrement est un facteur qui se chevauche :

$$\mathcal{T}[i:i+n] = \mathcal{T}[j:j+n]\quad\mbox{avec}\quad i<j<i+n$$

In [19]:
def factoreq "Ak k<n => T[i+k]=T[j+k]";




In [20]:
eval recouvrement "Ei,j,n i<j & j<i+n & $factoreq(i,j,n)";c

_____
FALSE



## Thue-Morse et les carrés


Un carré est un facteur de la forme $uu$.

In [21]:
def square "n>0 & $factoreq(i,i+n,n)":

n>0:2 states - 2ms
 (n>0&factoreq(i,(i+n),n))):5 states - 0ms
Total computation time: 3ms.



In [22]:
%showme square

## Thue-Morse est synchronisant(?)


Il existe une taille de facteur qui suffit à connaître sa parité dans Thue-Morse.

In [33]:
def samepar "Ea,b,c i=2*a+b & j=2*c+b";
def sync "n>0 & Ai,j $factoreq(i,j,n) => $samepar(i,j)";





In [35]:
eval smallest "$sync(n) & ~ $sync(n-1)";




In [36]:
%showme smallest

<img src="img/alarob.png" width="50%" style="margin:auto">

# 3. Motivation

<img src="img/cie17.png" width="100%" style="margin:auto">

<img src="img/2rec.png" width="100%" style="margin:auto">

<img src="img/compwin.png" width="100%" style="margin:auto">

<img src="img/chair.png" width="100%" style="margin:auto">

<img src="img/labbe.png" width="100%" style="margin:auto">

## Ça pave

In [39]:
eval ValidTiling "?msd_fibsq Ai,j LabbeE[i][j]=LabbeW[i+1][j] & LabbeN[i][j]=LabbeS[i][j+1]":

LabbeE[i][j]=LabbeW[(i+1)][j]:4 states - 14ms
 LabbeN[i][j]=LabbeS[i][(j+1)]:4 states - 11ms
  (LabbeE[i][j]=LabbeW[(i+1)][j]&LabbeN[i][j]=LabbeS[i][(j+1)]):4 states - 0ms
   (A i , j (LabbeE[i][j]=LabbeW[(i+1)][j]&LabbeN[i][j]=LabbeS[i][(j+1)])):1 states - 2ms
Total computation time: 30ms.
____
TRUE



## Le coloriage est apériodique

In [38]:
eval Aperiodic "?msd_fibsq Adi,dj di+dj>0 => Ei,j ~Labbe[i][j]=Labbe[i+di][j+dj]":

computed ~:1 states - 1ms
(di+dj)>0:5 states - 7ms
 Labbe[i][j]=Labbe[(i+di)][(j+dj)]:1825 states - 2583ms
  ~Labbe[i][j]=Labbe[(i+di)][(j+dj)]:1825 states - 495ms
   (E i , j ~Labbe[i][j]=Labbe[(i+di)][(j+dj)]):5 states - 1316ms
    ((di+dj)>0=>(E i , j ~Labbe[i][j]=Labbe[(i+di)][(j+dj)])):4 states - 0ms
     (A di , dj ((di+dj)>0=>(E i , j ~Labbe[i][j]=Labbe[(i+di)][(j+dj)]))):1 states - 1ms
Total computation time: 4485ms.
____
TRUE



## Explosion combinatoire

In [None]:
eval factoreq "?msd_fibsq Adi,dj (di<n & dj<n) => Labbe[i+di][j+dj]=Labbe[u+di][v+dj]"::

## Un peu de lecture pour la route

<img src="img/cover.jpg" width="30%" style="margin:auto; display:inline"> <img src="img/auto.png" width="27%" style="margin:auto;display: inline">