# TP 1 : Implémentation d'une structure d'ensemble à l'aide d'une représentation binaire (*bit field*)

On rappelle qu'un `uint` est un entier non-signé (positif). Ils sont stockés sur $4$ octets, soit $4\times 8 = 32$ bits :

In [1]:
uint x = 18;
sizeof(x) // 4 octets

4

On rappelle qu'un `uint` est stocké en mémoire en base 2. Ainsi, $10$ est stocké comme $1010_2$.  
Dans ce TP, on utilise la représentation binaire des entiers positifs pour coder des ensembles : à chaque entier écrit en base 2 on associe l'ensemble dont les éléments sont les positions des bits égaux à 1.  
Par exemple, $1010_2$ a deux bits égaux à $1$, en positions $1$ et $3$ (la position 0 étant celle du chiffre des unités, tout à droite). Donc l'entier $1010_2$, c'est-à-dire $10$, représente l'ensemble $\{1, 3\}$.  
Comme un `uint` est stocké sur $32$ bits, cette méthode permet donc de coder n'importe quel sous-ensemble de $\{0, ..., 31\}$ sous forme d'un `uint`.  
Pour les questions suivantes, on pourra utiliser `&`, `|`, `<<`, `~` (voir 1er cours de C).

## Petites questions

1. Par quel entier est codé l'ensemble $\{0, 3, 4\}$?
2. Quel est l'ensemble codé par l'entier $26$ ?
3. Écrire une fonction `singleton` telle que `singleton(i)` renvoie l'entier représentant $\{i\}$, c'est-à-dire $2^i$ ($= 1\underbrace{0...0}_i {}_2$).

1. L'entier codé par l'ensemble {0,3,4} est $11001_2$, ce qui donne en base 10: $25$
2. L'ensemble codé par $26$ est {1,3,4}

In [1]:
int singleton(int i){
    return 1<<i;
}
singleton(2)

4

## Union, intersection, appartenance

1. Écrire une fonction `union2` telle que, si `s1` et `s2` sont deux entiers représentants des ensembles, `union2(s1, s2)` renvoie un entier représentant leur union.  
2. Faire de même pour l'intersection de deux ensembles.  
3. Écrire une fonction `has` telle que `has(s, e)` détermine si l'entier `e` appartient à l'ensemble représenté par l'entier `s`.  

In [4]:
int unions(int s1, int s2){
    return s1 | s2;
}
unions(2, 4)

6

In [5]:
int intersection(int s1, int s2){
    return s1 & s2;
}
intersection(2, 4)

0

In [15]:
bool has(int e, int s){
    if ((e&s) == e){
        return true;
    }
    else{
        return false;
    }
}
has(2,5)

false

## Algorithme de Kernighan

1. Si $n = 1011100_2$, que vaut $n$ & $(n - 1)$ ? Quel est le lien entre l'écriture de $n$ et celle de $n$ & $(n - 1)$ ?
2. En s'inspirant de la question précédente, écrire une fonction `card` telle que `card(n)` renvoie le nombre de 1 dans l'écriture binaire de `n`. Cette fonction sera linéaire en le nombre de 1 dans l'écriture binaire de `n`. (Remarque : `card` renvoie donc le cardinal (taille) de l'ensemble codé par l'entier en argument)  
3. Un des intérêts de cette représentation binaire des ensembles est qu'il est facile d'énumérer tous les sous-ensembles de $\{0, ..., 31\}$, en faisant une boucle `for` sur les entiers de $0$ à $2^{32} - 1$. Calculer ainsi la somme des cardinaux de tous les sous-ensembles de $\{0, ..., 31\}$. Quel nombre retrouve t-on?  

1. Si $n = 1011100_2$ alors $n$ & $(n-1)$ = $1011000_2$
Le n&(n-1) va supprimer le 1 le plus à droite.

In [22]:
uint card(int n, int somme){
    if (n == 0){
        return somme;
    }
    else{
        return card((n&n-1),(somme+1));
    }
}
card(92, 0)

4

In [None]:
uint nb = 0;
for (uint i = 1;i <= 4294967294; i++) {
    nb = nb + (card(i, 0));
}

## Bit de poids faible

1. Si `x` est un entier positif, que permet d'obtenir l'instruction `x & (~x + 1)` ? On pourra essayer sur des exemples.  
2. Montrer qu'on pourrait utiliser `x & -x` au lieu de `x & (~x + 1)` (c'est-à-dire que les deux instructions donnent la même chose), en sachant que `-x` est stocké par complément à 2 (voir cours à ce sujet).

1. L'instruction permet de savoir si un nombre est pair ou impair. 
Si le nombre est pair, l'instruction renvoie $2$ sinon il renvoie $1$.

In [24]:
int test(int x){
    return (x & (~x+1));
}

In [25]:
test(5)

1

In [30]:
test(10)

2

In [31]:
int test2(int x){
    return (x & -x);
}

In [32]:
test2(5)

1

In [34]:
test2(10)

2

2. Si un nombre est pair, ce nombre et son opposé ont comme intersection le deuxème bit, $a$ & $-a$ va donc toujours renvoy 2.
Pour les nombres impairs, le seul bit en commun est le premier, tel que $a$ & $-a$ va toujours renvoyer 1