# <center><a href='https://mybinder.org/v2/gh/fortierq/binder-mp2i/main?urlpath=git-pull%3Frepo%3Dhttps%253A%252F%252Fgithub.com%252Faugustin64%252Fmp2i-2021%26urlpath%3Dlab%252Ftree%252Fmp2i-2021%252Fpersonnal%252F4_c%252F1_bitfield.ipynb%26branch%3Dmain'>TP 1 : Implémentation d'une structure d'ensemble à l'aide d'une représentation binaire (*bit field*) <img src=https://mybinder.org/badge.svg></a></center>

On rappelle qu'un `uint` est un entier non-signé (positif). Ils sont stockés sur $4$ octets, soit $4\times 8 = 32$ bits :

In [1]:
uint x = 18;
sizeof(x) // 4 octets

4

On rappelle qu'un `uint` est stocké en mémoire en base 2. Ainsi, $18$ est stocké comme $1010_2$.  
Dans ce TP, on utilise la représentation binaire des entiers positifs pour coder des ensembles : à chaque entier écrit en base 2 on associe l'ensemble dont les éléments sont les positions des bits égaux à 1.  
Par exemple, $1010_2$ a deux bits égaux à $1$, en positions $1$ et $3$ (la position 0 étant celle du chiffre des unités, tout à droite). Donc l'entier $1010_2$, c'est-à-dire $18$, représente l'ensemble $\{1, 3\}$.  
Comme un `uint` est stocké sur $32$ bits, cette méthode permet donc de coder n'importe quel sous-ensemble de $\{0, ..., 31\}$ sous forme d'un `uint`.  
Pour les questions suivantes, on pourra utiliser `&`, `|`, `<<`, `~` (voir 1er cours de C).

## Petites questions

1. Par quel entier est codé l'ensemble $\{0, 3, 4\}$?
2. Quel est l'ensemble codé par l'entier $26$ ?
3. Écrire une fonction `singleton` telle que `singleton(i)` renvoie l'entier représentant $\{i\}$, c'est-à-dire $2^i$ ($= 1\underbrace{0...0}_i {}_2$).

1. $11001_2$ = 25

2. 26 = $11010_2$ -> {1,3,4}

In [20]:
// Question 3 : singleton(i)
uint singleton(uint i) {
    return 1 << i;
};

In [7]:
singleton(5)

32

## Union, intersection, appartenance

1. Écrire une fonction `union` telle que, si `s1` et `s2` sont deux entiers représentants des ensembles, `union(s1, s2)` renvoie un entier représentant leur union.  
2. Faire de même pour l'intersection de deux ensembles.  
3. Écrire une fonction `has` telle que `has(s, e)` détermine si l'entier `e` appartient à l'ensemble représenté par l'entier `s`.  

In [21]:
// Question 1 : union2(s1, s2)
uint union2(uint s1, uint s2) {
    return (s1 | s2);
};

In [22]:
// Question 2 : intersection(s1, s2)
uint intersection(uint s1, uint s2) {
    return (s1 & s2);
};

In [23]:
// Question 3 : has(s, e)
bool has (uint s,uint e) {
    return (intersection (singleton(e), s) != 0);
}

In [11]:
has (26, 2)

false

## Algorithme de Kernighan

1. Si $n = 1011100_2$, que vaut $n$ & $(n - 1)$ ? Quel est le lien entre l'écriture de $n$ et celle de $n$ & $(n - 1)$ ?
2. En s'inspirant de la question précédente, écrire une fonction `card` telle que `card(n)` renvoie le nombre de 1 dans l'écriture binaire de `n`. Cette fonction sera linéaire en le nombre de 1 dans l'écriture binaire de `n`. (Remarque : `card` renvoie donc le cardinal (taille) de l'ensemble codé par l'entier en argument)  
3. Un des intérêts de cette représentation binaire des ensembles est qu'il est facile d'énumérer tous les sous-ensembles de $\{0, ..., 31\}$, en faisant une boucle `for` sur les entiers de $0$ à $2^{32} - 1$. Calculer ainsi la somme des cardinaux de tous les sous-ensembles de $\{0, ..., 31\}$. Quel nombre retrouve t-on?  

1. `n & (n -1)` a pour effet de supprimer le dernier bit de n

In [45]:
// Question 2 : card(s)
uint card (uint s) {
    uint i = 0;
    while (s != 0) {
        s = s & (s-1);
        i++;
    };
    return i;
};

In [46]:
card (129)

2

In [47]:
// Question 3 : somme des sous ensembles de 0 à 2^32
uint s = 0;
for (uint i = 0; i<32; i++) {
    s += card(singleton(i));
};
printf("%d ", s);

32 

## Bit de poids faible

1. Si `x` est un entier positif, que permet d'obtenir l'instruction `x & (~x + 1)` ? On pourra essayer sur des exemples.  
2. Montrer qu'on pourrait utiliser `x & -x` au lieu de `x & (~x + 1)` (c'est-à-dire que les deux instructions donnent la même chose), en sachant que `-x` est stocké par complément à 2 (voir cours à ce sujet).

`X & (~X + 1)` renvoie 2 exposant le premier bit égal à 1 de X

On pourrait utiliser `X & -X` à la place car le premier bit sera le même