# Représentation des entiers naturels - Partie I

## Représentation interne des nombres dans un ordinateur

### Notion de bit

Un ordinateur est un appareil fonctionnant à l'aide de circuits électroniques, pour lesquels ils est plus simple de distinguer deux états (absence ou présence d'un courant électrique) que plusieurs. Ce système à deux étants - donc binaire - permet en outre de tolérer de légères approximations de mesures.

Ces deux mesures correspondent à 0 (absence de courant) ou 1 (présence de courant). Ces deux chiffres sont les *chiffres binaires* que l'on abrège en **bit** (pour *binary digit*).

### Regroupement des bits

Si toute les données dans un ordinateur peuvent *in fine* se représenter par une suite de  0 ou de 1, on regroupe néanmoins ces chiffres binaires en paquets de bits pour des questions de commodité mais aussi d'efficacité.

* Le plus petit regroupement utilisé dans les ordinateurs modernes et le paquet de 8 bits, surnomé **octet** en français (ou **byte** en anglais, à ne surtout pas confondre avec **bit** qui, d'ailleurs, ne se prononce pas du tout de la même façon).
* Les octets sont ensuites regroupés en **mots** machines de taille variable, valant généralement 2 octets (16 bits), 4 octets (32 bits) ou bien 8 octets (64 bits). Lorsque l'on parle d'un ordinateur 32 bits ou 64 bits, cela signifie qu'ils sont capable de physiquement traiter des paquets de bits de la taille correspondante pour effectuer des opérations (additions, multiplications, etc).

### Encodage d'un nombre

Nous verrons un peu plus loin comment ces mots machines permettent de représenter des données plus complexes que 0 ou 1, notamment des entiers naturels (mais pas uniquement). Cela nécessite cependant de trouver un moyen de traduire tout entier naturel en une suite plus ou moins longue de **bits**: on appelle cela un *encodage*.

## Écriture en base 10

Avant de nous intéresser à la représentation des entiers sous forme binaire, commençons par regarder d'un peu plus près comment sont représentés les nombres pour les êtres humains. 

Toutes les sociétés utilisent depuis quelques millénaires la base 10, encore appelée représentation décimale des entiers (historiquement, ce n'était pas toujours le cas: les mayas utilisaient par exemple le système *vicésimal* de base 20, les babyloniens le système *sexagésimal* de base 60).

Les nombres entiers sont représentés en base 10 par une suite de chiffres décimaux (il y en a exactement 10, compris entre 0 et 9). Supposons qu'un entier naturel $N$ y ait \\(n + 1\\) chiffres \\(a_n, a_{n-1}, \ldots, a_2, a_1, a_0\\) où \\(a_0\\) correspond au chiffre des unités, \\(a_1\\) au chiffre des dizaines, etc.

Il est alors possible de reconstituer le nombre de départ, en constatant que

$$N = a_n\times 10^n + a_{n-1}\times 10^{n-1} + \cdots + a_2\times 10^2 + a_1\times 10^1 + a_0\times 10^0$$

On dit que le nombre \\(10^k\\) que l'on multiplie à \\(a_k\\) est le **poids** de \\(a_k\\). Le chiffre \\(a_n\\) est dit *de poids fort* car il est multiplié à la plus grande puissance de 10. À l'inverse, le chiffre des unités \\(a_0\\) est appelé *chiffre de poids faible*.

**Exemple:** Prenons \\(N = 30728\\)

Il est possible de démontrer mathématiquement (c'est un *théorème*) qu'à tout nombre entier \\(N\\) est associé une unique séquence de chiffres donnant la représentation décimale. Inversement, étant donné une séquence de chiffres décimaux, on peut toujours calculer un unique nombre entier par la formule ci-dessus.

## Écriture en base 2

### Représentation binaire

On peut se demander à juste titre si le nombre 10 du paragraphe précédent joue un rôle particulier: en réalité, il n'en est rien. Les humains comptent très vraissemblablement en base 10 pour une raison physiologique évidente. Mais la base 20 est toute aussi naturelle.

Les ordinateurs étant très fortement liés au bits comme nous l'avons vu un peu plus haut (c'est un peu comme si un ordinateur n'avait qu'un seul doigt pour compter), on peut naturellement se demander si le théorème mathématique précédent reste valable en base 2. Et c'est effectivement le cas !

La différence est que les chiffres seront bien évidemment des chiffres binaires, autrement dit des **bits**. L'autre différence est que l'on n'utilise plus des puissances de 10 mais plutôt des puissances de 2.

**Exemple:** Quel est le nombre dont la représentation en base 2 est 1101011 ?

Il est possible de généraliser l'exemple précédent: à toute suite de \\(n + 1\\) bits \\(b_n, b_{n-1}, \ldots, b_2, b_1, b_0\\) on peut associer un nombre entier de manière unique par la formule

$$ N = b_n\times 2^n + b_{n-1}\times 2^{n-1} + \cdots + b_2\times 2^2 + b_1\times 2^1 + b_0\times 2^0$$

### Regroupement en octets et en mots

Un octet étant un regroupement de 8 bits, il permet de représenter tout entier comportant au plus 8 chiffres binaires. Le plus grand entier que l'on peut ainsi représenter par un octet est 

\begin{align*}
11111111_2 & = 2^7 + 2^6 + \cdots + 2^1 + 2^0 \\
& = 128 + 64 + 32 + 16 + 8 + 4 + 2 + 1 \\
& = 255
\end{align*}

La plus petite valeur étant 0, il est donc possible de représenter 256 valeurs (entre 0 et 255) à l'aide d'un octet.

**Remarque:** L'indice 2 dans \\(11111111_2\\) permet de ne pas confondre un nombre dont la représentation est en binaire d'un nombre décimal. On peut utiliser \\(135_{10}\\) lorsque l'on veut préciser que la représentation est décimale, mais on peut aussi admettre qu'en l'absence d'information, un nombre est décimal. L'égalité précédente n'a de sens que si l'on considère le membre de gauche comme une représentation binaire d'un nombre. Nous verrons un peu plus loin que `python` a une autre manière de distinguer entre les nombres binaires et les nombres décimaux.

---
**Exercice 1:** Expliquer cette blague de programmeur: « Il y a 10 catégories de personnes: celles qui savent compter en binaire et celles qui ne savent pas...»

---
**Exercice 2:** Donner la représentation décimale des entiers dont les représentations binaires sont 11001100, 10101010 et 1010010011110010.

---
**Exercice 3:** Quelle est le plus grand entier que l'on puisse représenter sur 16 bits ? Sur 32 bits ? Sur 64 bits ?


Le théorème cité plus haut sur l'unicité de la représentation décimal d'un entier naturel est aussi valable pour la représentation binaire: un entier naturel \\(N\\) admet une *unique* représentation en base 2: il existe donc une seule séquence de bits permettant de représenter \\(N\\) dans cette base.

**Exemple:** Considérons l'entier naturel 94 (représentation décimale puisqu'il n'y a aucune indication du contraire). Quelle est sa représentation binaire ?

---
**Exercice 4:** Donner la représentation en base 2 sur 8 bits des entiers 13, 135, 62 et 248.

## Représentations des entiers en python

Python étant un langage informatique, les nombres sont bien sûr représentés de manière interne en binaire par l'ordinateur. Cependant, il faut bien distinguer la représentation interne (qui n'est en général pas visible) de la manière d'afficher un nombre dans un terminal.

Par défaut, python affiche les nombres en base 10.

In [2]:
123

123

On peut saisir des nombres en base 2 en les préfixant par `0b`:

In [4]:
0b10110111

183

Il est possible de déterminer la représentation binaire d'un entier par la fonction `bin(entier)` dont le résultat est une chaîne de caractère:

In [6]:
bin(123)

'0b1111011'

**Attention:** Il ne faut surtout pas confondre la chaîne de caractères ```'0b1111011'``` avec le nombre en base 2 ```0b1111011``` que python stockera (puis affichera ensuite) comme l'entier `123`.

**Remarque:** Quelle que soit l'architecture de l'ordinateur utilisé (probablement 64 bits de nos jours, mais parfois encore 32 bits), les entiers sont représentés de manière spéciale par python (nous ne préciserons pas comment), et permettent de représenter des nombres de taille arbitraire (la seule limite est la taille de la mémoire). Notons que, quels que soient les détails de cette représentation interne, en dernier ressort l'ordinateur utilisera toujours des bits. Voici par exemple la représentation décimale et binaire de \\(3^{1000}\\):

In [13]:
>>> n = 3**1000 # En python, l'opérateur de puissance est la double multiplication **
>>> n

1322070819480806636890455259752144365965422032752148167664920368226828597346704899540778313850608061963909777696872582355950954582100618911865342725257953674027620225198320803878014774228964841274390400117588618041128947815623094438061566173054086674490506178125480344405547054397038895817465368254916136220830268563778582290228416398307887896918556404084898937609373242171846359938695516765018940588109060426089671438864102814350385648747165832010614366132173102768902855220001

In [15]:
bin(n)

'0b1111100101101110100000001000100110101001101101001100010111000001001000000110000011101001110101000100101100110110010111001011110111101000110001001111001100010110111100001100010110111001101111010010111110010101000100000010011000011010001100101110000111111010011001111101101010001011100100100000011000100101100001011111101101011110010001100000111000001110000100011010100100010111111011101100000010100010011011101001110001110111010101100011001001011011100010100001110010100111001001010000011111101100100010000011010010100010000100110110110100001001000001010011111010011010010000011010110001111110011000011010100110011100010110111001000111010000001001011100110111010100011001111111000100000111011011111101011001000111001100110001001101011010001011000110101100010110010111011101000111100100101111001101000010110101100101100001101110011101101000101010011000010001011011110100011110011101010110001110101110100101111011011000010101011001101000000011000010110110000110101100000100100110100011011011000001010

Cette souplesse offerte par le langage python est relativement inédite et n'existe quasiment dans aucun autre langage de programmation. En général, les variables contiennent des entiers dont le nombre de bits est fixé à l'avance (8, 16, 32, 64 ou 128 pour la plupart des langages courants).

## Représentation binaire et algorithmes

Bien que python offre déjà toutes les facilités pour convertire vers et depuis le binaire, il est important de bien comprendre les algorithmes sous-jacents et aussi de savoir les implémenter en python.

Le premier algorithme présenté permet de déterminer la représentation binaire d'un entier (donné initialement sous forme décimale) en utilisant la même méthode que celle utilisée «à la main» un peu plus haut dans l'exemple et l'exercice correspondant.

Le second réalise la même tâche mais selon une méthode diamétralement différente. Il a l'avantage d'être finalement plus simple et plus court. Il est aussi plus efficace (bien que cela n'ait guère d'importance en pratique sur des nombres comportant peu de chiffres).

Enfin, le dernier algorithme présenté réalise la tâche inverse, à savoir déterminer un nombre entier à partir de sa représentation en base 2.

### Algorithme 1: Représentation binaire d'un entier.

```
Déterminer la plus grande puissance de 2 inférieure ou égale à N. Notons-la P.

Tant que P est positif faire:
    Si P est inférieur ou égal à N alors:
        Afficher 1
        Soustraire P à N
    Sinon:
        Afficher 0
    Diviser P par deux (division euclidienne)
````

La première partie de l'algorithme peut (et doit) elle même être précisée, comme suit:

```
P prend la valeur 1
Tant que 2P est inférieur ou égal à N faire:
    P prend la valeur 2P

Tant que P est positif faire:
    Si P est inférieur ou égal à N alors:
        Afficher 1
        Soustraire P à N
    Sinon:
        Afficher 0
    Diviser P par deux (division euclidienne)
````

À la sortie de la boucle, \\(P\\) sera la plus grande puissance de 2 inférieur ou égal à \\(N\\), excepté si \\(N = 0\\): l'algorithme ne fonctionne d'ailleurs pas dans ce cas là, puisqu'aucune des deux boucles n'est exécutée. Il faudra traiter le cas nul à part.

Remarquons aussi que cet algorithme réalise la même chose que la fonction `bin(nombre)` préexistance en python.

---
**Exercice 5:** Implémenter l'algorithme précédent en python, sous la forme d'une fonction `bin1(nombre)` prenant pour paramètre un entier naturel et renvoyant en valeur de retour une chaîne de caractère contenant la représentation binaire correcte du nombre. Dit plus simplement: la fonction `bin1()` doit réaliser exactement la même chose que la fonction `bin()` de python.

**Attention:** La fonction `bin1(nombre)` a pour vocation de renvoyer une valeur, elle ne devra rien afficher dans la console.

Attention, en python il existe **deux** opérateurs de division: le simple slash '/' est une division «à virgule»: son résultat est toujours un nombre à virgule flottante, même si mathématiquement il s'agit d'un entier.

In [1]:
4 / 5

0.8

In [2]:
4 / 2

2.0

Nous aurons ici davantage besoin d'une division euclidienne (c'est-à-dire la division telle qu'aprise à l'école primaire, avec dividende et reste). L'opérateur '//' sert à cela, et son résultat est toujours un entier.

In [6]:
4 // 3

1

In [8]:
4 // 2

2

On peut calculer le reste d'une division euclidienne grâce à l'opérateur '%' (qui se prononce **modulo** en mathématiques):

In [9]:
4 % 3

1

In [10]:
4 % 2

0

Quelques outils sur les chaînes de caractères qui n'ont pas encore été étudiées cette année:
* Une chaîne de caractère est indifféremment entourée d'apostrophes \' ou bien de guillemets anglais \" (à ne pas confondre avec des doubles apostrophes).
* On peut rajouter des caractères avant ou après une chaîne de caractères à l'aide de l'opérateur `+` qui sert alors de *concaténation* et non pas d'addition:

In [19]:
>>> s = "mot"
>>> s + "-suffixe"

'mot-suffixe'

In [21]:
>>> 'préfixe-' + s

'préfixe-mot'

In [23]:
>>> binaire = "1011"

In [27]:
>>> binaire = "00" + binaire + "01"
>>> binaire

'0000001011010101'

In [28]:
>>> "0b" + binaire

'0b0000001011010101'

### Algorithme 2: Représentation binaire d'un entier.

L'algorithme précédent déterminait la représentation binaire d'un entier de la gauche vers la droite, c'est-à-dire du bit de poids fort vers le bit de poids faible.

L'algorithme présenté ici procède exactement à l'inverse: il détermine d'abord le bit de poids faible, puis procède de la droite vers la gauche.

Cet algorithme est basé sur quelques remarques très simples:
* Le bit de poids faible d'un nombre représenté en binaire (c'est-à-dire celui situé le plus à droite ou encore le bit des unités) permet de savoir si un entier est pair ou impair: si ce bit est 0, alors l'entier est pair, sinon il est impair.
* En inversant l'argument précédent, il est donc aisé de déterminer le bit de poids faible en testant si un nombre est divisible par deux ou non. On utilise pour cela l'opérateur `%` de python donnant le reste d'une division euclidienne.
* Une fois que l'on a déterminé le bit de poids faible, il suffit de recommencer pour les bits situés plus à gauche, en décalant le tout vers la droite. Un décalage vers la droite en binaire correspond exactement à une division euclidienne par deux (c'est l'équivalent d'une division par 10 en décimal).

On obtient alors l'algorithme suivant:

```
Tant que N est strictement positif faire:
    Si N est pair alors:
        Afficher 0
    Sinon:
        Afficher 1
        N prend la valeur N moins 1
    N prend la valeur N divisé par 2
````

Remarquons que cet algorithme affiche les bits à l'envers: pour éviter cet inconvénient, on créera plutôt une chaîne de caractère pour laquelle il sera facile d'ordonner les bits correctement (on peut toujours décider d'ajouter un caractère devant ou derrière une chaîne existante, selon ce que l'on cherche à faire).

Il est possible de détailler davantage le test de la conditionnelle:

```
Tant que N est strictement positif faire:
    Si N % 2 == 0 alors:
        Afficher 0
    Sinon:
        Afficher 1
        N prend la valeur N moins 1
    N prend la valeur N divisé par 2
````

En effet, dire que \\(N\\) est pair équivaut à dire que le reste de la division euclidienne de \\(N\\) par 2 vaut 0, ce qui se traduit en python par `N % 2 == 0`.

---
**Exercice 6:** Implémenter l'algorithme précédent en python, sous la forme d'une fonction `bin2(nombre)` prenant pour paramètre un entier naturel et renvoyant en valeur de retour une chaîne de caractère contenant la représentation binaire correcte du nombre. Dit plus simplement: la fonction `bin2()` doit réaliser exactement la même chose que la fonction `bin()` de python ou que la fonction `bin1()` précédente.

### Algorithme 3: conversion du binaire vers le décimal.

L'algorithme permettant de convertir un nombre donné en base 2 vers un nombre décimal est conceptuellement plus simple: il revient simplement à réaliser le calcul

$$ N = b_n\times 2^n + b_{n-1}\times 2^{n-1} + \cdots + b_2\times 2^2 + b_1\times 2^1 + b_0\times 2^0$$

à partir des bits \\(b_k\\).

---
**Exercice 7:** Implémenter cet algorithme précédent en python, sous la forme d'une fonction `decimal(chaîne)` prenant pour paramètre une chaîne de caractère ne contenant que des 0 et des 1 (aucun test ne sera effectué pour s'en assurer) et renvoyant en valeur de retour l'entier correspondant.