# Jeu de caractères

## Introduction

Dans les ordinateurs les chaines de caractères (*string* en anglais) ou plus généralement les textes sont représentés par des suites d'octets. Différentes conventions ont été établies sur la manière dont un octet ou une séquence d'octets représente un caractère ou une séquence de caractères. Dans le cas le plus simple, un octet correspond à un caractère selon une table d'association. Naturellement, cela limite le nombre de caractères différents qui peuvent être représentés à $2^8 = 256$. 

Pour échanger du texte, il est donc nécessaire de connaissance la convention de codage utilisée. Par exemple, le texte `Ce texte a été codé` sera interprété comme ceci `Ce texte a  Ã©tÃ© codÃ©` avec la mauvaise convention de codage à l'écriture ou à la lecture. Dans certains cas, l'utilisation de métadonnées (des données qui décrivent les données) assure cette fonction. Par exemple, pour les documents HTML, l'information sur la convention de codage est envoyée par le serveur web au client avec le document lui-même, en utilisant ce que l'on appelle l'entête HTTP. Un mécanisme similaire existe pour les courriers électroniques. Dans le cas d'un texte brut (*plain text* en anglais), l'absence de métadonnées oblige le "producteur" du texte et ses "utilisateurs" de se mettre d'accord sur le codage.

Le codage ASCII a longtemps été utilisé par défaut (et il est toujours très courant). Il a ensuite été étendu, comme avec le codage ISO latin qui est spécialisé par type de langue. La tendance actuelle est d'utiliser l'unicode qui a une vocation universelle.

```{note}
Dans ce contexte, un « caractère » peut être une lettre (A b ç é δ), un chiffre (0 1 2 3), un signe de ponctuation ( . : ! § "), un idéogramme (漢 る 𓅓 ), un symbole mathématique (∮ ∈ ℕ ⊇), ou même un caractère non imprimable (retour à la ligne, saut de ligne, bip sonore).
```

## Définition

La notion de **jeu de caractères** (en anglais *character set*) est la combinaison de trois éléments:

1. Un **répertoire des caractères** abstraits (ensemble des caractères représentables dans le jeu).
2. Des **points de code** qui sont des nombres entiers que l'on associe de manière biunivoque aux caractères abstraits. On parle de jeu de caractères codés pour le répertoire des caractères associé à ses points de code.
3. Un **codage** qui spécifie une représentation physique du caractère, ou plutôt de son point de code, comme 
    - la taille de son unité de codage : un octet (8 bits), deux octets (16 bits) ou 4 octets (32 bits)
    - le mécanisme de sérialisation dans l'unité de codage, c'est-à-dire l'ordre des octets lorsque le point de code est codé sur 2 ou 4 octets (boutisme ou *endianness* en anglais) : gros-boustisme (en anglais *big endian*) en commençant par les octets de poids fort, petit-boutisme (en anglais *little endian*) en commençant par les octets de poids faible.

La connaissance de ces trois éléments est indispensable pour lire et pour écrire des fichiers de texte sans mauvaise surprise.

Exemples :

![illustration jeux_de_caracteres](img/jeux_de_caracteres.png)

## Jeux de caractères les plus répandus

### [ASCII](https://fr.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange) (American Standard Code for Information Interchange)

C'est des premiers jeux de caratères dans les années 1960, il propose peu de caractères, mais il reste encore aujourd'hui incontournable (Norme ANSI puis ISO/CEI 646)

Le répertoire des caratères se compose de 128 caratères dont 95 imprimables.

```
 !"#$%&'()*+,-./0123456789:;<=>?@
ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_
abcdefghijklmnopqrstuvwxyz{|}~
```

Les caractère non imprimables sont des informations qui donne généralement des directives d'affichage au terminal comme un retour à la ligne `CR` (carriage return) ou générer un bip `BEL` (bell).

Les points de code sont compris entre 0 et 127.

Le codage du point de code est historiquement sur 7 bits ($2^7 = 128$), ce qui permettait d'utiliser le 8e bit d'un octet pour transmettre une information redondante sur la parité du nombre de bit à 1 dans le caratères pour fiabiliser la transmission.


<table>
    <tr>
        <td style='border: 1px solid black;'></td>
        <td style='border: 1px solid black; text-align:center;'>0</td>
        <td style='border: 1px solid black; text-align:center;'>1</td>
        <td style='border: 1px solid black; text-align:center;'>2</td>
        <td style='border: 1px solid black; text-align:center;'>3</td>
        <td style='border: 1px solid black; text-align:center;'>4</td>
        <td style='border: 1px solid black; text-align:center;'>5</td>
        <td style='border: 1px solid black; text-align:center;'>6</td>
        <td style='border: 1px solid black; text-align:center;'>7</td>
        <td style='border: 1px solid black; text-align:center;'>8</td>
        <td style='border: 1px solid black; text-align:center;'>9</td>
    </tr>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>0</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>NUL</b><br /><span style='font-size:0.5em;'>NULL CHARACTER</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>SOH</b><br /><span style='font-size:0.5em;'>START OF HEADING</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>STX</b><br /><span style='font-size:0.5em;'>START OF TEXT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>ETX</b><br /><span style='font-size:0.5em;'>END OF TEXT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>EOT</b><br /><span style='font-size:0.5em;'>END OF TRANSMISSION</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>ENQ</b><br /><span style='font-size:0.5em;'>ENQUIRY</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>ACK</b><br /><span style='font-size:0.5em;'>ACKNOWLEDGE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>BEL</b><br /><span style='font-size:0.5em;'>BELL</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>BS</b><br /><span style='font-size:0.5em;'>BACKSPACE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>HT</b><br /><span style='font-size:0.5em;'>HORIZONTAL TAB</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>10</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>LF</b><br /><span style='font-size:0.5em;'>LINE FEED</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>VT</b><br /><span style='font-size:0.5em;'>VERTICAL TABULATION</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>FF</b><br /><span style='font-size:0.5em;'>FORM FEED</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>CR</b><br /><span style='font-size:0.5em;'>CARRIAGE RETURN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>SO</b><br /><span style='font-size:0.5em;'>SHIFT OUT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>SI</b><br /><span style='font-size:0.5em;'>SHIFT IN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>DLE</b><br /><span style='font-size:0.5em;'>DATA LINK ESCAPE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>DC1</b><br /><span style='font-size:0.5em;'>DEVICE CONTROL ONE (XON)</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>DC2</b><br /><span style='font-size:0.5em;'>DEVICE CONTROL TWO</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>DC3</b><br /><span style='font-size:0.5em;'>DEVICE CONTROL THREE (XOFF)</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>20</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>DC4</b><br /><span style='font-size:0.5em;'>DEVICE CONTROL FOUR</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>NAK</b><br /><span style='font-size:0.5em;'>NEGATIVE ACKNOWLEDGE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>SYN</b><br /><span style='font-size:0.5em;'>SYNCHRONOUS IDLE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>ETB</b><br /><span style='font-size:0.5em;'>END OF TRANSMISSION BLOCK</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>CAN</b><br /><span style='font-size:0.5em;'>CANCEL</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>EM</b><br /><span style='font-size:0.5em;'>END OF MEDIUM</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>SUB</b><br /><span style='font-size:0.5em;'>SUBSTITUTE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>ESC</b><br /><span style='font-size:0.5em;'>ESCAPE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>FS</b><br /><span style='font-size:0.5em;'>FILE SEPARATOR</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>GS</b><br /><span style='font-size:0.5em;'>GROUP SEPARATOR</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>30</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>RS</b><br /><span style='font-size:0.5em;'>RECORD SEPARATOR</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>US</b><br /><span style='font-size:0.5em;'>UNIT SEPARATOR</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b> </b><br /><span style='font-size:0.5em;'>SPACE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>!</b><br /><span style='font-size:0.5em;'>EXCLAMATION MARK</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>"</b><br /><span style='font-size:0.5em;'>QUOTATION MARK</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>#</b><br /><span style='font-size:0.5em;'>NUMBER SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>$</b><br /><span style='font-size:0.5em;'>DOLLAR SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>%</b><br /><span style='font-size:0.5em;'>PERCENT SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>&</b><br /><span style='font-size:0.5em;'>AMPERSAND</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>'</b><br /><span style='font-size:0.5em;'>APOSTROPHE</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>40</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>(</b><br /><span style='font-size:0.5em;'>LEFT PARENTHESIS</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>)</b><br /><span style='font-size:0.5em;'>RIGHT PARENTHESIS</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>*</b><br /><span style='font-size:0.5em;'>ASTERISK</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>+</b><br /><span style='font-size:0.5em;'>PLUS SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>,</b><br /><span style='font-size:0.5em;'>COMMA</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>-</b><br /><span style='font-size:0.5em;'>HYPHEN-MINUS</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>.</b><br /><span style='font-size:0.5em;'>FULL STOP</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>/</b><br /><span style='font-size:0.5em;'>SOLIDUS</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>0</b><br /><span style='font-size:0.5em;'>DIGIT ZERO</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>1</b><br /><span style='font-size:0.5em;'>DIGIT ONE</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>50</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>2</b><br /><span style='font-size:0.5em;'>DIGIT TWO</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>3</b><br /><span style='font-size:0.5em;'>DIGIT THREE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>4</b><br /><span style='font-size:0.5em;'>DIGIT FOUR</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>5</b><br /><span style='font-size:0.5em;'>DIGIT FIVE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>6</b><br /><span style='font-size:0.5em;'>DIGIT SIX</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>7</b><br /><span style='font-size:0.5em;'>DIGIT SEVEN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>8</b><br /><span style='font-size:0.5em;'>DIGIT EIGHT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>9</b><br /><span style='font-size:0.5em;'>DIGIT NINE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>:</b><br /><span style='font-size:0.5em;'>COLON</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>;</b><br /><span style='font-size:0.5em;'>SEMICOLON</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>60</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b><</b><br /><span style='font-size:0.5em;'>LESS-THAN SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>=</b><br /><span style='font-size:0.5em;'>EQUALS SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>></b><br /><span style='font-size:0.5em;'>GREATER-THAN SIGN</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>?</b><br /><span style='font-size:0.5em;'>QUESTION MARK</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>@</b><br /><span style='font-size:0.5em;'>COMMERCIAL AT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>A</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER A</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>B</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER B</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>C</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER C</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>D</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER D</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>E</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER E</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>70</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>F</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER F</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>G</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER G</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>H</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER H</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>I</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER I</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>J</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER J</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>K</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER K</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>L</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER L</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>M</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER M</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>N</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER N</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>O</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER O</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>80</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>P</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER P</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>Q</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER Q</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>R</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER R</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>S</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER S</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>T</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER T</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>U</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER U</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>V</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER V</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>W</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER W</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>X</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER X</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>Y</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER Y</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>90</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>Z</b><br /><span style='font-size:0.5em;'>LATIN CAPITAL LETTER Z</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>[</b><br /><span style='font-size:0.5em;'>LEFT SQUARE BRACKET</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>\</b><br /><span style='font-size:0.5em;'>REVERSE SOLIDUS</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>]</b><br /><span style='font-size:0.5em;'>RIGHT SQUARE BRACKET</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>^</b><br /><span style='font-size:0.5em;'>CIRCUMFLEX ACCENT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>_</b><br /><span style='font-size:0.5em;'>LOW LINE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>`</b><br /><span style='font-size:0.5em;'>GRAVE ACCENT</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>a</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER A</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>b</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER B</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>c</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER C</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>100</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>d</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER D</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>e</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER E</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>f</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER F</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>g</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER G</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>h</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER H</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>i</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER I</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>j</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER J</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>k</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER K</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>l</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER L</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>m</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER M</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>110</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>n</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER N</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>o</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER O</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>p</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER P</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>q</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER Q</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>r</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER R</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>s</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER S</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>t</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER T</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>u</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER U</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>v</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER V</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>w</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER W</spam>
        </td>
    <tr>
        <td style='border: 1px solid black; text-align:center;'>120</td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>x</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER X</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>y</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER Y</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>z</b><br /><span style='font-size:0.5em;'>LATIN SMALL LETTER Z</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>{</b><br /><span style='font-size:0.5em;'>LEFT CURLY BRACKET</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>|</b><br /><span style='font-size:0.5em;'>VERTICAL LINE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>}</b><br /><span style='font-size:0.5em;'>RIGHT CURLY BRACKET</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>~</b><br /><span style='font-size:0.5em;'>TILDE</spam>
        </td>
        <td style='border: 1px solid black; background-color: #B0B0B0; text-align:center; vertical-align: top;'>
            <b>DEL</b><br /><span style='font-size:0.5em;'>DELETE</spam>
        </td>
    </tr>
</table>


### ASCII étendu (ISO/CEI 8859)

16 jeux de caractères pour prendre en compte les langues d'Europe occidentale ou les langues d'Asie, ils sont rétrocompatibles avec le standard ASCII
    * [ISO 8859-1](https://fr.wikipedia.org/wiki/ISO/CEI_8859-1) (jeu dit Latin-1) ajoute 96 caractères au jeu ASCII
    `¡¢£¤¥¦§¨©ª«¬-®¯°±²³´µ¶·¸¹º»¼½¾¿ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏÐÑÒÓÔÕÖ` `×ØÙÚÛÜÝÞßàáâãäåæçèéêëìíîïðñòóôõö÷øùúûüýþÿ` et propose en encodage sur 8 bits.
    * [Windows-1252](https://fr.wikipedia.org/wiki/Windows-1252) ou CP1252 est un jeu de caractères proche de l'ISO 8859-1 (Latin-1) qui est utilisé dans les systèmes d'exploitation Microsoft Windows en Europe de l'Ouest.


### [Unicode](https://fr.wikipedia.org/wiki/Unicode) (ISO/CEI 10646)

Répertoire de 149186 caractères (point de code) couvrant plus de 150 systèmes écritures, c'est le standard dominant pour le codage informatique des caractères qui reste rétrocompatibles avec les répertoires ASCII,

- codage [UTF-8](https://fr.wikipedia.org/wiki/UTF-8) forme des séquences de un à quatre octets pour encoder les caractères, c'est le plus employé, car il offre une certaine rétrocompatibilité avec le standard ASCII codé sur 8 bits,
- codage [UTF-16](https://fr.wikipedia.org/wiki/UTF-16) utilise de un à deux mots de 16 bits pour encoder les caractères, il est utilisé en particulier dans les systèmes de fichiers NTFS et APFS,
- codage UTF-32.

## Et avec Python ?

Parmi les encodages de jeu de caractères connu nativement de Python (codec), on trouve : `ascii`, `cp1252` (windows-1252), `latin_1` (iso-8859-1), `mac_roman` (macintosh), `utf_8`, `utf_16` et `utf_32`

In [5]:
chaine = "Emoji :)"
print(chaine, " --> ASCII encodé 8 bits --->", chaine.encode("ascii").hex())
print(chaine, " --> UNICODE encodé UTF-8 -->", chaine.encode("utf_8").hex())

chaine = "Émoji 😃"
print(chaine, "--> UNICODE encodé UTF-8 --->", chaine.encode("utf_8").hex())

print(chaine, "--> UNICODE encodé UTF-16 -->", chaine.encode("utf_16").hex())

Emoji :)  -->  ASCII encodé 8 bits  ---> 456d6f6a69203a29
Emoji :)  -->  UNICODE encodé UTF-8  --> 456d6f6a69203a29
Émoji 😃 --> UNICODE encodé UTF-8 ---> c3896d6f6a6920f09f9883
Émoji 😃 --> UNICODE encodé UTF-16 --> fffec9006d006f006a00690020003dd803de
