# Le BN pour encoder et traiter des textes en machine

Un paquet de données transmit entre deux machines via internet que ce soit du texte, des images ou du son, tout comme un fichier informatique quelqu'il soit, ne sont finalement qu'une suite de 0 et de 1 que l'on peut regrouper par lots de 8 formant ainsi une séquence d'octects.

Utiliser un encodage plutôt qu'un autre revient à interpréter la même séquence d'octets de deux façons différentes au risque de commettre des erreurs...

## L'ASCII :

Pour interpréter correctement un message textuel échangé entre ordinateurs, le choix d'une convention de codage commune et standardisée s'est imposé dès le début des années 1960. C'est la norme **ASCII** pour American Standard Code for Information Interchange qui a été retenu pour le codage des caractères.

C'est une table de 128 caractère numérotés de 0 à 127 (sur 7 bits) :

<img alt="ASCII-Table" src="https://upload.wikimedia.org/wikipedia/commons/d/dd/ASCII-Table.svg">

Ce jeu de symboles est suffisant pour rédiger un programme informatique ou un texte en Anglais. Mais il ne permet pas d'écrire dans d'autres langues qui utiliseraient des accents par exemple...

><h2 class='fa fa-graduation-cap' style="color: purple"> Exercice d'application :</h2>
>
> Peut-on transformer l'image précédemment étudiée en un message textuel codé en ASCCI ?
> 
><img src="https://ericecmorlaix.github.io/img/NSI-ASCII-2D_Code.png" alt="ExerciceCodageASCII.png">
>

## Python et l'ASCII :

La fonction `ord()` renvoie le nombre entier décimal du code ASCII correspondant au caractère passé en argument.

Inversement, `chr()` renvoie le caractère correspondant dans la table ASCII à l'entier passé à cette fonction.



In [37]:
chr(0b01000001)

'A'

In [38]:
chr(0x41)

'A'

In [39]:
ord('A')

65

In [40]:
bin(65)

'0b1000001'

In [41]:
hex(ord('A'))

'0x41'

><h2 class='fa fa-code' style="color: purple"> A coder vous même :</h2>
>
> **Ecrire** un script qui affiche dans un tableau l'ensemble des caractères imprimables et leur code ASCII respectif

In [62]:
for i in range (32,127):
    print(f'chr({i}) = '+ chr(i), end='  |  ')

chr(32) =    |  chr(33) = !  |  chr(34) = "  |  chr(35) = #  |  chr(36) = $  |  chr(37) = %  |  chr(38) = &  |  chr(39) = '  |  chr(40) = (  |  chr(41) = )  |  chr(42) = *  |  chr(43) = +  |  chr(44) = ,  |  chr(45) = -  |  chr(46) = .  |  chr(47) = /  |  chr(48) = 0  |  chr(49) = 1  |  chr(50) = 2  |  chr(51) = 3  |  chr(52) = 4  |  chr(53) = 5  |  chr(54) = 6  |  chr(55) = 7  |  chr(56) = 8  |  chr(57) = 9  |  chr(58) = :  |  chr(59) = ;  |  chr(60) = <  |  chr(61) = =  |  chr(62) = >  |  chr(63) = ?  |  chr(64) = @  |  chr(65) = A  |  chr(66) = B  |  chr(67) = C  |  chr(68) = D  |  chr(69) = E  |  chr(70) = F  |  chr(71) = G  |  chr(72) = H  |  chr(73) = I  |  chr(74) = J  |  chr(75) = K  |  chr(76) = L  |  chr(77) = M  |  chr(78) = N  |  chr(79) = O  |  chr(80) = P  |  chr(81) = Q  |  chr(82) = R  |  chr(83) = S  |  chr(84) = T  |  chr(85) = U  |  chr(86) = V  |  chr(87) = W  |  chr(88) = X  |  chr(89) = Y  |  chr(90) = Z  |  chr(91) = [  |  chr(92) = \  |  chr(93) = ]  |  chr(94) 

In [68]:
print("| Code décimal | Caractère |")
print("|:--------|----------:|")
for i in range (32,127) :
    print(f"| chr({i}) | " + chr(i) + " |")

| Code décimal | Caractère |
|:--------|----------:|
| chr(32) |   |
| chr(33) | ! |
| chr(34) | " |
| chr(35) | # |
| chr(36) | $ |
| chr(37) | % |
| chr(38) | & |
| chr(39) | ' |
| chr(40) | ( |
| chr(41) | ) |
| chr(42) | * |
| chr(43) | + |
| chr(44) | , |
| chr(45) | - |
| chr(46) | . |
| chr(47) | / |
| chr(48) | 0 |
| chr(49) | 1 |
| chr(50) | 2 |
| chr(51) | 3 |
| chr(52) | 4 |
| chr(53) | 5 |
| chr(54) | 6 |
| chr(55) | 7 |
| chr(56) | 8 |
| chr(57) | 9 |
| chr(58) | : |
| chr(59) | ; |
| chr(60) | < |
| chr(61) | = |
| chr(62) | > |
| chr(63) | ? |
| chr(64) | @ |
| chr(65) | A |
| chr(66) | B |
| chr(67) | C |
| chr(68) | D |
| chr(69) | E |
| chr(70) | F |
| chr(71) | G |
| chr(72) | H |
| chr(73) | I |
| chr(74) | J |
| chr(75) | K |
| chr(76) | L |
| chr(77) | M |
| chr(78) | N |
| chr(79) | O |
| chr(80) | P |
| chr(81) | Q |
| chr(82) | R |
| chr(83) | S |
| chr(84) | T |
| chr(85) | U |
| chr(86) | V |
| chr(87) | W |
| chr(88) | X |
| chr(89) | Y |
| chr(90) | Z |
| c

| Code décimal | Caractère |
|:--------|----------:|
| chr(32) |   |
| chr(33) | ! |
| chr(34) | " |
| chr(35) | # |
| chr(36) | $ |
| chr(37) | % |
| chr(38) | & |
| chr(39) | ' |
| chr(40) | ( |
| chr(41) | ) |
| chr(42) | * |
| chr(43) | + |
| chr(44) | , |
| chr(45) | - |
| chr(46) | . |
| chr(47) | / |
| chr(48) | 0 |
| chr(49) | 1 |
| chr(50) | 2 |
| chr(51) | 3 |
| chr(52) | 4 |
| chr(53) | 5 |
| chr(54) | 6 |
| chr(55) | 7 |
| chr(56) | 8 |
| chr(57) | 9 |
| chr(58) | : |
| chr(59) | ; |
| chr(60) | < |
| chr(61) | = |
| chr(62) | > |
| chr(63) | ? |
| chr(64) | @ |
| chr(65) | A |
| chr(66) | B |
| chr(67) | C |
| chr(68) | D |
| chr(69) | E |
| chr(70) | F |
| chr(71) | G |
| chr(72) | H |
| chr(73) | I |
| chr(74) | J |
| chr(75) | K |
| chr(76) | L |
| chr(77) | M |
| chr(78) | N |
| chr(79) | O |
| chr(80) | P |
| chr(81) | Q |
| chr(82) | R |
| chr(83) | S |
| chr(84) | T |
| chr(85) | U |
| chr(86) | V |
| chr(87) | W |
| chr(88) | X |
| chr(89) | Y |
| chr(90) | Z |
| chr(91) | [ |
| chr(92) | \ |
| chr(93) | ] |
| chr(94) | ^ |
| chr(95) | _ |
| chr(96) | ` |
| chr(97) | a |
| chr(98) | b |
| chr(99) | c |
| chr(100) | d |
| chr(101) | e |
| chr(102) | f |
| chr(103) | g |
| chr(104) | h |
| chr(105) | i |
| chr(106) | j |
| chr(107) | k |
| chr(108) | l |
| chr(109) | m |
| chr(110) | n |
| chr(111) | o |
| chr(112) | p |
| chr(113) | q |
| chr(114) | r |
| chr(115) | s |
| chr(116) | t |
| chr(117) | u |
| chr(118) | v |
| chr(119) | w |
| chr(120) | x |
| chr(121) | y |
| chr(122) | z |
| chr(123) | { |
| chr(124) | | |
| chr(125) | } |
| chr(126) | ~ |

In [3]:
from IPython.display import Markdown
    
chaine ='''| Code décimal | Caractère |
|:--------|----------:|\n'''
 
for i in range (32,127) :
    chaine += f"| chr({i}) | {chr(i)} |\n"
Markdown(chaine)

| Code décimal | Caractère |
|:--------|----------:|
| chr(32) |   |
| chr(33) | ! |
| chr(34) | " |
| chr(35) | # |
| chr(36) | $ |
| chr(37) | % |
| chr(38) | & |
| chr(39) | ' |
| chr(40) | ( |
| chr(41) | ) |
| chr(42) | * |
| chr(43) | + |
| chr(44) | , |
| chr(45) | - |
| chr(46) | . |
| chr(47) | / |
| chr(48) | 0 |
| chr(49) | 1 |
| chr(50) | 2 |
| chr(51) | 3 |
| chr(52) | 4 |
| chr(53) | 5 |
| chr(54) | 6 |
| chr(55) | 7 |
| chr(56) | 8 |
| chr(57) | 9 |
| chr(58) | : |
| chr(59) | ; |
| chr(60) | < |
| chr(61) | = |
| chr(62) | > |
| chr(63) | ? |
| chr(64) | @ |
| chr(65) | A |
| chr(66) | B |
| chr(67) | C |
| chr(68) | D |
| chr(69) | E |
| chr(70) | F |
| chr(71) | G |
| chr(72) | H |
| chr(73) | I |
| chr(74) | J |
| chr(75) | K |
| chr(76) | L |
| chr(77) | M |
| chr(78) | N |
| chr(79) | O |
| chr(80) | P |
| chr(81) | Q |
| chr(82) | R |
| chr(83) | S |
| chr(84) | T |
| chr(85) | U |
| chr(86) | V |
| chr(87) | W |
| chr(88) | X |
| chr(89) | Y |
| chr(90) | Z |
| chr(91) | [ |
| chr(92) | \ |
| chr(93) | ] |
| chr(94) | ^ |
| chr(95) | _ |
| chr(96) | ` |
| chr(97) | a |
| chr(98) | b |
| chr(99) | c |
| chr(100) | d |
| chr(101) | e |
| chr(102) | f |
| chr(103) | g |
| chr(104) | h |
| chr(105) | i |
| chr(106) | j |
| chr(107) | k |
| chr(108) | l |
| chr(109) | m |
| chr(110) | n |
| chr(111) | o |
| chr(112) | p |
| chr(113) | q |
| chr(114) | r |
| chr(115) | s |
| chr(116) | t |
| chr(117) | u |
| chr(118) | v |
| chr(119) | w |
| chr(120) | x |
| chr(121) | y |
| chr(122) | z |
| chr(123) | { |
| chr(124) | | |
| chr(125) | } |
| chr(126) | ~ |


## L'art ASCII :

***
> De [l’art ASCII](https://fr.wikipedia.org/wiki/Art_ASCII) (prononcé [aski:]) consiste à créer des images uniquement à l'aide des lettres et caractères spéciaux contenus dans l'American Standard Code for Information Interchange [ASCII](https://fr.wikipedia.org/wiki/American_Standard_Code_for_Information_Interchange) 
>
> C'est l'ancêtre des [émoticônes](https://fr.wikipedia.org/wiki/Émoticône)...  ;-)

<img src="https://ericecmorlaix.github.io/img/aSki.jpg" alt="dessin skieur" width=40%>
<center>Art ASCII ou art à ski ?</center>

***

Les caractères peuvent être saisis directement par leur code ASCII en utilisant la notation ``\xhh`` où ``hh`` est le code hexadécimal du caractère.

In [36]:
print('\x20' * 6 + '\x5c' + '\x7c' * 3 + '\x2f')
print('\x20' * 6 + '(0 0)')
print('\x2e\x7e\x6f\x6f\x4f\x7e\x7e(\x5f)' + '\x7e' * 6 + '\x2e')

for i in range (0,3):
    if i == 1 :
        print('\x7c  L\'art ASCII  \x7c')
    else :
        print('\x7c' + '\x20' * 15 + '\x7c')
    
print("\x27" + '\x7e' * 11 + "\x6f\x6f\x4f\x7e\x27")

print('\x20' * 5 + '\x7c' + '\x5f' * 2 + '\x7c' + '\x5f' * 2 + '\x7c')
print('\x20' * 6 + '\x7c' * 2 + '\x20' + '\x7c' * 2)
print('\x20' * 5 + '\x6f' * 2 + '\x4f\x20\x4f' + '\x6f'*2)

      \|||/
      (0 0)
.~ooO~~(_)~~~~~~.
|               |
|  L'art ASCII  |
|               |
'~~~~~~~~~~~ooO~'
     |__|__|
      || ||
     ooO Ooo


><h2 class='fa fa-code' style="color: purple"> A coder vous même :</h2>
>
> **Développer** votre avatar en Art ASCII pour signer les docstrings de vos fonctions...

## Chaine de caractères

In [1]:
une_chaine = "Joyeux Anniversaire"

### Quel est le type de cette variable ? - fonction type ()

In [2]:
type (une_chaine)

str

### Quelle est la longueur de cette chaîne de caractères ?

In [3]:
len (une_chaine)

19

<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;border-color:#aabcfe;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:#aabcfe;color:#669;background-color:#e8edff;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:#aabcfe;color:#039;background-color:#b9c9fe;}
.tg .tg-htl6{font-size:14px;font-family:"Comic Sans MS", cursive, sans-serif !important;;border-color:inherit;text-align:center;vertical-align:middle}
.tg .tg-yaja{font-size:14px;font-family:"Comic Sans MS", cursive, sans-serif !important;;border-color:inherit;text-align:center;vertical-align:top}
.tg .tg-l3hy{background-color:#D2E4FC;font-size:14px;font-family:"Comic Sans MS", cursive, sans-serif !important;;border-color:inherit;text-align:center;vertical-align:middle}
.tg .tg-adyi{background-color:#D2E4FC;font-size:14px;font-family:"Comic Sans MS", cursive, sans-serif !important;;border-color:inherit;text-align:center;vertical-align:top}
</style>
<table class="tg">
  <tr>
    <th class="tg-htl6">J</th>
    <th class="tg-htl6">o</th>
    <th class="tg-htl6">y</th>
    <th class="tg-htl6">e</th>
    <th class="tg-htl6">u</th>
    <th class="tg-yaja">x</th>
    <th class="tg-yaja"></th>
    <th class="tg-yaja">A</th>
    <th class="tg-yaja">n</th>
    <th class="tg-yaja">n</th>
    <th class="tg-yaja">i</th>
    <th class="tg-yaja">v</th>
    <th class="tg-yaja">e</th>
    <th class="tg-yaja">r</th>
    <th class="tg-yaja">s</th>
    <th class="tg-yaja">a</th>
    <th class="tg-yaja">i</th>
    <th class="tg-yaja">r</th>
    <th class="tg-yaja">e</th>
  </tr>
  <tr>
    <td class="tg-htl6">0</td>
    <td class="tg-l3hy">1</td>
    <td class="tg-htl6">2</td>
    <td class="tg-l3hy">3</td>
    <td class="tg-htl6">4</td>
    <td class="tg-adyi">5</td>
    <td class="tg-yaja">6</td>
    <td class="tg-adyi">7</td>
    <td class="tg-yaja">8</td>
    <td class="tg-adyi">9</td>
    <td class="tg-yaja">10</td>
    <td class="tg-adyi">11</td>
    <td class="tg-yaja">12</td>
    <td class="tg-adyi">13</td>
    <td class="tg-yaja">14</td>
    <td class="tg-adyi">15</td>
    <td class="tg-yaja">16</td>
    <td class="tg-adyi">17</td>
    <td class="tg-yaja">18</td>
  </tr>
  <tr>
    <td class="tg-htl6">-19</td>
    <td class="tg-l3hy">-18</td>
    <td class="tg-htl6">-17</td>
    <td class="tg-l3hy">-16</td>
    <td class="tg-htl6">-15</td>
    <td class="tg-adyi">-14</td>
    <td class="tg-yaja">-13</td>
    <td class="tg-adyi">-12</td>
    <td class="tg-yaja">-11</td>
    <td class="tg-adyi">-10</td>
    <td class="tg-yaja">-9</td>
    <td class="tg-adyi">-8</td>
    <td class="tg-yaja">-7</td>
    <td class="tg-adyi">-6</td>
    <td class="tg-yaja">-5</td>
    <td class="tg-adyi">-4</td>
    <td class="tg-yaja">-3</td>
    <td class="tg-adyi">-2</td>
    <td class="tg-yaja">-1</td>
  </tr>
</table>

### Les indices dans la chaîne de caractères

In [4]:
une_chaine[0]

'J'

In [5]:
une_chaine[7]

'A'

***!!! On commence à compter à l'indice 0 !!!***

In [6]:
une_chaine.index("J") # donne l'indice du premier J majuscule rencontré dans la chaîne

0

In [7]:
une_chaine.index("e") # donne l'indice du premier e minuscule rencontré dans la chaîne

3

In [8]:
une_chaine[-1] # la première valeur en commençant par la fin

'e'

In [9]:
une_chaine[-19] # == une_chaine[1]

'J'

In [10]:
une_chaine [-len(une_chaine)] # Vous avez compris ?

'J'

# Le slicing

Le **_slicing_** est une méthode applicable à tous les objets de type liste ordonnée (liste ou chaîne de caractère mais pas aux dictionnaires). ll s'agit d'un "découpage en tranches" des éléments d'une liste de manière à récupérer des objets respectant cette découpe.

Pour cela, nous devrons spécifier l'indice de l'élément de départ, l'indice de l'élément d'arrivée (qui ne sera pas compris dans la plage) et le pas de déplacement. Pour une variable v donnée, l'écriture se fera en utilisant la notation entre crochets et en séparant chacun des paramètres par le caractère deux-points: **_v[début:fin:pas]_**. Cette écriture peut se traduire par : les caractères de la variable **_v_** depuis l'indice **_début_** jusqu'à l'indice **_fin_** non compris avec un déplacement de **_pas_** caractère(s).  

Pour bien comprendre le fonctionnement du slicing, nous commencerons par l'appliquer aux chaînes de caractères avant de voir les listes et les tuples.

In [11]:
une_chaine [1:5] # de l'indice 1 inclus à l'indice 5 exclus

'oyeu'

In [12]:
une_chaine [2:] # de l'indice 2 inclus jusqu'à la fin

'yeux Anniversaire'

In [13]:
une_chaine [:-1] # du début à l'indice -1 exclus

'Joyeux Anniversair'

In [14]:
une_chaine [::-1] # en partant de la fin et à l'envers vers le début

'eriasrevinnA xueyoJ'

In [15]:
une_chaine [::2] # afficher tout par pas de 2

'Jyu niesie'

### Les indices en pratique avec une boucle while

In [16]:
une_chaine = "Joyeux Anniversaire"
i = 0
while i < len (une_chaine):
    print ("A l'indice", i, "se trouve la lettre ", une_chaine[i])
    i = i + 1

A l'indice 0 se trouve la lettre  J
A l'indice 1 se trouve la lettre  o
A l'indice 2 se trouve la lettre  y
A l'indice 3 se trouve la lettre  e
A l'indice 4 se trouve la lettre  u
A l'indice 5 se trouve la lettre  x
A l'indice 6 se trouve la lettre   
A l'indice 7 se trouve la lettre  A
A l'indice 8 se trouve la lettre  n
A l'indice 9 se trouve la lettre  n
A l'indice 10 se trouve la lettre  i
A l'indice 11 se trouve la lettre  v
A l'indice 12 se trouve la lettre  e
A l'indice 13 se trouve la lettre  r
A l'indice 14 se trouve la lettre  s
A l'indice 15 se trouve la lettre  a
A l'indice 16 se trouve la lettre  i
A l'indice 17 se trouve la lettre  r
A l'indice 18 se trouve la lettre  e


### Parcours de chaîne avec la boucle for  

In [17]:
une_chaine = "Joyeux Anniversaire"
i = 0
for lettre in une_chaine :
    print ("A l'indice", i, "se trouve la lettre ", lettre)
    i = i + 1

A l'indice 0 se trouve la lettre  J
A l'indice 1 se trouve la lettre  o
A l'indice 2 se trouve la lettre  y
A l'indice 3 se trouve la lettre  e
A l'indice 4 se trouve la lettre  u
A l'indice 5 se trouve la lettre  x
A l'indice 6 se trouve la lettre   
A l'indice 7 se trouve la lettre  A
A l'indice 8 se trouve la lettre  n
A l'indice 9 se trouve la lettre  n
A l'indice 10 se trouve la lettre  i
A l'indice 11 se trouve la lettre  v
A l'indice 12 se trouve la lettre  e
A l'indice 13 se trouve la lettre  r
A l'indice 14 se trouve la lettre  s
A l'indice 15 se trouve la lettre  a
A l'indice 16 se trouve la lettre  i
A l'indice 17 se trouve la lettre  r
A l'indice 18 se trouve la lettre  e


### Script permettant de distinguer les voyelles, les consonnes et les espaces

In [18]:
une_chaine = "Joyeux Anniversaire"
for lettre in une_chaine :
    if lettre in "aeiouyAEIOUY":
        print (lettre, "est une voyelle")
    elif lettre == " ":
        print (lettre, "est un espace")
    else :
        print (lettre, "est une consonne")

J est une consonne
o est une voyelle
y est une voyelle
e est une voyelle
u est une voyelle
x est une consonne
  est un espace
A est une voyelle
n est une consonne
n est une consonne
i est une voyelle
v est une consonne
e est une voyelle
r est une consonne
s est une consonne
a est une voyelle
i est une voyelle
r est une consonne
e est une voyelle


### Script permettant de compter les voyelles, les consonnes et les espaces

In [19]:
une_chaine = "Joyeux Anniversaire"
compteur_voyelles = 0
compteur_consonnes = 0
compteur_espaces = 0
for lettre in une_chaine :
    if lettre in "aeiouyAEIOUY":
        print (lettre, "est une voyelle")
        compteur_voyelles = compteur_voyelles + 1
    elif lettre == " ":
        print (lettre, "est un espace")
        compteur_espaces = compteur_espaces + 1
    else :
        print (lettre, "est une consonne")
        compteur_consonnes = compteur_consonnes + 1
print ("Il y a, dans cette phrase,",compteur_voyelles,"voyelle(s),"\
       ,compteur_consonnes,"consonne(s),",compteur_espaces,"espace(s)")

J est une consonne
o est une voyelle
y est une voyelle
e est une voyelle
u est une voyelle
x est une consonne
  est un espace
A est une voyelle
n est une consonne
n est une consonne
i est une voyelle
v est une consonne
e est une voyelle
r est une consonne
s est une consonne
a est une voyelle
i est une voyelle
r est une consonne
e est une voyelle
Il y a, dans cette phrase, 10 voyelle(s), 8 consonne(s), 1 espace(s)


### Les méthodes de la classe str

In [20]:
help ("str")

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

In [21]:
ma_chaine = "HELLO"
print (ma_chaine)

HELLO


In [22]:
ma_chaine.lower ()

'hello'

In [23]:
ma_chaine_2 = "hello"
print (ma_chaine_2)

hello


In [24]:
ma_chaine_2.upper ()

'HELLO'

In [25]:
ma_chaine_2.capitalize ()

'Hello'

In [26]:
ma_chaine_3 = "   HELLO   "
print (ma_chaine_3)

   HELLO   


In [27]:
ma_chaine_3.strip ()

'HELLO'

In [28]:
ma_chaine_3.strip ().center (40)

'                 HELLO                  '

Il existe de nombreuse méthode pour les chaînes de caratères.
tapez alors juste ***ma_chaine. (n'oubliez pas le point) puis appuyez sur la tabulation***, vous devez voir toutes les méthodes.

|a | b | c | d |
| :-----------: | :----------:|:-----------:|:-----------:|
|x.capitalize | x.isalnum      |    x.join      |    x.rsplit |
|x.casefold   |   x.isalpha     |  x.ljust        | x.rstrip |
|x.center     |   x.isdecimal   |  x.lower       |  x.split|
|x.count      |   x.isdigit     |  x.lstrip      |  x.splitlines |
|x.encode     |   x.isidentifier |  x.maketrans   |  x.startswith |
|x.endswith   |   x.islower     |  x.partition   |  x.strip |
|x.expandtabs |   x.isnumeric   |  x.replace     |  x.swapcase|
|x.find       |   x.isprintable |  x.rfind       |  x.title|
|x.format     |   x.isspace     |  x.rindex      |  x.translate|
|x.format_map |   x.istitle     |  x.rjust       |  x.upper|
|x.index      |   x.isupper     |  x.rpartition  |  x.zfill|

In [None]:
ma_chaine.

In [29]:
print(ma_chaine.count('e'))  #on indique le nombre de fois où le caractère e apparaît dans la chaîne
print(ma_chaine.find('n'))   #on cherche l'indice de la première occurence du caractère v

0
-1


On peut choisir un caractère au hasard dans la chaîne, avec le module **random** et la fonction **choice()** :

In [30]:
from random import choice  #on importe seulement la fonction choice !
choice(ma_chaine)

'E'

### Une chaîne de caractères est immutable (non modifiable) !!!!

In [31]:
une_chaine = ("paris")

In [32]:
une_chaine[0]

'p'

In [33]:
une_chaine[0] = "m" # ne fonctionne évidemment pas ! 

TypeError: 'str' object does not support item assignment

In [34]:
une_chaine_2 = "m" + une_chaine [1:]

In [35]:
une_chaine_2

'maris'

><h2 class='fa fa-code' style="color: purple"> A coder vous même :</h2>
>
> **Ecrire** un script qui recopie une chaîne (dans une nouvelle variable), en insérant des `§` entre les caractères.


In [1]:
maChaineAvant = input()
maChaineApres = ""

for lettre in maChaineAvant :
    
    maChaineApres += lettre + "§"
    
maChaineApres    

toto


't§o§t§o§'

In [3]:
def modifie_chaine(maChaineAvant) :
    
    maChaineApres = ""
    
    for lettre in maChaineAvant :
        
        maChaineApres += lettre + "§"
        
    return maChaineApres

In [5]:
modifie_chaine('toto')

't§o§t§o§'

In [6]:
modifie_chaine('Bonjour')

'B§o§n§j§o§u§r§'

## Revisite en HTML et CSS du tableau des caractères ASCII imprimables avec leurs codes decimal et hexadécimal respectifs

In [90]:
hex(65)

'0x41'

In [91]:
hex(65)[1:]

'x41'

In [92]:
print('\x5c' + (hex(65)[1:]))

\x41


In [7]:
from IPython.display import HTML

chaine = '''
<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;border-color:#aabcfe;margin:0px auto;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:12px 12px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:#aabcfe;color:#669;background-color:#e8edff;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:12px 12px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:#aabcfe;color:#039;background-color:#b9c9fe;}
.tg .tg-c9kt{font-size:16px;font-family:"Comic Sans MS", cursive, sans-serif !important;;text-align:left;vertical-align:middle}
.tg .tg-sd90{font-weight:bold;font-size:16px;font-family:"Comic Sans MS", cursive, sans-serif !important;;text-align:left;vertical-align:middle}
.tg .tg-nyir{background-color:#D2E4FC;font-size:16px;font-family:"Comic Sans MS", cursive, sans-serif !important;;text-align:left;vertical-align:middle}
</style>

<table class="tg">
    <thead>
        <th class="tg-sd90">Code décimal</th>
        <th class="tg-sd90">Caractère</th>
        <th class="tg-sd90">Code hexadécimal</th>
    </thead>
    <tbody>
'''

for i in range (32,127) :
    if i % 2 == 0 :
        chaine += f'<tr><td class="tg-nyir">chr({i})</td><td class="tg-nyir">' + chr(i) + '</td><td class="tg-nyir">\x5c' + (hex(i)[1:]) + '</td></tr>'
    else :
        chaine += f'<tr><td class="tg-c9kt">chr({i})</td><td class="tg-c9kt">' + chr(i) + '</td><td class="tg-c9kt">\x5c' + (hex(i)[1:]) + '</td></tr>'

HTML(chaine +"</tbody></table>" )

Code décimal,Caractère,Code hexadécimal
chr(32),,\x20
chr(33),!,\x21
chr(34),"""",\x22
chr(35),#,\x23
chr(36),$,\x24
chr(37),%,\x25
chr(38),&,\x26
chr(39),',\x27
chr(40),(,\x28
chr(41),),\x29


****
## Références aux programmes :

<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg .tg-cv16{font-weight:bold;background-color:#dae8fc;border-color:inherit;text-align:center}
.tg .tg-xldj{border-color:inherit;text-align:left}
</style>
<table class="tg">
  <tr>
    <th class="tg-cv16">Compétences développées</th>
    <th class="tg-cv16">Capacités attendues</th>
    <th class="tg-cv16">Commentaires</th>
  </tr>
  <tr>
    <td class="tg-xldj">Représentation d’un texte en machine.<br><br>Exemples des encodages ASCII, ISO-8859-1, Unicode</td>
    <td class="tg-xldj">Identifier l’intérêt des différents systèmes d’encodage.<br><br>Convertir un fichier texte dans différents formats d’encodage.</td>
    <td class="tg-xldj">Aucune connaissance précise des normes d’encodage n’est exigible.</td>
  </tr>
</table>

****
## A retenir :



- *A vous de compléter ce mémo*...
- ... 

***

## Prolongement :





<a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" /></a><br />Ce document est mis à disposition selon les termes de la <a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/">Licence Creative Commons Attribution -  Partage dans les Mêmes Conditions 4.0 International</a>.

Pour toute question, suggestion ou commentaire : <a href="mailto:eric.madec@ecmorlaix.fr">eric.madec@ecmorlaix.fr</a>