# CH4 Chaînes et listes

Après les données de type ```bool```, ```int``` ou encore ```float```, nous allons étudier dans cette partie  deux autres types de données que l'on rencontre en programmation.


## 1. Les chaînes de caractères (données de type ```str```)

### *1.1. Structures des chaînes* 

>On appelle chaîne de caractères en python toute donnée formée par une succession de caractères alphanumériques dans un encodage particulier (voir plus loin pour ces encodages).
Elle est notée entre guillemets.

Les caractères sont "rangés" suivant un indice croissant. On accède au caractère en demandant la valeur de l'objet d'indice visé de la chaîne.


In [None]:
mot = "bonjour"   # la variable mot est de type str
type(mot)

In [None]:
print(mot[0])    # affiche le caractère d'indice 0 (le premier)
print(mot[2])    # affiche le caractère d'indice 2 (le troisième)

Quelques mot-clés et méthodes utiles :

|||
|:-:|:-:|
|**\n**|Caractère spécial de saut de ligne|
|**\t**|Caractère spécial de tabulation (4 espaces)|
|**mot1 + mot2**|Concaténation : on ajoute mot2 à la chaîne mot1|
|**len(chaine)**|Nombre de caractères de la chaîne|
|**chaine[-1]**|Dernier caractère de la chaîne ([-2] avant-dernier, etc...)|
|**chaine[i:j]**|Caractères de la chaîne indexés de i à j-1 inclus|

Pour afficher tous les caractères, on peut utiliser une boucle ```for```: 

In [None]:
for lettre in mot:
    print(lettre)

***Exemples :***
1. Tester les différentes propriétés sur les chaînes.
2. Ecrire d'une autre façon l'affichage de tous les caractères d'une chaîne.

Tester le code suivant :

In [None]:
chaine = "pithon"    # on veux remplacer la lettre "i" d'indice 1 par "y"
chaine[1] = "y"

# Comment faire alors ... ?

> IMPORTANT : les chaînes de caractères sont dites *NON MUTABLES*.

**ACT1 Lettres**



 
### *1.2. Le code ASCII*

Aujourd’hui, les ordinateurs ne sont plus, loin de là, de simples calculateurs. Il est donc important de pouvoir également coder facilement du texte.
Pour cela, on utilise notamment le **code ASCII** (American Standard Code for Information Interchange) ; une norme informatique du codage de caractère apparue dans les années 1960.

La norme ASCII définit 128 codes (numérotés de 0 à 127 et codés sur 7 bits).Ceci comprend 95 caractères imprimables (chiffres de 0 à 9, lettres minuscules et majuscules de A à Z, des symboles mathématiques et de la ponctuation) : <a href="http://cosmos2000.chez.com/Nombres/ASCII.html">table ASCII</a>

Même si 7 bits suffisent pour représenter 128 caractères, en pratique chaque caractère occupe un octet en mémoire. Le bit de poids fort est utilisé pour une somme de contrôle afin de détecter d’éventuelles erreurs de transmission : sa valeur est fixée de façon à ce que le nombre de bits à 1 dans l’octet soit toujours pair. On parle de bit de parité.

***Exemple :***
On veut trouver l’écriture binaire en norme ASCII du mot « Info ».
 - On lit dans la table que "I" correspond à 73, soit 01001001 en binaire.
 - De même "n" correspond à 01101110, f correspond à 01100110, et o correspond à 01101111.
 - Info s’écrit donc sur 4 octets : 01001001 01101110 01100110 01101111
 
 
***Applications :***
1.  A l’aide de la table ASCII, coder en binaire la phrase suivante : « Je m’amuse en NSI »
2. Voici maintenant une exclamation codée en binaire :
01000010  01110010  01100001 01110110 01101111 00100001
Retrouver cette exclamation. 
3. Peut-on coder en binaire la phrase « Un âne est passé par là. » à l’aide de la table ASCII ? Justifier.

 > La méthode ```ord``` de Python renvoie le code ASCII correspondant à un caractère. L’entier est renvoyé en base 10, que l’on peut convertir en hexadécimal avec la méthode ```hex```.

Inversement la méthode ```chr``` renvoie le caractère correspondant à la valeur (binaire ou hexa).

In [None]:
ord("a")
hex(ord("a"))
chr(0b1011011)
chr(0x26)


### *1.3. Les normes ISO et UNICODE*

Nous avons tous reçu un jour un courrier étrange ou lu une page web telle que celle-ci :
<img src="texte.png">
Comment cela se fait-il ? Pourquoi peut-on comprendre mais pas complètement ?

Il a donc fallu étendre la table ASCII pour pouvoir coder de nouveaux caractères. Les mémoires devenant plus fiables, on a utilisé le 8ème bit pour coder plus de caractères (il était utilisé auparavant pour contrôle). Elle permet l’affichage des caractères accentués de plusieurs langues et de symboles courants. 

> La norme ISO 8859 permet ainsi de coder tous les caractères des langues européennes. Elle utilise 8 bits et permet donc de coder 256 caractères. Elle compte 16 tables.

Cette norme ne permet pas de coder d’autres langues que les langues européennes, par exemple le chinois ou l’arabe.
Il est donc devenu essentiel de proposer une version unifiée internationale des différents encodages de caractères. Ceci a été permis en complétant l’ASCII et en permettant l’encodage de caractères autres que ceux de l’alphabet latin. Unicode définit à cet effet des dizaines de milliers de codes, Les 128 premiers codes restent compatibles avec ASCII.

> L’UTF-8 est l’encodage le plus utilisé. Les navigateurs Internet utilisent ce codage et les concepteurs de sites utilisent à présent presque tous cette même norme. C’est pourquoi il y a de moins en moins de problèmes de compatibilité.


***Exemple :***

1. Coder le mot « défi », en UTF-8    (utiliser le site <a href="https://www.utf8-chartable.de/">https://www.utf8-chartable.de/</a>


2. On ajoute en en-tête de tout code python la ligne :

**A VERIFIER !!**


In [None]:
# -*- coding:Utf-8 -*-


Enregistrer le script python ci-dessous dans un fichier ```mon_script.py``` et le démarrer avec python ```python3 mon_script.py```
Essayer avec ou sans l'en-tête...


In [None]:
# mon_script.py
print("bonjour, où vont les ânes... , nom les âmes ?")

3. Tester également le fichier ```unicode.html```.

## 2. Les listes (données de type ```list```)

Les chaînes sont pratiques et légères à manipuler, mais ce sont des objets *NON MUTABLES*.

En reprenant l'exemple précédent pour changer une lettre dans un mot, il aurait fallu le définir non pas en chaîne de caractères, mais en liste :

In [None]:
chaine = "pithon"    # on veux remplacer la lettre "i" d'indice 1 par "y"
# on écrira plutôt :
chaine = ["p", "i", "t", "h", "o", "n"]
print(chaine)

chaine[1] = "y"
print(chaine)

> Les **listes** (appelées aussi tableaux) vont nous permettre de stocker plusieurs valeurs (chaîne, nombre) dans une structure unique.
Cette structure est cependant assez lourde à mettre en place, mais la liste formée est un objet *MUTABLE* (on peut changer la valeur d'un élément).

L'accès aux valeurs des élément de la liste se fait de la même manière que pour les chaînes de caractères : liste[0] pour le 1er élément à l'indice 0, liste[1] pour le 2ème élément à l'indice 1, etc...

In [None]:
tableau = [1, 7, 9, -4, 3, 2]
print(type(tableau))

Une liste peut contenir toutes sortes d'objets :

In [None]:
liste1 = [1, 2, 3]    # entiers
liste2 = [ 11.2, 4.3, 12.6]    # flottants
liste3 = [[1, 2], [12, 56], [3, 5]]    # d'autres listes
liste4 = ["banane", 12.3, 5, ["serpent", "A"] ]   # mixte

Quelques mot-clés et méthodes utiles :

|||
|:-:|:-:|
|**len(liste)**|Nombre d'éléments de la liste|la liste
|**liste[i] = a**|Affecte la valeur a à l'élément d'indice i de |
|**liste1 + liste2**|Concaténation : on ajoute les éléments de liste2 à liste1|
|**liste.append(elt)**|Ajoute elt à la liste (dernière position)|
|**liste.insert(elt, 2)**|Insère elt à la position d'indice 2|
|**del liste[2]**|Supprime elt à la position d'indice 2|
|**liste.sort()**|Trie la liste|
|**liste[i:j]**|Considère la sous-liste formée des éléments indexés de i à j-1 inclus|
|**list("bonjour")**|Transforme la chaîne "bonjour" en liste (un élément/un caractère)|
|**5 in liste**|Renvoie True si 5 est dans la liste, False sinon|

***Exemples :***
Tester ces différentes méthodes sur des listes.

Il est parfois fastidieux d'écrire des listes de grande taille, voire humainement impossible ... !

> On peut créer des listes par **compréhension** en définissant ses éléments de façon itérative une boucle ```for```.

In [None]:
liste = [i for i in range(100)]    # liste des entiers de 0 à 99

carres = [i**2 for i in range(10)]    # liste des 10 premiers carrés

zeros = [0 for i in range(1000)]    # liste de 1000 zéros

***Exemple :***

Créer par compréhension une liste contenant toutes les lettres de l'alphabet. (utiliser la fonction ```ord()``` et le code ASCII)

Il est possible d'utiliser des fonctions dans les compréhensions de listes :

In [None]:
def poly(x):
    return x**2 - 3*x + 2

liste1 = list(range(-6, 10))    # transforme l'intervalle en liste
liste2 = [poly(nbr) for nbr in liste1]   # crée la liste des valeurs de poly() pour chaque éléments de l'intervalle