
# Informatique – Licence 3 Culture Humaniste et Scientifique #
# Listes et traitement de chaînes de caractères  – 26 Novembre 2020 #


## Introduction
Ce document est un "notebook" [Jupyter](https://jupyter.org "Jupyter"). Il permet d'exécuter des bouts de code `Python` sans avoir besoin d'installer `Python` sur sa machine.

Vous avez donc deux possibilités pour faire ce TP. Vous pouvez installer l'une des nombreuses applications permettant de saisir et d'exécuter des programmes `Python`, comme par exemple [Thonny](https://thonny.org "Thonny").

pour vous éviter d'installer quoi que ce soit sur votre machine, vous pouvez utiliser directement ce document dans votre navigateur web.

Ce document est composé de <span style="color:#e71149">**cellules**</span> qui peuvent contenir du <span style="color:#0a4c8e">**texte**</span> comme celle que vous êtes en train de lire, ou du <span style="color:#0a4c8e">**code Python**</span>. Les cellules pouvant contenir du code `python` se repèrent car elles sont marquées `In [ ]:` ou `Entrée [ ]:` à leur gauche.

Cliquer sur une cellule permet de la sélectionner. On repère la cellule sélectionnée par une barre à gauche (par défaut, bleue pour les cellules de texte et verte pour les cellules de code `python`).

Vous pouvez modifier toute cellule de code, en supprimant, changeant ou ajoutant du texte. Pour cela, il suffit de sélectionner la cellule. On peut ensuite l'exécuter directement dans ce document. On peut exécuter une cellule autant de fois que l'on souhaite.

Par exemple, la cellule suivante contient du code permettant juste d'afficher un message.<br>**Pour l'exécuter**&nbsp;: placez le curseur dans la cellule, et tapez `Shift-Entrée` (`Shift` est la touche pour passer temporairement en majuscules, et `Entrée` la touche pour passer à la ligne suivante).

In [None]:
print("Bonjour !\nÉvaluez moi en tapant Shift-Entrée")


**En résumé&nbsp;:** pour exécuter une cellule contenant du code `Python`, cliquez dans la cellule pour faire passer sa couleur en vert (elle devient alors éditable), modifiez-la, puis&nbsp;:
- soit utilisez le bouton `Run` (ou `Exécuter`) de la barre d'outils en haut de cette page web,
- soit tapez `Shift-Entrée` (`Shift` est la touche de passage temporaire en majuscules).

Ce raccourci clavier exécute la cellule, et positionne le curseur dans la cellule suivante. Vous pouvez utiliser ce même raccourci sur une cellule de texte pour passer à la cellule suivante (également si vous avez double-cliqué dans une cellule texte par erreur, pour revenir à l'affichage normal).

**<font color='#a30102'>Attention&nbsp;!</font>** Sauvegardez régulièrement votre travail (menu `File -> Download as -> Python` en anglais, ou `Fichier -> Télécharger au format -> Python` en français, qui enregistre tous les blocs `Python` que vous aurez saisis).


## Listes
On veut manipuler des <span style="color:#e71149">**listes**</span> de valeurs. `Python` peut manipuler des variables représentant non pas une seule valeur, mais un nombre fini arbitraire de valeurs (qui peuvent être de même type, ou pas). Comme c'est une notion utile, voici les éléments principaux à connaître sur les listes, avant de passer aux exercices suivants. L'intérêt de manipuler des listes est de pouvoir, 

- passer une liste de taille quelconque en argument à une fonction (et donc, simuler une fonction qui prend un nombre arbitraire d'arguments),

- retourner des listes de taille quelconque (et donc, simuler une fonction qui retourne un nombre arbitraire d'arguments),

- modifier les listes.

**Création de listes.** On peut donner explicitement une  liste en insérant ses éléments entre crochets, séparés par des virgules. Il y a d'autres façons de créer des listes. Par exemple, on peut former les listes suivantes&nbsp;:

In [None]:
L1 = [2, 3, 5, 7, 11, 13]  # Liste des premiers nombres premiers, donnés explicitement.
print(L1)

L2 = list(range(20))       # Liste L[i] = i pour i de 0 à 19, en utilisant la construction range.
print(L2)

L3 = [x*x*x for x in L1]   # Liste des cubes des éléments de L1.
print(L3)

L4 = [(0,0), (0,1), (1,0)] # Liste de 3 couples d'entiers, donnés explicitement.
print(L4)

L5 = [1, 1.0, "Un", True]  # Liste d'éléments de types divers, donnés explicitement.
print(L5)

**Fonction longueur.** La fonction `len` renvoie la longueur d'une liste&nbsp;:

In [None]:
print(len(L1))
print(len(L2))
print(len(L3))
print(len(L4))
print(len(L5))

On remarque que ces 5 instructions sont similaires, seule varie la liste dont on demande l'affichage de la longueur. On peut utiliser une boucle `for` pour obtenir le même résultat. Pour cela, on fait parcourir à une variable une liste contenant `L1`, `L2`, `L3`, `L4` et `L5`&nbsp;:

In [None]:
for l in [L1, L2, L3, L4, L5]:
    print(len(l))

**Parcours d'une liste par l'instruction `for`.** Dans l'exemple précédent, la notation 
```Python
for <nom_de_variable> in <liste>:
   instructions
```
permet ainsi d'exécuter les `instructions` en faisant prendre à la `variable`, successivement, chaque valeur des éléments de la `liste`. Par exemple, pour parcourir la liste `L1`&nbsp;:

In [None]:
for x in L1:
    print(x, "est un nombre premier")

**Accès à un élément particulier.** On peut accéder à l'élément de position `p` dans une liste `L` par `L[i]`. La numérotation commence à la position `0`. Bien sûr, l'indice `p` doit être légal, donc pas supérieur ou égal à la longueur de la listes.

In [None]:
print(L5[2])

L5[2] = "One"
print("Nouvelle valeur de L5 :", L5)

On peut donc parcourir les éléments d'une liste `L` avec une boucle `for` différente de celle vue ci-dessus&nbsp;: en faisant parcourir à un entier toutes les positions de la liste `L`, entre `0` et `len(L)-1`, de la façon suivante :
```Python
for p in range(len(L)):
    # traiter ici l'élément de L en position p,
    # c'est-à-dire L[p].
```

**Tranches d'éléments successifs.** On peut extraire d'une liste une sous-liste composée d'éléments situés à des indices consécutifs&nbsp;:

In [None]:
print(L1[1:4])  # éléments de L1 entre l'indice 1 et l'indice 3.
print(L1[2:])   # éléments de L1 de l'indice 2 jusqu'à la fin.
print(L1[:-3])  # éléments de L1 sauf les 3 derniers (c'est-à-dire jusqu'à l'indice -3 exclu).

**Concaténation de listes.** On peut enfin concaténer des listes par l'opérateur `+`.

In [None]:
L1 = L1 + [17, 19]
print("Nouvelle valeur de L1 :", L1)

## Traitement de chaînes de caractères
On veut maintenant manipuler des textes. En `Python`, les textes sont **représentés** comme des listes de caractères. On peut affecter un tel texte à une variable, puis effectuer un traitement sur la variable. Pour entrer un texte littéralement, on met ce texte entre guillemets simples ou doubles. On ne peut le faire, cependant, que s'il n'y a pas de retour à la ligne dans le texte. Pour désigner une chaîne de caractères contenant un caractère «&nbsp;retour à la ligne&nbsp;», on délimite la chaîne par 3 guillemets (soit simples, soit doubles), comme dans l'exemple suivant&nbsp;:

In [None]:
mon_texte = '''Un texte sur deux lignes, 
sauvegardé dans une variable.'''

print(mon_texte)

En Python, un texte est facilement converti en liste de caractères. Il suffit pour cela d'utiliser la fonction `list`.

In [None]:
ma_liste = list(mon_texte)
print(ma_liste)

On voit au passage que le retour à la ligne est considéré comme un caractère normal, et qu'il se note 
`\n`. Dans notre exemple, c'est le caractère en position 26.

In [None]:
ma_liste[26]

Simplement, il est interprété par la fonction `print` comme le caractère de fin de ligne.

In [None]:
print(ma_liste[26])

On peut, inversement, convertir une liste de caractères en chaîne. La syntaxe est la suivante&nbsp;:

In [None]:
liste1 = ['L', 'i', 'c', 'e', 'n', 'c', 'e']
print(liste1)
chaine1 = ''.join(liste1) # concatène les chaînes de liste1
print(chaine1)

## Exercice 1
Écrire une fonction `a_en_A` qui prend en argument une chaîne de caractères `s`, et renvoie une chaîne obtenue de `s` en remplaçant tous les 'a' en 'A'.

In [1]:
# Complétez la fonction suivante
def a_en_A(s):
    liste = list(s)
    for i in range(len(liste)):
        if liste[i] == 'a':
            liste[i] = 'A'
    return ''.join(liste)

# Faites ici vos tests
print(a_en_A("Un test de la fonction a_en_A"))

Un test de lA fonction A_en_A


## Exercice 2
1. Écrire une fonction `contient_z(s)` qui prend un paramètre `s` (une chaîne de caractères), et qui teste si cette chaîne `s` contient le caractère `z`. Si c'est le cas, elle devra simplement retourner la valeur `True`, par l'instruction `Python` suivante&nbsp;:
```Python
return True
```

In [2]:
# Complétez la fonction suivante
def contient_z(s):
    liste = list(s)
    # On utilise une variable compteur pour compter les 'z'.
    compteur = 0  
    for i in range(len(liste)):
        if liste[i] == 'z':
            compteur = compteur + 1
    if compteur > 0:
        return True
    else:
        return False


# Faites ici vos tests
print(contient_z("The quick brown fox jumps over the lazy dog."))
print(contient_z("The quick brown fox jumps over the LAZY dog."))
print(contient_z("The quick brown fox jumps over the lame duck."))

True
False
False


2. On veut maintenant paramétrer le caractère à rechercher. Modifier la fonction précédente, pour que la nouvelle fonction, `contient(s, c)`, vérifie si la chaîne `s` contient le caractère `c` passé en paramètre.

In [3]:
# Complétez la fonction suivante
def contient(s, c):
    liste = list(s)
    # On utilise une variable compteur pour compter les 'z'.
    compteur = 0  
    for i in range(len(liste)):
        if liste[i] == c:
            compteur = compteur + 1
    if compteur > 0:
        return True
    else:
        return False

# Faites ici vos tests
print(contient('Un test', 'a'))
print(contient('Un test', 'e'))
print(contient('Un test', ' '))
print(contient('Un test', 't'))

False
True
True
True


3. Modifier la fonction précédente, pour écrire une fonction `compte(s, c)` qui renvoie le **nombre de fois** que la chaîne `s` contient le caractère `c`.

In [4]:
# Complétez la fonction suivante
def compte(s, c):
    liste = list(s)
    # On utilise une variable compteur pour compter les 'z'.
    compteur = 0  
    for i in range(len(liste)):
        if liste[i] == c:
            compteur = compteur + 1
    return compteur

# Faites ici vos tests
print(compte('Un test', 'a'))
print(compte('Un test', 'e'))
print(compte('Un test', ' '))
print(compte('Un test', 't'))

0
1
1
2


4. Modifier à nouveau la fonction précédente pour faire une fonction `premiere_occurrence(s, c)`, qui  retourne la position du premier emplacement du caractère c dans la chaîne `s`. Si le caractère c n’est pas présent, la fonction retournera la valeur -1.

In [None]:
# Complétez la fonction suivante
def premiere_occurrence(s, c):
    liste = list(s)
    for i in range(len(liste)):
        if liste[i] == c:
            return i
    return -1

# Faites ici vos tests
print(compte('Un test', 'a'))
print(compte('Un test', 'e'))
print(compte('Un test', ' '))
print(compte('Un test', 't'))

## Exercice 3
Écrire une fonction `sous_chaine(s1, s2)` qui retourne le nombre de fois que la chaîne `s2` contient la chaîne `s1`. Par exemple, la chaîne `ababa` contient 

- zéro fois la chaîne `aaa`,

- une fois la chaîne `bab` (en position 2), et

- deux fois la chaîne `aba` (notez que ces deux occurrences se chevauchent).

In [None]:
def sous_chaine(s1, s2):
    pass

print(sous_chaine('ababa', 'bbb'))
print(sous_chaine('ababa', 'bab'))
print(sous_chaine('ababa', 'aba'))

## Exercice 4

1. Écrire une fonction `nlignes(t)` qui compte le nombre de lignes du texte t. Vous pouvez reprendre l’une des fonctions de l'exercice 2.

In [None]:
def nlignes(t):
    pass

2. Écrire une fonction `nmots(t)` qui compte le nombre de mots du texte t. On pourra utiliser les fonctions suivantes, qui sont pré-définies&nbsp;:
- `isspace(c)`, qui teste si le caractère `c` est un espace (soit un espace, soit un caractère de tabulation, soit un caractère `\n` de retour à la ligne),

- `isalpha(c)`, qui teste si `c` est une lettre de l’alphabet, majuscule ou minuscule, et éventuellement accentuée.

In [None]:
def nmots(t):
    pass

Pour tester les deux fonctions ci-dessus, on pourra utiliser un fichier texte `Ulysse.txt` et la suite d’instructions suivante, après avoir remplacé les ‘...’ par le chemin d’accès au fichier Ulysse.txt&nbsp;:

In [None]:
import os
f = open('Ulysse.txt', 'r', encoding = "UTF8")
t = f.read()
print("nombre de lignes : ", nlignes(t), "nombre de mots : ", nmots(t))
f.close()

### Exercice 4
On représente un point $P$ dans le plan par un couple $(x,y)$, où $x$
est l'abscisse de $P$ et où $y$ est son ordonnée. En Python, si `P` est
le couple `(x,y)`, on accède à la valeur de `x` par `P[0]` et à
celle de `y` par `P[1]`.

1.  Écrire une fonction `distance(P1, P2)` qui prend en arguments deux
points $P_1$ et $P_2$ et qui retourne la distance entre ces
points. Pour utiliser la fonction _racine carrée_, insérer la
ligne `from math import *` avant l'utilisation. La fonction
racine carrée est alors accessible par `sqrt`.

**Rappel&nbsp;:** la distance entre deux points $(x_1,y_1)$ et $(x_2,y_2)$
est $\sqrt{(x_1-x_2)^2+(y_1-y_2)^2}$.

In [None]:
from math import *

def distance(P1, P2):
    pass

# Tests
print(distance((1,1), (1,1)))  # résultat attendu : 0.0
print(distance((0,1), (1,1)))  # résultat attendu : 1.0
print(distance((0,0), (1,1)))  # résultat attendu : 1.4142135623730951

2.  Écrire une fonction `distance_minimale(L)` prenant en
    argument une liste `L` de points du plan et qui retourne
    `None` si cette liste a moins de deux éléments, et deux
    points $P$ et $Q$ de la liste situés à des positions distinctes dans
    `L` et dont la distance est minimale parmi toutes les
    distances entre points situés à des positions distinctes de
    `L`.
    
    **Rappels.** On accède à la longueur d'une liste `L` par
    `len(L)`. Connaissant une position `i` dans la liste, entre
    0 et `len(L)-1`, on accède à l'élément à cette position par
    `L[i]`. Enfin, on peut parcourir toutes les positions grâce à une
    boucle `for i in range(len(L))`.