# TD3 - Listes et chaînes de caractères

**Objectifs**:

- parcourir des objets de type `list` ou `str`
- construire une liste ou une chaîne modifiée
- construire une variable d'accumulation

**Resssources**: 
- polycopié *Algorithmique* - chapitre 4 (Blocs de répétition (finies/conditionnelles))
- documentation officielle: [tutoriel 3.1.2 - chaînes de caractères](https://docs.python.org/fr/3/tutorial/introduction.html#strings), [tutoriel 3.1.3 - listes](https://docs.python.org/fr/3/tutorial/introduction.html#lists)

## Indices des éléments, parcours, concaténation

### Indice:
La fonction `len` (*length*) permet de récupérer le nombre d'éléments d'une liste ou d'une chaîne de caractères. Les éléments sont *numérotés* à partir de 0

In [1]:
a = "Hello"
b = [3, 5.12, -7]
for i in range(len(a)):
    print(i, ": ", a[i])
for i in range(len(b)):
    print(i, ": ", b[i])

0 :  H
1 :  e
2 :  l
3 :  l
4 :  o
0 :  3
1 :  5.12
2 :  -7


### Concaténation

* Les `list` peuvent être *concaténer* pour former une `list` plus grande.
* Les `str` peuvent aussi être *concaténer*

In [2]:
a = a + " les SIO1" # concaténation et enregistrement dans a
print(a)
b = b + [8, 9, 10] # concaténation et enregistrement dans b
print(b)

Hello les SIO1
[3, 5.12, -7, 8, 9, 10]


### Conversion `str` → `list`, `list` → `str` (quand c'est possible)

De ce fait, la *conversion* `str` → `list` est possible, et `list`→ `str` quand la liste ne contient que des caractères ou chaînes de caractères; observez:

In [3]:
A = list(a)
print("A: ", A)
c = ['B', 'T', 'S', ' ', 's', 'io']
C = ''.join(c) # concaténer tous les éléments de c avec une chaîne vide
D = '-'.join(c) # concaténer avec un tiret de séparation
print("concaténation avec chaîne vide: ", C, "; séparer par tiret: ", D)

A:  ['H', 'e', 'l', 'l', 'o', ' ', 'l', 'e', 's', ' ', 'S', 'I', 'O', '1']
concaténation avec chaîne vide:  BTS sio ; séparer par tiret:  B-T-S- -s-io


### `str` non modifiable, `list`: modifiable

Une différence essentielle entre le type `list` et le type `str`: les éléments des listes sont *modifiables*, pas ceux d'une `str`. Observez:

In [4]:
c[1] = 'Z' # voir c ci-dessus
print(c)
a[1] = 'a' # va provoquer une erreur

['B', 'Z', 'S', ' ', 's', 'io']


TypeError: 'str' object does not support item assignment

En règle générale, pour manipuler une chaîne de caractères `C`:

* on initialise une liste vide `L ← []` ou une chaîne vide `sortie ← ""`
* on parcourt les éléments de `C`
* selon l'algorithme, on ajoute un nouvel élément à `L`, ou on concatène `sortie ← sortie + *une str*`
* si l'algorithme doit renvoyer une `str` à la fin, on concatène les éléments de `L` selon l'exemple vu plus haut: `"".join(L)` ou on renvoie `sortie` qui est déjà du bon type.

Parfois, pour des algorithmes de comptage, on initialisera plutôt un compteur entier (par exemple: pour compter les voyelles, compter les majuscules, compter les espaces…)

---

## Code Unicode des caractères

Tous les caractères alphanumériques sont définis dans une table internationale standard: la **table Unicode**. À chaque caractère est attribué un nombre dans cette table, souvent exprimé en hexadécimal (voir [table Unicode 0000 à FFFF](https://fr.wikipedia.org/wiki/Table_des_caract%C3%A8res_Unicode_(0000-0FFF))).

En python, on dispose des fonctions suivantes:

* `ord(c: str) -> int`: renvoie le code Unicode d'un caractère
* `chr(n: int) -> str`: renvoie le caractère correspondant à l'entier `n` dans la table Unicode

Observez:

In [5]:
print(ord('A'), hex(ord('A'))) # code Unicode de 'A' et son écriture hexadécimale

65 0x41


**Exercice 0**: lire la valeur des codes Unicode de `a` `z`, `é` en hexadécimal dans le tableau wikipédia, puis les convertir en décimal.

---

## Algorithmes sur papier

**Exercice 1**: On veut écrire une fonction `masque2(s: str) -> str` qui prend une chaîne de caractères `s` en entrée et remplace **deux caractères sur 4** par des tirets. Par exemple:

`masque2("HelloWorld")` doit renvoyer '--ll--or--'

1. Quelle serait la sortie avec `s = BonjourSIO`?
2. En division par 4, quels sont les restes possibles? rappeler alors l'écriture générale des indices `i` pour lesquels il faut remplacer le caractère par un tiret.
3. Rédiger en langage naturel la fonction demandée (penser à concaténer en `str` à la fin si vous avez construit une `list`).

```md
fonction masque2(s: str):







```

---
**Exercice 2**: on veut écrire une fonction `grabMaj(s: str) -> str` qui prend une chaîne de caractères `s` en entrée et renvoie la chaîne constituée uniquement des **MAJUSCULES** de `s`.

On supposera d'abord pour simplifier qu'il n'y a pas de caractères accentués majuscules dans `s`.

Par exemple: `grabMaj("BonJouR")` doit renvoyer `BJR`

1. Quelle est la plage des valeurs Unicode correspondant aux majuscules (donner directement en hexadécimal)?
2. Rédiger l'algorithme de la fonction `grabMaj` (si `c` est un caractère, on pourra utiliser `ord(c)` pour obtenir son code Unicode)

```md
fonction grabMaj(s: str):







```
*remarque*: pour un caractère `c`, on peut compléter le test de majuscule par ` OU ( 0xC0 <=ord(c) ET ord(c) <= 0xCF ET (ord(c) not in [0xC2, 0xC3, 0xc4, 0xC5, 0xCC, 0xCD]))` dans votre ligne de test. Cela permet d'avoir réellement toutes les majuscules (même accentuées) en français.

---

**Exercice 3**: on veut écrire une fonction `countNoMaj(s: str) -> int` qui prend une chaîne de caractères `s` en entrée et renvoie le nombre de caractères de `s` **qui ne sont pas des majuscules** (y compris espaces et ponctuation). 

Par exemple: `countNoMaj("BonJouR")` doit renvoyer `4`.

En adaptant le test et le code de l’exercice 2, rédiger la fonction `countNoMaj`.

```md
fonction countNoMaj(s: str):







```



## Implémentation sur machine

**Exercice 4**: sur machine, implémenter les fonctions des exercices 1, 2, 3 et testez-les sur plusieurs chaînes de caractères, dont `c1` et `c2` ci-dessous, pour vérifier leur bon fonctionnement.


In [None]:
c1 = "ABraCaDabra Occus Poccus"
c2 = "les tRépidantEs aVentures de pInce-mi et pince-moi Sont dans un gâtEau, heu un BâTeau: maiS cette histoire est trop longue…"
