CHAINES DE CARACTERE

# Définition plus précise

Nous avons vu dans les cours précédents que les chaînes de caractères étaient en fait des suites ordonnés de caractère. Ce sont un peu des listes de caractères. La manipulation de texte ou de chaîne de caractère est quelque chose de courant en Python.

## Rappel des index

Chaque caractère alphanumérique dispose d'un index dans une string. On peut y accéder en entrant l'index, qui est toujours un nombre entier et part toujours de 0, ainsi :

| H | e | l | l | o |   | W | o | r | l | d  |    | !  | !  | !  |
|---|---|---|---|---|---|---|---|---|---|----|----|----|----|----|
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |

In [None]:
ma_chaine = "Hello World !!!"
ma_chaine[0]

C'est pour cela que l'on peut itérer sur un objet comme les strings.

In [None]:
ma_chaine = "Hello World !!!"

for i in ma_chaine:
    print(i)

## Sélection d'index

On peut tout à fait sélectionner différents index à la fois en leur indiquant un début et une fin. Pour cela on les sépare par un ``:`` pour créer une plage, un _range_, c'est-à-dire que l'on indique un début et une fin. On appelle aussi cela des _slice_, c'est-à-dire des sous-strings (_substrings_), c'est donc un morceau, un extrait de la chaîne de caractère.

```python
ma_chaine[x,y]
```

Attention car **x est inclusif**, et **y est exclusif**. C'est-à-dire que la fonction de _slice_ prend en compte l'élément x mais s'arrête lorsqu'il rencontre l'élément y, et donc ne le prend pas en compte.


Mais n'oubliez pas que Python commence à compter par 0 ! Par exemple :

In [None]:
ma_chaine = "Hello World !!!"

print(ma_chaine[0:1])
print(ma_chaine[0:4])
print(ma_chaine[4:6])
print(ma_chaine[12:15])

On peut aussi le remplacer par des nombres négatifs. Dans ce cas là le calcul de l'index se fait en partant de la fin :

| H   | e   | l   | l   | o   |     | W  | o  | r  | l  | d  |    | !  | !  | !  |
|-----|-----|-----|-----|-----|-----|----|----|----|----|----|----|----|----|----|
| -15 | -14 | -13 | -12 | -11 | -10 | -9 | -8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 |

In [None]:
ma_chaine = "Hello World !!!"

print(ma_chaine[-2:-1])
print(ma_chaine[-9:-4])
print(ma_chaine[-15:-10])

Si on laisse x ou y vide, on signifie qu'on sélectionne tout. Ex:

In [None]:
ma_chaine = "Hello World !!!"

print(ma_chaine[3:])
print(ma_chaine[:-4])

On peut également ajouter, tout comme la fonction ``range()``, la notion de ``step``, de pas. En indiquant deux, on signignifie qu'on ne sélectionne qu'un caractère sur deux.

In [None]:
ma_chaine = "Hello World !!!"

print(ma_chaine[0:-1:1])
print(ma_chaine[::2])

## La concaténation

C'est le fait d'assembler, de coller, des chaînes de caractères ou des caractères entre eux. Sous Python c'est facile, nous l'avons déjà vu, il suffit d'utiliser l'opérateur ``+`` comme si c'était des nombres !

In [None]:
chaine1 = "Hello "
chaine2 = "World !!!"

print(chaine1 + chaine2)

## Exercice (facile)

Écrivez un programme qui recompose correctement la liste des jours en ajoutant **"di"** quand il le faut. Vous pouvez utiliser au choix une boucle ``for`` ou bien une liste compréhensive. (Le deuxième choix étant meilleur d'un point de vue performances).

```python

jours_tronques = ["lun", "mar", "mercre", "jeu", "vendre", "same", "manche"]

```

Attention, il y a une exception pour dimanche, faites un test pour régler le problème !


## Majuscules et minuscules

Les méthodes ``.upper()`` et ``.lower()`` permettent de mettre en majuscule ou en minuscule une chaîne de caractères. Exemple : 

In [None]:
cri = "INUTILE DE CRIER !"
chuchotement = "peux-tu parler plus fort ?"

print(cri.lower())
print(chuchotement.upper())

## La fonction ``len()``

La fonction ``len()``, abréviation de _lenght_ en anglais (la longueur), permet de déterminer combien de caractères possède une string, ou tout autre objet itérable par ailleurs. Attention car ``len()`` retourne le nombre d'élément pas l'index maximum ! Ex:

In [None]:
ma_chaine = "Hello World !!!"

une_liste = ["une chose", "encore une autre élément", "et un troisième élément !"]

print(len(ma_chaine)) # 15 caractères dont retourne 15. Mais l'index va de 0 à 14
print(len(une_liste)) # 3 éléments, donc retourne 3. Mais l'index va de 0 à 2

## Compter le nombre de fois qu'apparaît un mot dans une string

Pour ne pas faire une boucle, on peut utiliser la méthode ``.count()``. Notez que la **casse**, le fait que les mots commencent par une majuscule ou une minuscule, est importante. En effet en programmation un "H" n'est pas égal à un "h".

Par exemple :

In [None]:
ma_chaine = "Hello World ! Hello, dear old world."

print("Nombre de 'Hello':", ma_chaine.count("Hello"))
print("Nombre de 'hello':", ma_chaine.count("hello"))
print("Nombre de 'World':", ma_chaine.count("World"))
print("Nombre de 'world':", ma_chaine.count("world"))

## L'ASCII

Si vous vous souvenez de l'introduction, vous savez que tout caractère est rattaché à un nombre qui le définit. Pour le trouver on peut utiliser la fonction ``ord()``. Pour faire le chemin inverse et afficher le caractère correspondant à un chiffre, on peut utiliser la fonction ``chr()``.

In [None]:
print("Code ASCII de 'h':", ord('h'))
print("Code ASCII de 'H':", ord('H'))
print("Code ASCII de ' ':", ord(' '))
print("Code ASCII de '@':", ord('@'))

**NOTE**: Les puristes pourront trouver le nombre en hexadécimal avec la fonction ``hex()``

In [None]:
print("Code ASCII en héxadécimal de 'h':", hex((ord('h'))))
print("Code ASCII en héxadécimal de 'H':", hex((ord('H'))))

## Exercice (moyen)

La lettre "e" est la plus répandue dans la langue française, elle est présente en moyenne une fois sur 5 !
Compter combien de fois la lettre "e" est présente dans chacun des textes suivants ? Comme cette lettre peut prendre différents accents et que la méthode ``.count()`` ne prend qu'une seule string comme paramètres, vous ne pouvez pas l'utiliser. 

**ASTUCES**:

- Utilisez plutôt un ``if``... ``in`` à la place du ``.count``.
- ``in`` fonctionne aussi avec les listes !
- Attention avec les majuscules et les minuscules ! Il va falloir gérer cela.   


In [None]:
baudelaire = """
Pour l'enfant, amoureux de cartes et d'estampes,
L'univers est égal à son vaste appétit.
Ah ! que le monde est grand à la clarté des lampes !
Aux yeux du souvenir que le monde est petit !

Un matin nous partons, le cerveau plein de flamme,
Le coeur gros de rancune et de désirs amers,
Et nous allons, suivant le rythme de la lame,
Berçant notre infini sur le fini des mers.
"""

perec = """
Il ouvrit son frigo mural, il prit du lait froid, il but un grand bol.
Il s'apaisait. Il s'assit sur son cosy, il prit un journal qu'il parcourut d'un air distrait.
Il alluma un cigarillo qu'il fuma jusqu'au bout quoiqu'il trouvât son parfum irritant. Il toussa.
"""

## Fonction .split()

Cette fonction permet de transformer une string en une liste grâce à un séparateur. Par défaut celui-ci est l'espace " ". Exemple :

In [None]:
encore_une_string = "bonjour, je suis une phrase. Donc je suis composé de plusieurs mots, logique, non ?"
encore_une_string.split()

In [None]:
Mais on pourrait choisir comme séparateur la virgule par exemple :

In [None]:
encore_une_string = "bonjour, je suis une phrase. Donc je suis composé de plusieurs mots, logique, non ?"
encore_une_string.split(",")

## Exercice (moyen)

Créez une liste où chaque élément de la phrase suivante est un mot dont la première lettre commence par une majuscule.

**ASTUCES**:

- Cela ne nécessite qu'une seule ligne avec une liste compréhensive
- N'oubliez pas les principes de la concaténation et des slices !
- La méthode pour mettre des caractères en majuscule est ``.upper()`` au cas où vous l'auriez oublié.

In [None]:
texte = "Python est un langage qui peut s'utiliser dans de nombreux contextes et s'adapter à tout type d'utilisation grâce à des bibliothèques spécialisées."    

## Exercice (moyen)

Reprenez le résultat du dernier exercice, mais ajoutez une boucle ``for`` à la fin pour transformer cette liste en la même string que celle de départ (à l'exception des premières lettres de chaque mot seront capitalisées bien sûr.)

**ASTUCES**:

- Réutilisez le résultat de la liste compréhensive
- Pour créer une chaine de caractères vide, on peut écrire ``ma_chaine = ""``