# Les chaines de caractères en Python

## 1- introduction
Les chaînes de caractères (string en anglais) sont des textes entre guillemets simples ou doubles : 'Bonjour' ou "Bonjour". L'utilisation d'un type de guillemets ou l'autre ne change pas la façon dont le texte va être traité ; cela permet par contre de mettre l'autre type de guillemets dans le texte :

In [31]:
"Il dit qu'il fait beau"

"Il dit qu'il fait beau"

In [6]:
'Il dit : "il fait beau" et part'

'Il dit : "il fait beau" et part'

Les chaînes de caractères doivent tenir sur une seule ligne par défaut. Un texte de plusieurs lignes doit être délimité par trois guillemets (simples ou doubles, tant que ce sont les mêmes au début et à la fin) :

In [7]:
"""Voici un texte qui
prend plusieurs
lignes"""

'Voici un texte qui\nprend plusieurs\nlignes'

## 2-Opérateurs sur les chaines de caractères
L'opérateur + permet de concaténer deux chaînes de caractères, et l'opérateur * de répéter une chaîne un nombre entier de fois :

In [8]:
"bon"+"jour"

'bonjour'

In [9]:
"ha"*3

'hahaha'

Les opérateurs de comparaison comparent les chaînes selon l'ordre alphabétique. Cependant les majuscules sont différentes des minuscules, et toutes les lettres majuscules précèdent les lettres minuscules : 'A' < 'Z' < 'a' < 'z'. On peut également tester si une chaîne apparait dans une autre chaine avec l'opérateur <code>in</code>, ou si elle n'apparait pas avec l'opérateur <code>not in</code>.

In [10]:
"bon"<"jour"

True

In [11]:
"ha"=="HA"

False

In [12]:
"ou" in "bonjour"

True

In [13]:
"on" not in "bonjour"

False

Une fonction utile pour manipuler les chaînes de caractères est la fonction <code>len(s)</code> qui retourne la longueur de la chaîne s. Par exemple, <code>len('toto') == 4</code> est vrai.

In [30]:
len("bonjour, je me demande quelle est la longueur de cette chaine de caractères!")

76

## 3-Propriétés des chaines de caractères
Les chaînes de caractères forment un type de base en Python. Elles ont cependant certaines caractéristiques des tableaux :

- on peut obtenir la longueur d'une chaîne ch par la fonction Python <code>len(ch)</code> ;
- on peut accéder aux caractères de la chaîne avec la notation indexée <code>ch[i]</code>. Par exemple <code>ch[0]</code> renvoie le 1er caractère, <code>ch[1]</code> renvoie le 2eme caractère, <code>ch[-1]</code> renvoie le dernier caractère, 

Cependant les chaînes sont immuables : on ne peut pas modifier leur contenu.

L'affectation <code>ch[i] = "X"</code> provoque une erreur ;

- on peut énumérer les caractères d'une chaîne par <code>for car in ch:</code> .

On peut créer un tableau à partir d'une chaîne de caractères chaine en « découpant » celle-ci avec la méthode <code>chaine.split(separateur)</code>, qui prend en argument une autre chaîne de caractères separateur et retourne un tableau contenant les éléments de chaine initialement séparés par separateur. A l'inverse, la méthode <code>join</code> crée une chaîne de caractères en « collant » ensemble les éléments d'un tableau de chaînes avec un séparateur :

In [10]:
phrase="Je programme en Python"
print(f"Cette phrase contient {len(phrase)} caractères. Le premier caractère est {phrase[0]} et le dernier est {phrase[-1]}")

mots=phrase.split(" ")     #['Je', 'programme', 'en', 'Python']
print(mots)


mots[1]="progresse"
phrase=" ".join(mots)
print(phrase)              #Je progresse en Python

for car in phrase:         #On parcourt la chaine caractère par caractère
    print (car*3)

Cette phrase contient 22 caractères. Le premier caractère est J et le dernier est n
['Je', 'programme', 'en', 'Python']
Je progresse en Python
JJJ
eee
   
ppp
rrr
ooo
ggg
rrr
eee
sss
sss
eee
   
eee
nnn
   
PPP
yyy
ttt
hhh
ooo
nnn


### Exercice 1
Écrire une fonction <code>ValidPassword</code> qui prend en paramètre une chaine de caractère (le mot de passe) et retourne True si celui-ci vérifie les propriétés suivantes :
- il a au moins 8 caractères
- il a au moins une majuscule
- il a au moins une minuscule
- il a au moins un chiffre

Pour cela, on pourra utiliser les codes ascii des caractère pour faire des vérifications. Voici quelques exemples :

In [7]:
# Programme pour trouver le code ASCII d'un caractère
caractere = 'p'
print(f"Le code ASCII de {caractere} est {ord(caractere)}")

#à l'inverse, chr() permet de trouver le caractère correspondant à un code ascii
print(f"Le caractère dont le code ASCII est 100 est {chr(100)}")


#vérifier si un caractère est une majuscule
caractere_A="A"
caractere_Z="Z"
print(f"Le code ASCII de {caractere_A} est {ord(caractere_A)}")
print(f"Le code ASCII de {caractere_Z} est {ord(caractere_Z)}")

if ord(caractere_A)<ord(caractere)<ord(caractere_Z):
    print(f"{caractere} est une majuscule")
else:
    print(f"{caractere} n'est pas une majuscule")

Le code ASCII de p est 112
Le caractère dont le code ASCII est 100 est d
Le code ASCII de A est 65
Le code ASCII de Z est 90
p n'est pas une majuscule


### Exercice 2
Écrire une fonction <code>nb_mots</code> qui retourne le nombre de mots d'une chaine de caractère. On suppose que tous les mots sont séparés par des espaces. Ainsi <code>nb_mots("ce petit chat est malade")</code> renvoie 5.

(la méthode <code>split</code> vue dans ce cours peut-être utilisée)

### Exercice 3
Écrire une fonction <code>longueur_mots</code> qui prend en paramètre une phrase (une chaîne de caractères) et retourne un tableau contenant la longueur des mots qui la composent. Ainsi, <code>longueur_mots("ce petit chat est malade")</code> retourne [2, 5, 4, 3, 6].

(la méthode <code>split</code> vue dans ce cours peut-être utilisée. Les élèves les plus avancés ne l'utiliseront pas)

## 4-Slices
Pour terminer, on peut utiliser les "slices" pour accéder à une partie d'une chaine de caractère.
La syntaxe à utiliser est <code>chaine[début:fin]</code> où début est l'indice du premier caractère qu'on affiche et fin est l'indice du premier caractère qui ne **sera pas** affiché.

Par exemple <code>"bonjour"[2:5]</code> devrait afficher les caractères 2,3 et 4 de cette chaine, mais pas le 5ème.

In [15]:
"bonjour"[2:5]

'njo'

cette syntaxe de slice marche aussi avec les listes! 

In [17]:
maliste=["bonjour","comment","ça","va"]
print(maliste[1:3])

['comment', 'ça']


Il est aussi à noter que le dernier indice d'une chaine ou d'une liste a pour valeur <code>len(ChaineOuListe)-1</code>, mais que Python permet d'y accéder directement avec l'indice -1.

De même on peut écrire l'indice -2 pour accéder à l'avant dernier élément ou -3 pour l'avant-avant-dernier, etc...

In [28]:
#quelques exemples de slices
machaine="salut tout le monde"
print(machaine[0:5])   #les 5 premiers caractères (de 0 à 4)
print(machaine[-2])    #l'avant-dernier caractère
print(machaine[5:-1])  #le reste de la chaine (du 5eme caractère au dernier non inclus)
print(machaine[5:])    #si on ne met pas de fin, la slice va jusqu'au bout

#c'est pareil avec des listes
maliste=[i**2 for i in range(21)] #tous les carrés de 0 à 20 (liste en compréhension)
print(maliste)
print(maliste[0:5])   #les 5 premiers éléments (de 0 à 4)
print(maliste[-2])    #l'avant-dernier caractère
print(maliste[5:-1])  #le reste de la liste (du 5eme élément au dernier non inclus)
print(maliste[5:])    #si on ne met pas de fin, la slice va jusqu'au bout

salut
d
 tout le mond
 tout le monde
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400]
[0, 1, 4, 9, 16]
361
[25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361]
[25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400]


### Exercice 4
Un palindrome est un mot qui s'écrit de la même façon de la gauche vers la droite que de la droite vers la gauche. Par exemple, laval et kayak sont des palindromes.

Écrire une fonction <code>palindrome</code> qui prend en paramètre une chaîne de caractères et retourne True si cette chaine est un palindrome. Ainsi, <code>palindrome("laval")</code> retourne True.

### Exercice 5
Écrire une fonction <code>extrait_nom</code> qui prend en paramètre un courriel de stanislas et retourne le prénom et le nom de cette personne. Cette fonction renvoie None si l'adresse n'est pas valide.

Ainsi, <code>extrait_nom("erwan.gouello@stanislas.qc.ca")</code> retourne "Erwan Gouello".
Par contre, <code>extrait_nom("toto@yahoo.ca")</code> retourne None.
