# Chaînes de caractères

En plus des nombres, on manipule souvent des informations sous forme de texte: le nom d'une personne, des messages à afficher à l'écran, etc.

En Python, le texte est une information de type ```str``` (pour "string", ou "chaîne de caractères" en Français), et plusieurs opérateurs sont disponibles pour manipuler des données de ce type.

Dans la suite du cours on utilisera souvent le terme "string" au lieu de "chaîne de caractère" pour alléger le texte.
En Python, un ```string``` est représenté par le texte entre des quotes doubles (```"hello"```), ou simples (```'hello'```):

In [1]:
'bonjour'

'bonjour'

In [2]:
"bonjour"

'bonjour'

On remarque que Python nous affiche le string dans les deux cas avec des quotes simples. Ceci n'a aucune importance: les quotes ne font pas partie de la "valeur" qu'on manipule. Les quotes sont seulement nécessaires pour que l'interpréteur Python ne cherche pas à interpréter le texte comme des instructions Python. Par conséquent: 

In [1]:
"bonjour" == 'bonjour'

True

C'est la même chose.

Comme on peut utiliser des quotes simples ou doubles, il est facile d'intégrer des quotes ou des apostrophes dans un texte:

In [4]:
"j'ai faim"

"j'ai faim"

L'apostrophe ``` ' ``` fait partie du texte et n'est pas interprétée comme la délimitation de la chaine de caractères, puisque celle-ci est délimitée par des quotes doubles.
On peut aussi faire l'inverse:

In [5]:
'il a dit "skol"'

'il a dit "skol"'

On peut insérer aussi des retours à la ligne, des tabulations, et d'autres caractères spéciaux, en utilisant des codes particuliers commençant par une barre oblique inverse ```\```. Par exemple, le retour à la ligne s'écrit ```\n``` (pour *newline*), et la tabulation ```\t```: 

In [6]:
print("bonjour, \n petite chèvre!") 

bonjour, 
 petite chèvre!


#### Exercice 1

Écrire un String (un seul) qui s'affichera comme ceci, sur plusieurs lignes et avec les double quotes:

```
A - "alpha"
B - "bravo"
C - "charlie"
```

## Opérations sur les chaînes de caractères
### Concaténation
La principale opération qu'on peut réaliser pour combiner deux string est la *concaténation*, qui utilise le symbole ```+```: cette opération consiste simplement à mettre les deux string bout à bout et obtenir un nouveau String:

In [7]:
"bon" + "jour"

'bonjour'

La concaténation n'insère pas automatiquement des espaces, et l'espace entre le String et le symbole ```+``` ne comptent pas: si on veut séparer des mots il faut ajouter des espaces *dans* les String:

In [8]:
"la" + " " + "petite"+ " chèvre"

'la petite chèvre'

En Python, on peut aussi utiliser la multiplication (```*```) pour répéter plusieurs fois une chaine de caractères:

In [9]:
"hop"*3

'hophophop'

Il sera parfois utile d'incorporer des valeurs numériques dans une chaîne de caractères. Pour ceci, il faut d'abord convertir le nombre en string à l'aide de la fonction ```str()```, et on peut ensuite concaténer:

In [10]:
quantité = 2 * (4 + 2)
resultat_afficher = "J'ai "+str(quantité)+ " pommes."

In [11]:
resultat_afficher

"J'ai 12 pommes."

Lorsqu'on veut afficher le texte à l'écran (avec ```print```), on peut afficher les string et les nombres séparément, sans faire de concaténation:

In [12]:
print("J'ai", quantité, "pommes")

J'ai 12 pommes


La fonction ```print``` s'occupe des conversions, et insère des espaces entre les différents éléments à afficher. 

Cependant, si on doit écrire le résultat dans un fichier, ou le passer à une fonction qui prend un string en entrée, il sera nécessaire de faire les conversions et concaténations.

### Découpage de chaînes de caractères

La concaténation permet de mettre plusieurs chaînes de caractères bout-à-bout pour en former des plus longues. L'opération inverse consiste à découper une chaîne de caractères en "sous-chaînes".

Pour extraire un caractère particulier on utilise les crochets: on éccrit dans les crochets le numéro du caractère auquel on se réfère. Comme dans la majorité des langages de programmation, la première position dans une chaine de caractères ou une liste est numéroté 0, le deuxième à la position 1, etc.

Prenons un exemple:

In [13]:
s = "bonjour"

Pour sélectionner le premiere caractère on écrit:

In [14]:
s[0]

'b'

Le ```j``` est la quatrième lettre du mot, et comme on numérote à partir de zéro ce caractère sera indexé 3. On le sélectionne en écrivant:

In [15]:
s[3]

'j'

Il existe aussi un "raccourci" pour compter les caractères à partir de la fin d'un string: le dernier caractère est numéroté ```-1```, l'avant-dernier ```-2```, etc.

In [16]:
s[-1]

'r'

In [17]:
s[-2]

'u'

### Sous-chaînes

En utilisant les crochets, on peut aussi extraire plusieurs caractères dans un string, autrement dit une "sous-chaine". Pour extraire la sous-chaîne du mot ```s``` allant de la position ```i``` à la position ```j```, on écrit```s[i:j+1]```. Autrement dit, pour extraire "bon" de "bonjour", il nous faut les caractères des positions 0, 1 et 2, et on écrit donc:

In [18]:
s[0:3]

'bon'

De la même façon, pour obtenir "jour", ce sont les caractères des positions 3 à 6 et on écrit donc:

In [19]:
s[3:7]

'jour'

De plus, si on veut extraire les caractères à partir du début de la chaine jusqu'à une certaine position, on peut omettre la première position (en gardant cependant le ```:```) :

In [20]:
s[:3]

'bon'

De même, pour sélectionner la fin d'un string, on peut omettre la position finale:

In [21]:
s[3:]

'jour'

Bien remarquer l'usage du ```:``` dans les crochets, qui indique si on veut les caractères "jusqu'à 3", ou bien "à partir de 3".

#### Exercice 2

Les variables ```nom``` et ```prenom``` contiennent le nom complet d'une personne, par exemple:

In [22]:
prenom = "Marie"
nom = "Curie"

__a)__ Écrire une expression utilisant les variables ```nom``` et ```prénom``` pour obtenir le nom de la personne sous la forme *initiale du prénom*, point, espace, *nom*. Par exemple "M. Curie".

In [None]:
nom_court = 

__b)__ On veut maintenant le nom d'utilisateur de la personne sur le système informatique de l'UQO: ce nom d'utilisateur est constitué des 4 premières lettres du nom suivies des deux premières du prénom, et enfin d'un identifiant numérique. En supposant que l'identifiant de Marie Curie est le 58, ça donnerait: ```"CuriMa58"```.

On supposera que l'identifiant numérique est donné par une variable ```num```: 

In [1]:
num = 58

Écrire une expression qui donnera le nom d'utilisateur UQO de Marie Curie, en utilisant les variables ```nom```, ```prénom```,  et ```num```:

In [None]:
nom_utilisateur = 