# Strings

Les chaînes sont utilisées en Python pour enregistrer des informations textuelles, telles que des noms. Les chaînes de caractères en Python sont en fait des *séquences*, ce qui signifie que Python garde une trace de chaque élément de la chaîne en tant que séquence. Par exemple, Python comprend la chaîne "hello" comme une séquence de lettres dans un ordre spécifique. Cela signifie que nous pourrons utiliser l'indexation pour saiatteindre des lettres particulières (comme la première ou la dernière lettre).


Cette idée de séquence est importante en Python et nous l'aborderons plus tard.

Dans ce cours, nous apprendrons ce qui suit :

    1.) Créer des chaînes
    2.) Afficher des chaînes
    3.) Indexation et découpage des chaînes de caractères
    4.) Propriétés des chaînes de caractères

## Création d'une chaîne
Pour créer une chaîne de caractères en Python, vous devez utiliser des guillemets simples ou doubles. Par exemple :

In [None]:
# Single word
'hello'

In [None]:
# Entire phrase 
'This is also a string'

In [None]:
# We can also use double quote
"String built with double quotes"

In [None]:
# Be careful with quotes!
' I'm using single quotes, but this will create an error'

La raison de l'erreur ci-dessus est que le guillemet simple dans <code>I'm</code> a interrompu la chaîne. Vous pouvez utiliser des combinaisons de guillemets doubles et simples pour obtenir la déclaration complète.

In [None]:
"Now I'm ready to use the single quotes inside a string!"

Maintenant, apprenons à afficher des chaînes de caractères !

## Afficher des chaînes de caractères

L'utilisation de Jupyter notebook avec une simple chaîne de caractères dans une cellule produira automatiquement des chaînes de caractères, mais la manière correcte d'afficher des chaînes de caractères dans votre sortie est d'utiliser une fonction print.

In [None]:
# We can simply declare a string
'Hello World'

In [None]:
# Note that we can't output multiple strings this way
'Hello World 1'
'Hello World 2'

Nous pouvons utiliser l'instruction print pour imprimer une chaîne de caractères.

In [None]:
print('Hello World 1')
print('Hello World 2')
print('Use \n to print a new line')
print('\n')
print('See what I mean?')

## Longueur d'une chaîne

Nous pouvons également utiliser une fonction appelée len() pour vérifier la longueur d'une chaîne de caractères !

In [None]:
len('Hello World')

La fonction intégrée len() de Python compte tous les caractères de la chaîne, y compris les espaces et la ponctuation.

## Indexation des chaînes de caractères
Nous savons que les chaînes de caractères sont une séquence, ce qui signifie que Python peut utiliser des index pour atteindre des parties de la séquence. Voyons comment cela fonctionne.

En Python, nous utilisons des crochets <code>[]</code> après un objet pour appeler son index. Notons également que l'indexation commence à 0 en Python. Créons un nouvel objet appelé <code>s</code> et parcourons quelques exemples d'indexation.



In [1]:
# Assign s as a string
s = 'Hello World'

In [3]:
# Print the object
print(s) 

Hello World


Commençons l'indexation !

In [4]:
# Show first element (in this case a letter)
s[0]

'H'

In [5]:
s[1]

'e'

In [6]:
s[2]

'l'

Nous pouvons utiliser un <code>:</code> pour effectuer un *slicing* qui saisit tout jusqu'à un point désigné. Par exemple :

In [7]:
# Grab everything past the first term all the way to the length of s which is len(s)
s[1:]

'ello World'

In [8]:
# Note that there is no change to the original s
print(s)

Hello World


In [9]:
# Grab everything UP TO the 3rd index
s[:3]

'Hel'

Notez le découpage ci-dessus. Ici, nous demandons à Python de prendre tout ce qui va de 0 à 3, sans inclure l'indice 3. Vous remarquerez cela souvent en Python, où les déclarations et sont généralement dans le contexte de "jusqu'à, mais pas y compris".

In [10]:
#Everything
s[:]

'Hello World'

Nous pouvons également utiliser l'indexation négative pour revenir en arrière.

In [11]:
# Last letter (one index behind 0 so it loops back around)
s[-1]

'd'

In [12]:
# Grab everything but the last letter
s[:-1]

'Hello Worl'

Nous pouvons également utiliser la notation d'index et de tranche pour saisir des éléments d'une séquence selon une taille de pas spécifiée (la valeur par défaut est 1). Par exemple, nous pouvons utiliser deux deux-points dans une ligne, puis un nombre spécifiant la fréquence de saisie des éléments.


In [13]:
# Grab everything, but go in steps size of 1
s[::1]

'Hello World'

In [14]:
# Grab everything, but go in step sizes of 2
s[::2]

'HloWrd'

In [15]:
# We can use this to print a string backwards
s[::-1]

'dlroW olleH'

## Propriétés des chaînes de caractères
Il est important de noter que les chaînes de caractères ont une propriété importante connue sous le nom d'"immuabilité". Cela signifie qu'une fois qu'une chaîne est créée, les éléments qu'elle contient ne peuvent être ni modifiés ni remplacés. Par exemple :

In [16]:
s

'Hello World'

In [17]:
# Let's try to change the first letter to 'x'
s[0] = 'x'

TypeError: 'str' object does not support item assignment

Remarquez que l'erreur nous indique directement ce que nous ne pouvons pas faire, c'est-à-dire modifier l'affectation de l'élément !

Ce que nous pouvons faire, c'est concaténer des chaînes de caractères !

In [18]:
s

'Hello World'

In [19]:
# Concatenate strings!
s + ' concatenate me!'

'Hello World concatenate me!'

In [20]:
# We can reassign s completely though!
s = s + ' concatenate me!'

In [21]:
print(s)

Hello World concatenate me!


Nous pouvons utiliser le symbole de la multiplication pour créer des répétitions !

In [32]:
letter = 'z'

In [None]:
letter*10

## Méthodes de base intégrées pour les chaînes de caractères

Les objets en Python ont généralement des méthodes intégrées. Ces méthodes sont des fonctions à l'intérieur de l'objet (nous les étudierons plus en détail ultérieurement) qui peuvent effectuer des actions ou des commandes sur l'objet lui-même.

Les méthodes sont appelées par un point suivi du nom de la méthode. Les méthodes se présentent sous la forme suivante

object.method(parameters)

où les paramètres sont des arguments supplémentaires que nous pouvons passer dans la méthode. Ne vous inquiétez pas si les détails n'ont pas 100% de sens pour l'instant. Plus tard, nous créerons nos propres objets et fonctions !

Voici quelques exemples de méthodes intégrées dans les chaînes de caractères :

### Lire la documentation

Même après des années de pratique, il est difficile de se souvenir de toutes les méthodes travaillant sur les chaînes de caractères. Aussi il est toujours utile de recourir à la documentation embarquée

In [None]:
help(str)

Nous allons tenter ici de citer les méthodes les plus utilisées. Nous n'avons le temps que de les utiliser de manière très simple, mais bien souvent il est possible de passer en argument des options permettant de ne travailler que sur une sous-chaîne, ou sur la première ou dernière occurrence d'une sous-chaîne. Nous vous renvoyons à la documentation pour obtenir toutes les précisions utiles.

### Découpage - assemblage : `split` et `join`

In [None]:
print(s)

In [None]:
# Split a string by blank space (this is the default)
s.split()

In [22]:
# Split by a specific element (doesn't include the element that was split on)
s.split('W')

['Hello ', 'orld concatenate me!']

In [None]:
# Upper Case a string
s.upper()

In [None]:
# Lower case
s.lower()

Il existe bien d'autres méthodes que celles décrites ici.