# Une chaîne de caractères est une séquence

**séquence =** collection ordonnée d'autres valeurs

* collection : de 0 à plusieurs valeurs
* ordonnée : l'ordre à une importance, par exemple ```"abba"``` et ```"baba``` ne sont pas la même chose
* valeur : des caractères $\rightarrow$ en python, un caractère est une chaîne de caractères de longueur 1.

Caractères :

* alphabet latin (et d'autres), 
* lettres accentuées, 
* chiffres décimaux, 
* espace, 
* symboles de ponctuation, 
* signes arithmétiques, 
* ponctuations, 
* symboles de parenthésage
* caractères spéciaux préfixés par ```\``` :
  * ```\n``` : insertion d'un passage à la ligne
  * ```\"``` : insertion de ```"``` dans une chaîne délimitée par ```"```
  * ```\'``` : insertion de ```'``` dans une chaîne délimitée par ```'```
  * ```\\``` : insertion de ```\```

In [1]:
print("abba")
print("baba")
print("George Timoléon")
print("Une ligne\nUne seconde ligne")
print("Une chaîne avec des \"guillemets\".")
print('Une chaîne avec des \'apostrophes\'')
print("Une chaîne avec trois contre-barres \\\\\\")
print("") # chaîne de caractères vide

abba
baba
George Timoléon
Une ligne
Une seconde ligne
Une chaîne avec des "guillemets".
Une chaîne avec des 'apostrophes'
Une chaîne avec trois contre-barres \\\



# Opérations

## Concaténation : `+`

L'opération construit une nouvelle chaîne de caractères constituée de l'opérande de gauche suivi de l'opérande de droite.

**Attention :** les deux opérandes doivent être des chaînes de caractères

In [15]:
'Hello' + 'World'

'HelloWorld'

In [16]:
'Hello' + ' ' + 'Word'

'Hello Word'

In [17]:
x = 'Hello'
y = 'World'
z = x + ' ' + y
print("z = " + z)

z = Hello World


## Répétition : `*`
 
L'opération construit une nouvelle chaîne de caractères par concaténations multiples d'une même chaîne.

Opération binaire : un opérande doit être une chaîne de caractères et l'autre un entier.

In [2]:
"Hello world!" * 3

'Hello world!Hello world!Hello world!'

In [1]:
chaîne = "cou"
entier = 1 
print((2 * entier) * chaîne)

coucou



# Indices

Les éléments d'une séquence sont indicés. Le premier élément a l'indice 0, le second l'indice 1 ... Le dernier élément a donc un indice égal à la longueur de la séquence moins 1.

**Remarque :** on considérera dans ce cours qu'un indice est nécessaire positif ou nul mais on peut avoir des indices négatif en Python.

**Attention :** le premier élément a l'indice 0 et pas 1 !

On peut accéder directement à un élément par son indice par une notation indexée utilisant ```[]``` :

In [20]:
fruit = "banane"
print("fruit =", fruit)
print("fruit[0] =", fruit[0])
print("fruit[1] =", fruit[1])
print("fruit[2] =", fruit[2])
print("fruit[3] =", fruit[3])
print("fruit[4] =", fruit[4])
print("fruit[5] =", fruit[5])

fruit = banane
fruit[0] = b
fruit[1] = a
fruit[2] = n
fruit[3] = a
fruit[4] = n
fruit[5] = e


L'indice doit être une valeur entière mais on peut aussi utiliser des variables et des expressions arithmétiques qui retournent un entier :

In [21]:
i = 1
fruit[i]

'a'

In [22]:
fruit[i+1]

'n'

In [23]:
fruit[1.5]

TypeError: string indices must be integers

In [24]:
fruit[9]

IndexError: string index out of range

Il faut que l'indice soit compris entre 0 et la longueur de la chaîne moins 1 :

# Fonction ```len```

La fonction définie dans le langage ```len``` retourne la longueur d'une chaîne de caractères

**Remarque :** on verra par la suite qu'elle retourne la longueur d'une séquence.

In [25]:
len(fruit)

6

**Attention :** l'indice du dernier caractère n'est pas la longueur de la chaîne mais la longueur de la chaîne moins 1. Le code suivant lèvera une erreur :

In [26]:
longueur = len(fruit)
dernier = fruit[longueur]

IndexError: string index out of range

En effet, ```longueur``` vaut 6 et le dernier indice dans ```fruit``` est 5. Pour obtenir l'indice du dernier caractère, il faut retirer 1 à la longueur :

In [27]:
dernier = fruit[longueur-1]
print("dernier =", dernier)

dernier = e


# Parcourir une chaîne de caractères

## Itération sur les indices

In [28]:
chaîne = "Timoléon"

for i in range(len(chaîne)):
    print("chaîne[" + str(i) + "] = " + chaîne[i])

chaîne[0] = T
chaîne[1] = i
chaîne[2] = m
chaîne[3] = o
chaîne[4] = l
chaîne[5] = é
chaîne[6] = o
chaîne[7] = n


Il y a deux possiblités pour parcourir de la fin vers le début :

In [29]:
for i in range(len(chaîne)):
    print("chaîne[" + str(len(chaîne) - 1 - i) + "] = " + chaîne[len(chaîne) - 1 - i])

chaîne[7] = n
chaîne[6] = o
chaîne[5] = é
chaîne[4] = l
chaîne[3] = o
chaîne[2] = m
chaîne[1] = i
chaîne[0] = T


In [30]:
for i in range(len(chaîne) -1, -1, -1): 
    print("chaîne[" + str(i) + "] = " + chaîne[i])

chaîne[7] = n
chaîne[6] = o
chaîne[5] = é
chaîne[4] = l
chaîne[3] = o
chaîne[2] = m
chaîne[1] = i
chaîne[0] = T


**Remarque :** il est possible d'utiliser une boucle ```while```.

## Application directe d'une boucle ```for```

Une chaîne de caractères étant une séquence, il est possible de l'utiliser comme séquence sur laquelle itérer avec une boucle ```for```.

In [31]:
for c in chaîne:
    print(c)

T
i
m
o
l
é
o
n


**Remarque :** comment choisir entre les deux versions ?
* si on a besoin de connaître l'indice du caractères $\rightarrow$ itérer sur les indices
* si on a juste besoin de connaître la valeur du caractères courant $\rightarrow$ itérer sur la chaîne de caractères

**Remarque :** Si on doit itérer sur une "très" grande séquence, il vaut mieux itérer sur les indices.

# Tranches

Une **tranche** est un segment d'une chaîne de caractères défini par deux indices ```n``` et ```m```. 

```n``` et ```m``` doivent être une valeur entière : littéral, variable, expression arithmétique entière.

Il s'agit de la sous-chaîne commençant à l'indice ```n``` et se terminant à l'indice ```m - 1```.

In [32]:
chaîne = "Monty Python"
chaîne[0:5]

'Monty'

In [33]:
chaîne[5:12]

' Python'

Si ```n``` $\geq$ ```m```, la tranche est la chaîne vide.

In [34]:
chaîne[5:4]

''

Si ```m``` est égal à la longueur de la chaîne, on peut l'omettre. Les trois instructions suivantes sont équivalentes : 

In [35]:
chaîne[6:12]

'Python'

In [36]:
chaîne[6:len(chaîne)]

'Python'

In [37]:
chaîne[6:]

'Python'

Si ```n``` est égal 0, on peut l'omettre. Les deux instructions suivants sont équivalents :

In [38]:
chaîne[0:5]

'Monty'

In [39]:
chaîne[:5]

'Monty'

Par extension, l'instruction suivante retourne une copie de ```chaîne``` :

In [40]:
chaîne[:]

'Monty Python'

et elle est équivalente à :

In [41]:
chaîne[0:len(chaîne)]

'Monty Python'


# Non mutabilité

Il n'est pas possible de modifier un caractère dans une chaîne de caractères.

Les chaînes de caractères sont dites non **mutables** (non modifiables).

In [42]:
chaîne[2] = 'J'

TypeError: 'str' object does not support item assignment

Pour modifier une chaîne de caractères, il faut en reconstruire une nouvelle en appliquant les modifications souhaitées.

Remplacement du caractère à l'indice ```i``` par le caractère ```c``` :

In [43]:
def modification(chaîne, indice, caractère):
    nouvelle_chaîne = ""

    for i in range(len(chaîne)):
        if i == indice:
            nouvelle_chaîne = nouvelle_chaîne + caractère
        else:
            nouvelle_chaîne = nouvelle_chaîne + chaîne[i]

    return nouvelle_chaîne

print(modification("Hallo", 1, "e"))

Hello


Remplacer tous les caractères ```c1``` par le caractère ```c2``` :

In [44]:
def remplace(chaîne, c1, c2):
    nouvelle_chaîne = ""

    for c in chaîne:
        if c == 1:
            nouvelle_chaîne = nouvelle_chaîne + c2
        else:
            nouvelle_chaîne = nouvelle_chaîne + c

    return nouvelle_chaîne

print(remplace("valeur de la chaîne", ' ', '_'))

valeur de la chaîne


# Recherche

## Présence d'un caractère dans la chaîne

In [45]:
chaîne = "Timoléon"
caractère = 'o'
présent = False
i = 0

while not présent and i < len(chaîne):
    if chaîne[i] == caractère:
        présent = True
    else:
        i = i + 1

print("A-t'on trouvé le caractère ?", présent)

A-t'on trouvé le caractère ? True


**Remarque :** on arrête de chercher dès que l'on a trouvé le caractère. C'est possible de le faire avec une boucle ```for``` en définissant une fonction et en utilisant ```return``` pour arrêter la recherche dès que le caractère est trouvé :

In [46]:
def présent(chaîne, caractère):
    for c in chaîne:
        if c == caractère:
            return True
    return False

**Remarque :** En Python, l'opérateur ```in``` fait exactement la même chose que la fonction ```présent``` :

In [47]:
def dans_les_deux(chaîne1, chaîne2):
    for caractère in chaîne1:
        if caractère in chaîne2:
            print(caractère)

dans_les_deux("pomme", "orange")

o
e


## Rechercher l'indice où un caractère apparaît

In [48]:
def trouver(chaîne, caractère):
    for i in range(len(chaîne)):
        if chaîne[i] == caractère:
            return i
    return len(chaîne)

**Remarque :** si on ne trouve pas le caractère, on retourne une valeur qui ne peut pas être une réponse.

**Exercice :** Si le caractère est présent dans la chaîne, la fonction ci-dessus retourne l'indice de la première occurrence en partant du début. Ecrire une fonction qui retourne l'indice de la dernière occurrence du caractère dans la chaîne de caractères. Si le caractère n'apparaît pas, on retourne la longueur de la chaîne de caractère.

**Exercice :** Ecrire une version de la fonction ```trouver``` avec trois paramètres : une chaîne de caractères, un caractère et un indice. La fonction retourne l'indice de la première apparation du caractère dans la chaîne de caractères en partant de l'indice donné en paramètre. Si le caractère n'apparaît pas, on retourne la longueur de la chaîne de caractères.

**Remarque :** la méthode ```find``` des objets chaînes de caractères retourne le premier indice où un caractère apparaît :

In [49]:
mot = "banane"
mot.find('a')

1

Il existe une version avec un second paramètre qui indique à partir de quel index il faut chercher :

In [50]:
mot.find('a', 3)

3

Finalement, il existe une version avec 3 arguments. Le troisième argument est le dernier indice où il faut rechercher. Cet indice est exclus de la recherche.

In [51]:
mot.find('e', 1, 5)

-1

**Remarque :** en fait, ```find``` est plus générique car la méthode ne se limite pas à rechercher des chaînes de longueur 1.

In [52]:
mot.find("na")

2

# Compter le nombre d'occurrences d'un caractère

In [53]:
def nbre_occurrence(chaîne, caractère):
    compteur = 0
    
    for c in chaîne:
        if c == caractère:
            compteur = compteur + 1

    return compteur

nbre_occurrence("banane", 'a')

2

**Exercice :** Ecrire une version de ```nbre_occurrence``` en utilisant la version de la fonction ```trouver``` avec 3 arguments.

# Comparaison de chaînes caractères

Les opérateurs de relation (```==```, ```!=```, ```<```, ```<=```, ```>```, ```>=```) sont définis sur les chaînes de caractères :

In [54]:
mot = "banane"

if mot == "banane":
    print("Votre mot est bien banane")
elif mot < "banane":
    print(mot, "est avant banane")
elif mot > "banane":
    print(mot, "est après banane")

Votre mot est bien banane


* Ordre lexicographique
* L'ordre entre deux caractères est défini par leur code UNICODE
* **Attention :** une majuscule est "plus petit" qu'une minuscule

# Exercices

## Exercice 1

1. Ecrivez une fonction ```tirets``` qui prend retourne une chaîne de caractères construites en insérant un tiret ```'-'``` après chaque caractère d'une chaîne de caractères passée en paramètre.

**Exemple :** si on donne la chaîne de caractères ```"tirets dans la chaîne"```, la fonction retourne ```"t-i-r-e-t-s- -d-a-n-s- -l-a- -c-h-a-î-n-e-"```

In [7]:
def tirets (chaine):
    val = len (chaine)
    print (val,"caractères")
    x = 0
    res = ""
    for i in range (val):
        res = res + chaine[x] + "-"
        x = x + 1
    return res
        

    
mot = '''tirets dans la chaine'''
print (tirets(mot))

21 caractères
t-i-r-e-t-s- -d-a-n-s- -l-a- -c-h-a-i-n-e-


2. Modifiez votre fonction pour ne pas ajouter un tiret après un espace.

**Exemple :** si on donne la chaîne de caractères ```"tirets dans la chaîne"```, la fonction retourne ```"t-i-r-e-t-s- d-a-n-s- l-a- c-h-a-î-n-e-"```

In [23]:
def tirets (chaine):
    val = len (chaine)
    print (val,"caractères")
    x = 0
    res = ""
    for i in range (val):
        if chaine[x] == " ":
            res = res + chaine[x]
            x = x + 1
        else:
            res = res + chaine[x] + "-"
            x = x + 1
    return res
        

    
mot = '''tirets dans la chaine'''
print(tirets(mot))

21 caractères
t-i-r-e-t-s- d-a-n-s- l-a- c-h-a-i-n-e-


3. Modifiez votre fonction pour ne pas ajouter un tiret à la fin de la chaîne.

**Exemple :** si on donne la chaîne de caractères ```"tirets dans la chaîne"```, la fonction retourne ```"t-i-r-e-t-s- d-a-n-s- l-a- c-h-a-î-n-e"```

In [5]:
def tirets (chaine):
    val = len (chaine)
    print (val,"caractères")
    x = 0
    res = ""
    for i in range (val):
        if chaine[x] == " ":
            res = res + chaine[x]
            x = x + 1
        else:
            res = res + chaine[x] + "-"
            x = x + 1
    valfin = len (res)
    res = res[0 : valfin-1]
    return res
        

    
mot = '''tirets dans la chaine'''
print(tirets(mot))

21 caractères
t-i-r-e-t-s- d-a-n-s- l-a- c-h-a-i-n-e


## Exercice 2

Ecrivez une fonction ```palindrome``` (non récursive) qui retourne ```True``` si la chaîne de caractères passée en paramètre est un palindrome, ```False``` sinon.

In [4]:
def palindrome (chaine):
    val = len (chaine)
    x = 0
    juste = 0
    for i in range (val):
        if chaine[x] == chaine[val -1]:
            x = x + 1
            val = val - 1
            juste = juste + 1 
    if juste == len(chaine):
        return True
    else:
        return False
    

mot = '''kayak'''
print(palindrome(mot))

True


## Exercice 3

1. Ecrivez une fonction ```miroir``` qui retourne une chaîne contenant les caractères de la chaîne passée en paramètre dans l'ordre inverse.

**Exemple :** si on donne la chaîne ```"Timoléon"```, la fonction retourne ```"noélomiT"```.


In [14]:
def miroir (chaine):
    val = len (chaine)
    x = val
    res = ""
    for i in range(val):
        res = res + chaine[x-1]
        x = x - 1 
    return (res)

mot = '''Timoléon'''
print(miroir(mot))

'noélomiT'

2. Ecrivez une version de la fonction ```palindrome``` qui utilise la fonction ```miroir```.

In [46]:
def palindrome2 (chaine):
    if chaine == miroir(chaine):
        return True
    else:
        return False
    #return chaine == miroir(chaine)    
    

mot = '''kayak'''
print("Palindrome avec miroir de kayak :",palindrome2(mot))

mot = '''bonjour'''
print("Palindrome avec miroir de bonjour :",palindrome2(mot))

Palindrome avec miroir de kayak : True
Palindrome avec miroir de bonjour : False


## Exercice 4

1. Ecrivez une fonction ```supprimer_position(chaîne, indice)``` qui retourne une chaîne correspondant à la chaîne passée en paramètre sans le caractère se trouve à l'indice ```indice```. Si ```indice``` est négatif ou plus grand ou égal à ```len(chaîne)```, la chaîne retournée est égale à ```chaîne```.

**Exemples :**

* ```supprimer_position("Timoléon", 3)``` retourne ```"Timléon"```
* ```supprimer_position("Timoléon", 2)``` retourne ```"Tioléon"```
* ```supprimer_position("Timoléon", 10)``` retourne ```"Timoléon"```

1. Ecrire une version sans utiliser les tranches.

In [41]:
def supprimer_position(chaine, indice):
    val = len (chaine)
    res = ""
    x = 0
    for i in range(val):
        if x == indice:
            res = res + ""
            x = x + 1 
        else:
            res = res + chaine[x]
            x = x + 1
    return res


mot ='''Timoléon'''
print("Timoléon indice 3 :",supprimer_position(mot, 3))
print("Timoléon indice 2 :",supprimer_position(mot, 2))
print("Timoléon indice 10 :",supprimer_position(mot, 10))

Timoléon indice 3 : Timléon
Timoléon indice 2 : Tioléon
Timoléon indice 10 : Timoléon


2. Ecrire une version en utilisant les tranches.

In [1]:
def supprimer_position2(chaine, indice):
    val = len (chaine)
    res = ""
    x = 0
    for i in range(val):
        if x == indice:
            chaine[0:x]
            x = x + 1 
        else:
            res = res + chaine[x]
            x = x + 1
    return res

mot ='''Timoléon'''
print("Timoléon indice 3 :",supprimer_position2(mot, 3))
print("Timoléon indice 2 :",supprimer_position2(mot, 2))
print("Timoléon indice 10 :",supprimer_position2(mot, 10))

Timoléon indice 3 : Timléon
Timoléon indice 2 : Tioléon
Timoléon indice 10 : Timoléon


3. Ecrivez une fonction ```supprimer_caractère(chaîne, caractère)``` qui retourne une chaîne correspondant à la chaîne passée en paramètre où l'on a supprimé toutes les occurrences du caractère ```caractère```.

**Exemples :**

* ```supprimer_caractère("Timoléon", 'o')``` retourne ```"Timlén"```
* ```supprimer_caractère("Timoléon", '&')``` retourne ```"Timoléon"```

In [9]:
def supprimer_caractère(chaine, caractère):
    val = len (chaine)
    res = ""
    x = 0
    for i in range (val):
        if chaine[x] == caractère:
            res = res + ""
            x = x + 1
        else:
            res = res + chaine[x]
            x = x + 1
    return res

mot ='''Timoléon'''
print("Timoléon caractère o :",supprimer_caractère(mot, 'o'))
print("Timoléon caractère & :",supprimer_caractère(mot, '&'))


8
Timoléon caractère o : Timlén
8
Timoléon caractère & : Timoléon


## Exercice 5

Ecrivez une fonction ```insérer_caractère``` qui renvoie la chaine obtenue en insérant dans la chaîne reçue en paramètre, à l’indice passé en second paramètre, le caractère fourni en 3e paramètre. L’indice est un entier positif ou nul et s’il est en dehors de la chaîne, celle-ci devra être retournée sans être modifiée.

**Exemples :**

* ```insérer_caractère("Timléon", 3, 'o')``` retourne ```"Timoléon"```
* ```insérer_caractère("Timléon", 20, 'I')``` retourne ```"Timléon"```

1. Ecrire une version sans utiliser les tranches.

In [28]:
def insérer_caractère(chaine, indice, caractère):
    val = len(chaine)
    res =""
    x = 0
    for i in range(val):
        if x == indice:
            res = res + caractère + chaine[x]
            x = x + 1
        else: 
            res = res + chaine[x]
            x = x + 1
    return res        

mot ='''Timléon'''
print("Timléon, indice 3 caractère o :",insérer_caractère(mot, 3, 'o'))
print("Timléon, indice 20 caractère I :",insérer_caractère(mot, 20, '&'))

Timléon, indice 3 caractère o : Timoléon
Timléon, indice 20 caractère I : Timléon


2. Ecrire une version en utilisant les tranches.

In [6]:
def insérer_caractère2(chaine, indice, caractère):
    val = len(chaine)
    res =""
    x = 0
    for i in range(val):
        if x == indice:
            res = chaine[0:x] + caractère + chaine[x]
            x = x + 1
        else: 
            res = res + chaine[x]
            x = x + 1
    return res        

mot ='''Timléon'''
print("Timléon, indice 3 caractère o :",insérer_caractère2(mot, 3, 'o'))
print("Timléon, indice 20 caractère I :",insérer_caractère2(mot, 20, '&'))

Timléon, indice 3 caractère o : Timoléon
Timléon, indice 20 caractère I : Timléon
