# Chaînes de caractères (string)

Une chaine de caractères est une sequence de lettres. Elle est délimité par des guillemets 
* simples ou 
* doubles.

## Un index dans une chaîne

Chaque élement peut être accédé par un **indice** entre crochets.

In [1]:
fruit = 'banane'
fruit[0]

'b'

L'indexation commence avec zéro. L'indexe 1 pointe vers la deuxième lettre.

In [2]:
fruit[1]

'a'

On peut utiliser également une variable comme indice de chaîne.

In [3]:
i = 2
fruit[i]

'n'

Voici comment obtenir la lettre après la i-ième lettre.

In [4]:
fruit[i+1]

'a'

## Longuer de chaîne - len

La fonction `len` retourne la longuer de chaîne.

In [5]:
fruit ='pamplemousse'
len(fruit)

12

Pour obtenir la dernière lettre de la chaine, il faut utiliser l'index `n-1`.

In [6]:
n = len(fruit)
fruit[n-1]

'e'

L'index `-1` pointe vers la dernière lettre.

In [7]:
fruit[-1]

'e'

## Parcour avec une boucle `for`

On peut utiliser une boucle `while` pour accéder à chaque lettre, en utilisant un indice.

In [13]:
fruit = 'pomme'
n = len(fruit)
print('len =', n)
i = 0

while i < n:
    print('lettre',i,'=',fruit[i])
    i += 1

len = 5
lettre 0 = p
lettre 1 = o
lettre 2 = m
lettre 3 = m
lettre 4 = e


Une autre façon plus courte est d'utiliser la boucle `for`. A chaque itération un autre caractère de la chaîne est affecté à `c`. 

In [14]:
i = 0
for c in fruit:
    print(i, '=', c)
    i=i+1

0 = p
1 = o
2 = m
3 = m
4 = e


Voici un exemple ou chaque lettre de la chaîne **prefixes** est combiné avec la chaîne **suffix** pour former un nouveau mot.

In [None]:
prefixes = 'BLMPRST'
suffix = 'ack'

for c in prefixes:
    print(c + suffix)

## Tranches de chaînes

Un sous-ensemble de caractères s'appele une **tranche**. La séléction se fait en utilisant deux indices avec la notation `:`.

In [None]:
s = 'Monty Python'
s[0:5]

In [None]:
s[6:12]

Si le premier ou dernier indice est omis, la chaine va jusqu'au début ou la fin.

In [None]:
s[:3]

In [None]:
s[3:]

Si les deux indices sont les identiques, la sous-chaîne est vide.

In [None]:
s[3:3]

Les chaînes sont immuables. On ne peux pas réaffecter une tranche.

In [None]:
s[3] = 'k'

Si on veut modifier une lettre, il faut composer une nouvelle chaîne.

In [None]:
s[:2]+'k'+s[3:]

## Rechercher une lettre

Que fait la fonction `trouver` ?

In [None]:
def trouver(mot, lettre):
    i = 0
    while i < len(mot): 
        if mot[i] == lettre:
            return i
        i += 1
    return -1

In [None]:
trouver('Monty', 'y')

In [None]:
trouver('Monty', 'x')

Si la lettre existe dans le mot, son index est retourné. Si la lettre n'existe pas, la valeur -1 est retournée.

## Compter des lettres

La fonction suivante compte l'occurence d'une lettre dans un mot.

In [None]:
def count(mot, lettre):
    cnt = 0
    for c in mot:
        if c == lettre:
            cnt += 1
    return cnt

count('banana', 'a')

In [None]:
count('banana', 'c')

## Méthodes de chaines de caractères

Le type `string` possède beaucoup de méthodes. Les méthodes sont ajoutées aux objets chaîne avec un point. La méthdode `upper` transformer en majuscules, la méthode `lower` transforme en minuscules.

In [None]:
s.upper()

In [None]:
s.lower()

La méthode `find(c)` trouve l'index du caractère `c`. La méthode `replace` remplace une chaîne par une autre.

In [None]:
s.find('y')

In [None]:
s.find('th')

In [None]:
s.replace('n', 'ng')

## L'opérateur in

L'opérateur bouléen `in` retourne `True` si un caractère ou une séquence fait partie d'une chaîne.

In [None]:
'ana' in 'banana'

La fonction `common` imprime les caractères en commun dans les deux chaînes.

In [None]:
def common(word1, word2):
    for c in word1:
        if c in word2:
            print(c)

In [None]:
common('pommes', 'oranges')

## Comparaison de chaines

Les 6 opérateurs de comparaison (`>`, `<=`, `==`, `!=`, `>=`, `>`) sont aussi définis pour des chaînes. 

In [None]:
def check(a, b):
    if a < b:
        print(a, 'is before', b)
    else:
        print(a, 'is after', b)

In [None]:
check('ananas', 'banana')

In [None]:
check('orange', 'banana')

In [None]:
check('Orange', 'banana')

En Python les lettre majuscues viennent avant les minuscules.

## Exercices

### ex 1 strip et replace

La fonction `strip` enlève des espace en début et fin d'une chaîne.

In [None]:
'  monty    '.strip()

In [None]:
'monty'.replace('t', 'ke')

### ex 2 count

Il existe une méthode de chaîne de caractères appelée count qui est similaire à la fonction de la section 8.7. Lisez la documentation de cette méthode et écrivez une invocation qui compte le nombre des a dans `'banane'` .

### ex 3 slice indexing

Une tranche de chaîne peut prendre un troisième indice qui spécifie la **taille du pas** ; autrement dit, le nombre d'espaces entre caractères successifs. Une taille de pas de 2 signifie un caractère sur deux ; 3 signifie un caractère sur trois, etc.

In [None]:
s = 'Monty Python'

In [None]:
s[::2]

Une taille de pas de `-1` parcourt le mot à l'envers, donc la tranche `[:: - 1]` génère une chaîne inversée.

In [None]:
s[::-1]

Utilisez cette syntaxe pour écrire une version d'une ligne de la méthode `is_palindrome`. 

In [None]:
def is_palindrome(s):
    

In [None]:
is_palindrome('hannah'), is_palindrome('harry')

### ex 4 trouver des minuscules

Les fonctions suivantes sont toutes censées vérifier si une chaîne contient au moins une lettre minuscule quelconque, mais au moins certaines d'entre elles sont erronées. Pour chaque fonction, décrivez ce que fait réellement la fonction (en supposant que le paramètre est une chaîne).

Pour chacune des 5 fonctions, décrivez ce qu'elle fait réellement.

In [None]:
def minusc1(s):
    for c in s:
        if c.islower():
            return True
        else:
            return False    

In [None]:
def minusc2(s):
    for c in s:
        if 'c'.islower():
            return 'True'
        else:
            return 'False'   

In [None]:
def minusc3(s):
    for c in s:
        drapeau = c.islower()
    return drapeau

In [None]:
def minusc4(s):
    drapeau = False
    for c in s:
        drapeau = drapeau or c.islower()
    return drapeau
minusc4('Jim'), minusc4('JIM')      

In [None]:
def minusc5(s):
    for c in s:
        if not c.islower():
            return False
    return True    

### ex 5 ciffre de César

Un chiffre de César est une forme faible de chiffrement qui implique la « rotation » de chaque lettre d'un nombre fixe de places. La rotation d'une lettre signifie de décaler sa place dans l'alphabet, en repassant par le début si nécessaire, de sorte qu'après la rotation par 3, 'A' devient 'D' et 'Z' décalé de 1 est 'A'.

Pour effectuer la rotation d'un mot, décalez-en chaque lettre par le même nombre. Par exemple, les mots *JAPPA* et *ZAPPA*, décalés de quatre lettres, donnent respectivement *DETTE* et *NETTE*, et le mot *RAVIER*, décalé de 13 crans, donne *ENIVRE* (et réciproquement). De même, le mot *OUI* décalé de 10 crans devient *YES*. Dans le film 2001 : l'Odyssée de l'espace, l'ordinateur du vaisseau s'appelle *HAL*, qui est *IBM* décalé de -1.

Écrivez une fonction appelée `rotate_word` qui prend comme paramètres une chaîne de caractères et un entier, et renvoie une nouvelle chaîne qui contient les lettres de la chaîne d'origine décalées selon le nombre donné.

In [None]:
def rotate_word(s, n):
    

In [None]:
rotate_word('JAPPA', 4), rotate_word('HAL', 1), rotate_word('RAVIER', 13), rotate_word('OUI', 10)