Chaînes de caractères
=====================

Introduction
------------

Les chaînes de caractères sont un conteneurs particulier : c'est un type de données qui ne contient que des caractères.

Comme le n-uplet, une chaîne de caractère n'est **pas mutable**. Toutes ses méthodes ne transforment donc pas la chaîne courante, mais renvoient une nouvelle chaîne construire à partir d'elle.

Une chaîne de caractère est délimitée par un **"** ou un **'**. Elle peut tenir sur plusieurs lignes si la ligne se termine par **\\** (qui ne fait pas de changement de ligne) ou si l'on utilise trois **"** ou trois **'''**.
Les caractères sont ceux contenus dans la table de caractère de la locale courante (pour nous, ISO-8859-15), au nombre de 256.

In [None]:
print("Chaine de caractère\nNouvelle ligne. \
Ceci n'est pas une nouvelle ligne")

In [None]:
print("Chaine de caractère\nNouvelle ligne. "
      "Ceci n'est pas une nouvelle ligne")

In [None]:
print("""Ceci est
une chaîne de caractères
sur plusieurs lignes""")

Voici les méthodes présentes :

In [None]:
dir("")

Méthodes de manipulation
------------------------

On distingue des méthodes permettant de travailler sur les chaînes de caractères :

* les méthodes **count** et **index** sont similaires à celles des conteneurs ;
* l'opérateur **+** permet la concaténation et l'opérateur **(*)** permet la répétition ;
***
* la méthode **startswith** permet de savoir si la chaîne *commence* par une sous-chaîne ;
* la méthode **endswith** permet de savoir si la chaîne *termine* par une sous-chaîne ;
***
* la méthode **split** permet de découper une chaîne de caractère en utilisant un séparateur ;
* la méthode **join** permet l'inverse, elle est appelée sur la chaîne glue.

In [None]:
"Voici des mots".split(" ")

In [None]:
"_".join(["a", "b", "c"])

* la méthode **lower** permet de mettre la chaîne en minuscule ;
* la méthode **upper** permet de mettre la chaîne en majuscule ;
* la méthode **swapcase** permet d'inverser minuscules et majuscules ;
* la méthode **title** permet de mettre toutes les premières lettres de chaque mot en majuscule et les autres en minuscule ;
* la méthode **capitalize** permet de mettre la première lettre de la chaîne en majuscule et les autres en minuscule ;

In [None]:
'tEsT 42 tESt'.lower()

In [None]:
'tEsT 42 tESt'.upper()

In [None]:
'tEsT 42 tESt'.swapcase()

In [None]:
'tEsT 42 tESt'.title()

In [None]:
'tEsT 42 tESt'.capitalize()

Méthodes de formatage
---------------------

Voici un pêle-mêle des méthodes existantes :

In [None]:
'test'.center(30)

In [None]:
'test'.rjust(30)

In [None]:
"42".zfill(4)

In [None]:
'  -*- test -*-  '.strip()

In [None]:
'  -*- test -*- test -*-  '.strip(' -*')

In [None]:
import string
print(dir(string))
print(string.printable)
string.whitespace

Enfin, voici l'élément le plus important, l'opérateur modulo :

L'utilité de cet opérateur est de pouvoir produire des chaînes de caractères dynamiques (avec des parties qui ne sont pas connues au moment de leur codage) :

In [None]:
def afficher_resultat(resultat):
    print("Le résulat de l'opération est %s." % resultat)

In [None]:
afficher_resultat(42)

In [None]:
afficher_resultat(print)

Voici le détail de la syntaxe de l'opérateur modulo :

In [None]:
'%s' % 'test'

In [None]:
'%s' % 42

In [None]:
'%s%s' % (4, 2)

In [None]:
"%(decimal)s%(unite)s = %(decimal)s * 10 + %(unite)s" % {"decimal": 4, "unite": 2}

In [None]:
"%d" % 42.94

In [None]:
"%f" % 42

In [None]:
"%6.2f" % 42

In [None]:
"%06.2f" % 42

In [None]:
"%-6.2f" % 42

In [None]:
"%+6.2f" % 42

In [None]:
"%6.2f" % 4264263.123456

A noter que la fonction modulo fonctionne comme celle de **sprintf** pour le C, modulo quelques ajouts fonctionnels et qu'il existe également la méthode format qui est similaire à celle permettant de formatter les chaînes de caractères en C++.

In [None]:
"{} {}".format(4, 2)

In [None]:
"{1} {0}".format(4, 2)

In [None]:
"{a} {b}".format(a=4, b=2)

In [None]:
"{0:.2f}".format(42.345)

In [None]:
l = [1, 2, 3]
"{l[0]}".format(l=l)

In [None]:
"{l.append}".format(l=l)

In [None]:
d = {"a": 1, "b": 2}
"{d[a]}".format(d=d)

In [None]:
d = {"a": 1, "b": 2}
"{0[a]}".format(d)

In [None]:
name = 'Fred'
age = 42
f'He said his name is {name} and he is {age} years old.'

Octets

In [None]:
s = "Ceci est une chaîne de caractères en €"

In [None]:
type(s)

In [None]:
b = s.encode("iso8859-15")

In [None]:
b

In [None]:
type(b)

In [None]:
b.decode("latin9")

In [None]:
b.decode("latin1")

In [None]:
"Ceci est une chaîne de caractères en €".encode("iso8859-1")

In [None]:
"Ceci est une chaîne de caractères en €".encode("latin1")

In [None]:
"Ceci est une chaîne de caractères en €".encode("utf8")

In [None]:
b'Ceci est une cha\xc3\xaene de caract\xc3\xa8res en \xe2\x82\xac'.decode("utf-8")

In [None]:
u"Truc en Python 2"

---

Exercices:
----------

1. Compter le nombre de mots d'une phrase
2. Supprimer le premier et le dernier mot d'une phrase.
3. Faire une fonction qui prenne en paramètre deux nombres et qui écrive quel nombre est plus petit que l'autre.
4. Faire une fonction qui prenne en paramètre un nombre et qui l'écrive en toutes lettres.

>> Dans un premier temps, se **limiter** aux nombres de *0* à *9*