# Chaine de caract√®re

## Cr√©ation d'une chaine

On peut les cr√©er avec des ``'`` ou ``"``.  Ces caract√®res servent √† d√©limiter les 
d√©but et la fin du texte de la cha√Æne de caract√®re. Les guillemets 
simples ``'`` et doubles ``"`` sont √©quivalents. On pourra choisir l'un ou 
l'autre. Il sera cependant judicieux, si une cha√Æne de caract√®re doit contenir
un de ces guillemets, d'utiliser l'autre pour le d√©but et la fin de la cha√Æne. 

In [1]:
s = "Bonjour"
s = 'Bonjour'
s = "Aujourd'hui"


Pour cr√©er une cha√Æne de caract√®re sur plus d'une ligne on utilise ``'''`` ou ``"""``

In [2]:
s = """Bonjour, 
Comment allez-vous ?"""

Les **caract√®res sp√©ciaux** sont les caract√®res qui ne sont pas affichables et en tant que tel. 
Par exemple, il existe un caract√®re pour le retour √† la ligne. Il est possible
d'utiliser ce caract√®re dans une cha√Æne en utilisant ``\n``. L'antislash sert
ici de caract√®re d'√©chappement pour indiquer que l'on va entrer un caract√®re
sp√©cial. La lettre ``n`` indique ici qu'il s'agit d'un retour √† la ligne. 

Dans les exemples suivants, le retour √† la ligne est un caract√®re. On peut le cr√©er en utilisant ```\n```.

In [3]:
s = """a
b"""
print(len(s))
s2 = "a\nb"
assert s==s2

3


L'antislash sert aussi √† ins√©rer un guillemet dans une cha√Æne :

In [4]:
s = 'Aujourd\'hui'

## Manipulation des cha√Ænes de caract√®res

Comme tout conteneur indexable, il est possible d'acc√©der √† chaque caract√®re d'une cha√Æne ou √† une partie d'une 
cha√Æne. La longueur de la cha√Æne s'obtient avec la fonction ``len``. On peut aussi faire une boucle ``for`` sur chacun des √©l√©ments de la cha√Æne.

In [5]:
s = "Pierre"
print(s[0])
print(s[2:4])


P
er


Cependant, il n'est pas possible de modifier une cha√Æne de caract√®res (l'op√©ration ``s[0]='p'`` √©choue).

L'op√©rateur ```+``` permet de concat√©ner des cha√Ænes de caract√®res. L'op√©rateur ```*``` permet de r√©peter ```n``` fois la m√™me cha√Æne de caract√®re

In [6]:
s1 = "Bonjour"
s2 = 'tout le monde'
print(s1 + ' ' + s2)

Bonjour tout le monde


In [7]:
print('ha!'*10)

ha!ha!ha!ha!ha!ha!ha!ha!ha!ha!


## Formatage des cha√Ænes de caract√®re

Le formatage d'une cha√Æne de caract√®re consiste √† mettre dans une chaine un √©l√©ment variable. Cette op√©ration est souvent utilis√©e lorsque l'on veut afficher proprement 
un r√©sultat

In [8]:
heure = 15
minute = 30
"Il est {0}h{1}".format(heure, minute)

'Il est 15h30'

Pour ins√©rer un √©l√©ment ou plusieurs √©l√©ments variables 
dans une cha√Æne de caract√®re, on cr√©e d'abord cette cha√Æne en mettant √† la 
place des ces √©l√©ments une accolade avec un num√©ro d'ordre ``{i}``. En appliquant la 
m√©thode ``format`` sur cette cha√Æne, les accolades seront remplac√©es par 
le i√®me argument. 

Il est possible de passer l'argument par nom dans ce cas la cl√© est le nom de l'argument. 

In [9]:
"Il est {heure}h{minute}".format(heure=heure, minute=minute)

'Il est 15h30'

Depuis la version 3.6 de Python, il est possible de demander √† Python d'utiliser automatiquement les variables locales √† l'aide du pr√©fix ``f``.

In [10]:
f"Il est {heure}h{minute}"

'Il est 15h30'

Il est aussi possible de demander d'utiliser un attribut d'un objet : 


In [11]:
z = 1 + 2J
print(f'Re(z) = {z.real}')

Re(z) = 1.0


En utilisant le formatage de cha√Æne de caract√®re, il est possible de sp√©cifier en d√©tail comment ce nombre doit s'afficher. Par exemple, si il s'agit d'un nombre √† virgule flottante, combien de d√©cimales faut-il afficher, faut il utiliser la notation scientifique, etc. Pour cela, on rajoute √† l'int√©rieur des accolades un code particulier. Ce code est pr√©c√©d√© du signe ':'. 

In [12]:
from math import pi
'{0:.5f}'.format(pi)
c = 299792458. # Vitesse de la lumi√®re en m/s
'c = {0:.3e} m/s'.format(c)


'c = 2.998e+08 m/s'

Le 'f' indique que l'on veut une notation a virgule fixe, le 'e' une notation scientifique. Le chiffre que l'on indique apr√®s le '.' donne le nombre de chiffre apr√®s la virgule que l'on souhaite.


[L'aide en ligne](https://docs.python.org/fr/3.5/library/string.html#formatstrings) de Python fournit d'autres exemples et des d√©tails. 

## Quelques m√©thodes utiles

* ``strip`` (enl√®ve les espaces blanc au d√©but et fin de la cha√Æne)
* ``split`` (coupe la chaine et renvoie une liste de cha√Æne)
* ``join`` (inverse de slit : rassemble une liste de cha√Æne avec un cha√Æne)
* ``startswith``, ``endswith``
* ``lower``, ``upper`` (convertit en minuscule ou majuscule)

In [13]:
s="     bonjour   "
print(s)
print(s.strip())

s='un deux trois'
print(s.split())

l = ['pomme', 'p√™che', 'poire', 'abricot']
s = ', '.join(l)
print(s)

     bonjour   
bonjour
['un', 'deux', 'trois']
pomme, p√™che, poire, abricot


## Unicode

Unicode est un standard informatique qui permet des √©changes de textes dans diff√©rentes langues, √† un niveau mondial. Il vise au codage de texte √©crit en donnant √† tout caract√®re de n'importe quel syst√®me d'√©criture un nom et un identifiant num√©rique, et ce de mani√®re unifi√©e, quelle que soit la plateforme informatique ou le logiciel utilis√©. 

On peut cr√©er des cha√Ænes directement en unicode. On peut aussi utiliser le code en hexadecimal.

In [14]:
s1 = "Rayon Œ≥"
s2 = "Rayon \u03B3"
print(s2)
assert s1==s2

Rayon Œ≥


Il est possible de convertir un caract√®re en nombre et vice-versa

In [15]:
print(ord('‚Ç¨'))
print(hex(ord('‚Ç¨')))

8364
0x20ac


In [16]:
' '.join([chr(97 + i) for i in range(26)])

'a b c d e f g h i j k l m n o p q r s t u v w x y z'

On trouve m√™me des √©moticones

In [17]:
s = "\U0001f600"
print(s)

üòÄ


On peut aussi utilier le nom unicode

In [18]:
print("\N{slightly smiling face}")

üôÇ
