# Texte (string)

Un texte est une chaine de caractères.

![typewriter](https://media.giphy.com/media/3o84sqlBujhGoXvTyM/giphy-downsized.gif)

Le texte standard (ASCII code) consiste de
- 26 lettres minuscules (`a-z`)
- 26 lettres majuscules (`A-Z`)
- 10 chiffres (`0-9`)
- symboles de ponctuation (`.,;:?!`)
- délimiteurs (`(){}[]<>"'`)
- symboles spéciaux (`$%&/`)
- opérateurs (`+-*/`)

## Concepts

Les concepts présentés dans ce chapitre sont

- création de string `s = 'hello'`
- délimitation par un guillemet simple `'` ou double `"`
- caractère d'échappement `\`

Les indexages
- index simple `s[i]` pour accéder à une seule lettre
- tranche `s[m:n]` pour accèder à une sous-chaine
- tranche `s[::i]` avec incrément (2) et chaine inversée (-1)

Les fonctions
- `len()` pour retourner la longeur
- `str()` pour transformer nombre en chaine
- `int()` pour transformer chaine en nombre

Les opérateurs
- `+` de concaténation
- `*` de répétition 

## Délimitation

Une chaine de caractères est délimitée par des guillemets anglais simples `'`.

In [1]:
'hello'

'hello'

ou des guillemets anglais doubles  `"`.  
**Attention**: il ne faut pas confondre le guillemet double `"` (1 caractère) avec deux guillemets simples `''` (2 caractères).

In [2]:
"world"

'world'

Si le texte contient déjà un guillemet simple (apostrophe), on entoure le texte avec des guillemets doubles.

In [3]:
"c'est bien"

"c'est bien"

Si une chaine contient les deux sortes de guillemets, on les précède avec une barre oblique inverse `\` (backslash) qui est le caractère d'échappement.

In [35]:
s = 'c\'est "très" bien'
print(s)

c'est "très" bien


## Longueur

Une chaine s'appelle **string** en anglais.  
C'est pour cela que nous utilisons souvent ``s`` comme variable pour désigner une chaine.  
Par exemple:

In [5]:
s = 'Python'

La fonction `len()` retourne la longueur de la chaine.

In [6]:
len(s)

6

## Index
Chaque caractère d'une chaine peux être accédé par son index.  
Un index est un nombre entier, commençant avec 0 pour le premier caractère.

Voici la première et deuxième lettre du texte `s`

In [7]:
s[0], s[1]

('P', 'y')

Un index négatif permet d'accéder à une chaine dépuis sa fin.
Voici la dernière et avant-dernière lettre du string `s`.

In [8]:
s[-1], s[-2]

('n', 'o')

## Tranche
Une tranche est un sous-ensemble d'une chaine indiqué par un double indice de la forme `[m:n]`.  
Elle retourne la sous-chaine avec les lettres qui ont un indice m à n-1.

Voici la sous-chaine avec les indices 0, 1, et 2.

In [9]:
s[:3]

'Pyt'

Voici la sous-chaine avec les indices 2 et 3.

In [10]:
s[2:4]

'th'

Voici la sous-chaine avec les indices 3, 4 et 5.

In [11]:
s[3:]

'hon'

Un troisième paramètre peut donner l'**incrément**.  
Voici la chaine avec les lettres 0, 2, et 4 (à cause de l'incrément 2).

In [12]:
s[::2]

'Pto'

Un incrément négatif (-1) **inverse** la chaine.

In [13]:
s[::-1]

'nohtyP'

## Une chaine est immuable

Contrairement à une liste, une chaine est **immuable**.  
Essayer de réaffecter une lettre, donne une erreur.

    s[0] = 'J'
    TypeError: 'str' object does not support item assignment
    
Par contre c'est possible de créer une nouvelle chaine.  
Nous pouvons concaténer une lettre et une tranche d'une chaine existante, pour en former une nouvelle chaine.

In [14]:
'J' + s[1:]

'Jython'

## Opérateur de concaténation

L'opératieur `+` permet de concatener (enchainer) deux textes.

In [15]:
a = 'hello'
b = 'world'

La concatenation donne

In [16]:
a + b

'helloworld'

Nous pouvons ajouter une espace au milieu.

In [17]:
a + ' ' + b

'hello world'

Nous pouvons ajouter un retour à la ligne (`\n`) au milieu.

In [18]:
print(a + '\n' + b)

hello
world


## Opérateur de répétition

L'opératieur `*` permet de répéter un texte.

In [19]:
'hi' * 20

'hihihihihihihihihihihihihihihihihihihihi'

In [20]:
a * 5

'hellohellohellohellohello'

Maintenant, l'opérateur `*` signifie la multiplication

In [21]:
12 * 12

144

Nous pouvons utiliser des parenthèses pour fixer la priorité.

In [22]:
(a + ' ') * 5

'hello hello hello hello hello '

## Un caractère d'échappement
En informatique et en télécommunications, est un caractère qui déclenche une interprétation alternative du ou des caractères qui le suivent. En Python nous avons la **barre oblique inversée** comme caractère d'échappement.

- `\n` pour un retour à la ligne (=newline)
- `\t` pour un tabulateur
- `\\` pour échapper le caractère d'échappement.

Le tabulateur aligne un texte à des multiples de 8.

In [23]:
print('hello\tworld')
print('1\t2')

hello	world
1	2


Le `\n` (newline) insère un retour à la ligne.

In [24]:
print('hello\nworld')

hello
world


La première et troisième barre oblique sont échapés.

In [25]:
print('tab=\\t \tnewline=\\n\n1\t2')

tab=\t 	newline=\n
1	2


## Unicode

Le chaines de caractères utilisent Unicode. Ceci permet de créer des chaines dans toutes les langues du mondes.

Voici une chaine en japonais avec une sous-tranche.

In [26]:
jap = 'これは日本語です'
jap[3:6]

'日本語'

Voici une chaine qui utilise des emoji.

In [27]:
emoji = '🍏🍎🍐🍊🍋🍌🍉🍇🍓'

Voici deux emojis répétés 10 fois.

In [28]:
'🍎🍏' * 10

'🍎🍏🍎🍏🍎🍏🍎🍏🍎🍏🍎🍏🍎🍏🍎🍏🍎🍏🍎🍏'

## Type

La fonction `type` retourne le type d'un objet.  
Pour une chaine c'est `str` (=string).

In [29]:
type('abc')

str

Voici trois autres types:
- `int` (entier)
- `float` (virgule fottante
- `bool` (booléen)

In [30]:
type(1), type(1.2), type(True)

(int, float, bool)

## Conversion

Un nombre peut être présenté comme chaine.  
L'opérateur `*` signifie alors la répétition.

In [31]:
'12' * 12

'121212121212121212121212'

Maintenant, l'opérateur `*` signifie la multiplication

In [32]:
12 * 12

144

La fonction `int()` transforme une chaine qui represente un entier en entier.

In [33]:
int('12')

12

L'opérateur inverse `str()` transforme un nombre en string.

In [34]:
str(123)

'123'