# Strings (Chaîne de caractères)

Alexandre Bovet

UNamur et UCLouvain

alexandre.bovet@unamur.be


### Unicode
- Standard qui permet des échanges de textes dans différentes langues
- Unicode est constitué d'un répertoire de 128 172 caractères
- Offre plusieurs type d’encodage pour les caractères
- **UTF-8**:
 - Type d’encodage des caractères Unicode
 - Identique sur n’importe quel ordinateur




### Strings en Python

Création de String: `' '` ou `" "`

In [None]:
s = '深入 Python' 

Longueur d’un String

In [None]:
len(s)

Récupération d’un caractère (similaire aux listes)

In [None]:
s[0]

Concaténation avec `+` (similaire aux listes)

In [None]:
s + ' 3' 

### Exemple d'utilisation:
```python
SUFFIXES = {1000: ['KB', 'MB', 'GB', 'TB', 'PB', 'EB', 'ZB', 'YB'],         
            1024: ['KiB', 'MiB', 'GiB', 'TiB', 'PiB', 'EiB', 'ZiB', 'YiB']}

def approximate_size(size, a_kilobyte_is_1024_bytes=True):
    '''Convert a file size to human-readable form.                          
    '''                                                                     
    if size < 0:
        raise ValueError('number must be non-negative')                     

    multiple = 1024 if a_kilobyte_is_1024_bytes else 1000
    for suffix in SUFFIXES[multiple]:
        size /= multiple
        if size < multiple:
            return '{0:.1f} {1}'.format(size, suffix)                   

    raise ValueError('number too large')
    ```

### Formater des Strings
- Strings = objets => méthodes et attributs!

Méthode `.format()`:
- `{x}` = champ remplacé par argument `x` de format
- Retourne un String

In [None]:
username = 'mark'
password = 'PapayaWhip'

"{0}'s password is {1}".format(username, password)

- Expressions dans format peuvent être complexes

In [None]:
import humansize
si_suffixes = humansize.SUFFIXES[1000]
si_suffixes

In [None]:
'1000{0[0]} = 1{0[1]}'.format(si_suffixes)

`{0}` = argument `x` de `format(x)` = `si_suffixes`
Mais `si_suffixe` est une liste => `{0[i]}` = élément `i` de la liste

**=> Format peut accéder aux objets et propriétés de structure de données**



#### `format()` : Types d’arguments valide
- Liste et accéder à une valeur par un indice
- Dictionnaire et accéder à une valeur par une clé
- Module et accéder aux variables et fonction par leur nom
- Instance de classe et accéder à ses propriétés/méthodes par leur nom
- N’importe quelle combinaison des types précédents

In [None]:
import humansize 
import sys 
'1MB = 1000{0.modules[humansize].SUFFIXES[1000][0]}'.format(sys)

- Module `sys` a les infos sur la session en cours et a été importé
- Modules importés dans la sessions sont dans le dictionnaire `sys.modules` : `{'nom':module}`

In [None]:
#essayez d'ecrire un code equivalent, en utilisant sys mais sans utiliser de string

#### Spécifier des formats
https://docs.python.org/3.6/library/string.html#format-specification-mini-language

In [None]:
'{0:.1f} {1}'.format(698.24, 'GB')

`.1f` Définit le format de la valeur (printf en C)
- `.1` -> arrondi à 1 décimale
-  `f` -> notation décimale fixe pour nombre réels

####  Opérations
`splitlines()`, `lower()` et `count()`

In [None]:
# une string sur plusieures lignes avec ```
s = '''Finished files are the re- 
sult of years of scientif- 
ic study combined with the 
experience of years.''' 

s.splitlines() #découpe un string sur plusieurs en une liste de strings

In [None]:
print(s.lower()) #Retourne le string original mais en minuscules

In [None]:
s.lower().count('f') #Nombre d’occurrence de ‘f’ (minuscule ou majuscules) dans le string

#### Méthodes
`split()` et transformation en un dictionnaire

In [None]:
query = 'user=pilgrim&database=master&password=PapayaWhip' 
a_list = query.split('&') 
a_list

In [None]:
a_list_of_lists = [v.split('=') for v in a_list if '=' in v]
a_list_of_lists

In [None]:
a_dict = dict(a_list_of_lists)
a_dict

**Slicing** à la manière d’une liste

In [None]:
a_string = 'My alphabet starts where your alphabet ends.' 
a_string[3:11] 

In [None]:
a_string[3:-3]

In [None]:
a_string[0:2]

In [None]:
a_string[:18]

In [None]:
a_string[18:]

- `str.upper()` : transformer en str en majuscule
- `str.capitalize()` : premier caractères en majuscule, le reste en minuscule
- `str.replace()` : remplace les occurrences de old par new dans str
- `str.find(sub)` : retourne l’indice de sub dans str, ou -1 si pas trouvé
- `str.index(sub)` : idem find() mais renvoie ValueError si pas trouvé
- `str.lstrip()` : retire les ‘blancs’ au début de str
- `str.rstrip()` : retire les ‘blancs’ à la fin de str
- `str.strip()` : retire les ‘blancs’ au début et à la fin de str
- …

https://docs.python.org/3.6/library/stdtypes.html#string-methods 