<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat &amp; Arnaud Legout</span>
</div>

In [None]:
from plan import plan; plan("types", "séquences")

# séquences & chaines

* suite finie et ordonnée d'objets
* du coup indexable `seq[n]`
* indices **commencent à 0**
* peuvent contenir des duplications

* mutable
  * `list`, `bytearray`
* immutable
  * `str`, `bytes`, `tuple`, `range`

## fonctions sur toutes les séquences

### indexation, longueur

* `S[i]`
  * retourne l’élément d'indice i
* `len(S)` 
  * donne la taille en nombre d’éléments

### concaténation, comparaisons

* `S + T`
 * retourne une nouvelle séquence qui est la concaténation de S et T
* `S*n` ou `n*S`
  * retourne une nouvelle séquence qui est la concaténation de n *shallow* copies de S
* `min(S)` (resp. `max(S)`)
  * retourne le plus petit (resp. le plus grand) élément de S

### appartenance, recherches

* `x in S`; selon les types:
 * `True` si un élément de S est égal à x (e.g. `list`)
 * `True` si S contient x (e.g. `str`)
* `S.index(a)`
  * retourne l’indice de la première occurrence de a dans S
* `S.count(a)`
  * retourne le nombre d’occurrences de a dans S

## slicing

* `S[i:j]` retourne 
  * une nouvelle séquence de même type
  * contenant tous les éléments de l’indice i à l’indice j-1
* `S[i:j:k]` retourne
  * une nouvelle séquence de même type
  * prenant tous les éléments de l’indice i à l’indice j-1, par sauts de k éléments

<img src="pictures/egg-bacon.png"/>

**slicing**

* on peut compter du début ou de la fin
* on peut omettre les bornes

In [None]:
s = "egg, bacon"
s[0:3]

In [None]:
# si on omet une borne 
# ce sera le début ..
s[:3]

In [None]:
# ... ou la fin:
s[5:]

In [None]:
# les indices peuvent être négatifs
s[-3:10]

In [None]:
# tout entier: une shallow-copy
s[:]

<img src="pictures/egg-bacon-bornes.png" text-align="center">

### les bornes

La convention est choisie pour pouvoir facilement encastrer les slices:

In [None]:
s[0:3]

In [None]:
s[3:6]

In [None]:
s[6:]

In [None]:
s[0:3] + s[3:6] + s[6:] == s

<img src="pictures/egg-bacon.png" text-align="center">

### le pas

* on peut préciser un pas
* peut aussi être négatif
* ou omis (défaut 1)

In [None]:
s[0:10:2]

In [None]:
s[::2]

In [None]:
s[:8:3]

In [None]:
s[-2::-3]

<img src="pictures/egg-bacon.png" text-align="center">

### pas d'exception

les slices ont un comportement plus permissif que l'indexation

In [None]:
# Si j'essaie d'utiliser un index inexistant
try: s[100]
except Exception as e: print("OOPS", e)

In [None]:
# par contre avec un slice, pas de souci
s[5:100]

In [None]:
# vraiment..
s[100:200]

<img src="pictures/egg-bacon.png" text-align="center">

In [None]:
s[-1]

In [None]:
s[-3:-1]

In [None]:
s[:-3]

In [None]:
s[::-1]

In [None]:
s[2:0:-1]

In [None]:
s[2::-1]

### formes idiomatiques

In [None]:
s = [1, 2, 3]

In [None]:
# une copie simple
s[:]

In [None]:
# copie renversée
s[::-1]

## `str` et `bytes`

* deux cas particuliers de **séquences**
  * `str` pour manipuler **du texte**
  * `bytes` pour manipuler **de la donnée brute**
  
* **ATTENTION**
  * un caractère ce **n'est pas** un octet

### chaînes de caractères `str`

* un cas particulier de séquence
* une chaîne de caractères est définie de manière équivalente par des simples ou doubles guillemets (`'` ou `"`)
* on peut ainsi facilement inclure un guillemet

In [None]:
# une chaine entre double quotes
# pas de souci pour les accents 
print("c'est l'été")

In [None]:
# entre simple quotes
print('on se dit "pourquoi pas"')

### chaîne de caractères sur plusieurs lignes

* pour écrire une chaîne sur plusieurs lignes on utilise `"""` ou `'''`

In [None]:
print("""et pour entrer plusieurs 
lignes avec des " et/ou des ' 
c'est facile""")

### chaînes de caractères accolées

* lorsque vous voulez entrer une chaine un peu longue
* vous pouvez **simplement accoler** deux chaines dans votre source:

In [None]:
s = "le début" " et la fin"
print(s)

In [None]:
s = ("une chaine trop longue"
     " pour tenir sur une ligne")
print(s)

dans ce deuxième exemple, notez les parenthèses (sinon c'est une erreur de syntaxe)

### échappements dans les chaines

* on écrit un retour chariot avec un `\n`
* autres caractères utilisant un backslash
  * `\\`  `\'` `\"` `\t`
  * `\x` `\u` `\U` 
  …

### exemples

In [None]:
s = "l'hôtel"
print(s)

In [None]:
s = 'une "bonne" idée'
print(s)

In [None]:
s = """une très longue phrase
avec saut de ligne"""
print(s)

In [None]:
s = '  un backslash \\ un quote \' ' 
print(s)

### *raw-strings*

Voici un problème commun, surtout sous Windows:

In [None]:
s = 'C:\Temp\test.txt'
print(s)

* `\T` n’existe pas, Python interprète correctement `\T`
* mais `\t` est compris comme une tabulation !!

* 1$^{ère}$solution : utiliser `\\`
* mais pas très élegant

In [None]:
s = 'C:\\Temp\\test1.bin'
print(s)

#### *raw-strings* (suite)

* la bonne solution : "raw string" 
* chaîne de caractères dans laquelle les backslash ne sont *pas interprétés*

In [None]:
# pour créer une raw-string, simplement faire précéder le string d'un 'r'
s = r'C:\Temp\test1.bin'
print(s)

### *docstrings*

* les triples guillemets sont souvent utilisé pour les *docstrings*  
  (aides des fonctions)

In [None]:
def double(n):
    """
    Returns the double of its input parameter
    
    The help message usually spans several lines
    """
    return 2*n

In [None]:
help(double)

## opérations sur les `str`

### toutes les opérations des séquences

In [None]:
s1 = 'abcdéfg'
s2 = 'bob'
len(s1)

In [None]:
# concaténation
s1 + s2
'abcdefbob'

In [None]:
s1[-1::-2]

In [None]:
'=' * 30

### une chaine est une séquence (suite)

In [None]:
s1

In [None]:
'x' in s1

In [None]:
'cdé' in s1

In [None]:
s1.index('cdé')

### objet `str` non mutable

* par contre **ATTENTION** un `str` n'est **pas mutable**

In [None]:
try: 
    s1[2] = 'x'
except TypeError as e:
    print("OOPS", e, type(e))    

## formatage des chaînes : f-strings

* depuis Python-3.6
* utilisez les ***f-strings***
* qui évitent les répétitions fastidieuses

* entre `{` et `}` : **du code** 
* embarqué directement dans le format
* n'importe quelle expression

In [None]:
import math

In [None]:
nom, age = "Pierre", 42

In [None]:
f"{nom} a {age} ans"

In [None]:
f"360° = {2*math.pi} radians"

### *f-string* : expression et format

![](pictures/f-string.png)

In [None]:
print(f"ᴨ arrondi à deux décimales = {math.pi:.2f}")

### expression dans le format

* le format peut à son tour contenir des expressions

In [None]:
from decimal import Decimal
value = Decimal('12.34567')

In [None]:
# ici la précision de 4 
# signifie 4 chiffres
# significatifs en tout
f"value = >{value:10.4}<"

In [None]:
# ça aurait pu être 
# un paramètre
width = 10
precision = 4
f"value = >{value:{width}.{precision}}<"

### formats - scientifiques

formats scientifiques usuels: `e` `f` et `g`, cf. `printf`

In [None]:
x = 23451.23423536563
f'{x:e} | {x:f} | {x:g} | {x:010.1f} | {x:.2f}'

In [None]:
y = 769876.11434
f'{x:e} | {y:f} | {x:g} | {y:010.2f} | {x:.2f}'

Voir aussi pour plus de détails:  
https://mkaz.blog/code/python-string-format-cookbook/

### formats pour f-string : justification

justification: formats `<` `ˆ` et `>`

In [None]:
f"|{nom:<12}|{nom:^12}|{nom:>12}|"

In [None]:
# on peut aussi préciser avec quel caractère remplir
num = 123
f"|{num:<12}|{num:-^12}|{num:0>12}|"

## formatage : anciennes méthodes

* avant Python-3.6, il y a eu deux autres méthodes pour formatter
* `str.format()`
* l'opérateur `%`

* il est **recommandé** d'utiliser les f-strings
* mais les deux autres formes existent encore
* a minima savoir les lire

### formatage avec `str.format()` (*old-school*)

In [None]:
# anonyme (dans l'ordre)
print('We are the {} who say "{}!"'.format('knights', 'Ni'))

In [None]:
# par index
print('{1} and {0} {0}'.format('spam', 'eggs'))

In [None]:
# par nom
print('This {food} is {adjective}'
      .format(food='spam', adjective='absolutely horrible'))

### formatage avec `%` (*very old-school*)

* encore plus ancienne méthode

In [None]:
nom = "Alice"
"%s dit bonjour" % nom

In [None]:
d = 3
"%i + %i = %i" % (d, d, d + d)

In [None]:
"%(food)s is %(adjective)s" % {'food' : 'bacon',
                               'adjective' : 'delicious' }

* on peut être parfois tenté d’utiliser la concaténation `+`

In [None]:
'abc' + 'def' 

* par contre **attention**, on ne peut concaténer que des `str`, il faut convertir explicitement avec `str()`

In [None]:
age = 35
try: 'alice a ' + age + ' ans'
except Exception as e: print ("OOPS", e)

In [None]:
'alice a ' + str(age) + ' ans'

## méthodes sur les `str`

### `strip()`

In [None]:
# j'ai lu une chaine dans un fichier
# je ne sais pas trop s'il y a des espaces à la fin
# et si la chaine contient un newline

dirty = "  des blancs au début et à la fin et un newline  \n"
dirty

In [None]:
# c'est la méthode la plus simple pour nettoyer
dirty.strip()

### `split()` et `join()`

In [None]:
# une chaine à découper
s = "une phrase\nsur deux lignes"
s

In [None]:
# sans argument, split
# découpe selon les espaces
# et tabulations et newline
liste = s.split()
liste

In [None]:
# recoller les morceaux
"".join(liste)

In [None]:
# le plus souvent
" ".join(liste)

In [None]:
# ou n'importe quel autre séparateur
"+++".join(liste)

### remplacements, recherches

In [None]:
s = "une petite phrase"
s.replace('petite', 'grande')

In [None]:
# l'index du premier caractère
s.find('hra')

In [None]:
s[12]

#### et plein d'autres..

* de nombreuses méthodes disponibles
* personne ne retient l'intégralité des méthodes sur les types de base
* le bon réflexe : chercher dans la dos Python qui est très bien faite
* google les simples mots clés 'python str', vous trouvez
* <https://docs.python.org/3/library/stdtypes.html>

## un peu d'introspection (avancé)

disons qu'on voudrait savoir combien de méthodes sont disponibles sur les chaines.

In [None]:
type("abc")

In [None]:
str

In [None]:
# 'str' est une variable prédéfinie, qui référence 
# le type (la classe) de toutes les chaines
type("abc") is str

In [None]:
# du coup son type, c'est .. le type <type>
type(str)

### un peu d'introspection...

In [None]:
# peu importe... quoi qu'il en soit, dir(str) retourne la liste
# des noms de méthodes connues sur cette classe; 
# regardons par exemple les premiers et les derniers
dir(str)[:2], dir(str)[-2:]

In [None]:
# avec len() je peux savoir combien il y en a
len(dir(str))

In [None]:
# mais en fait, pour un décompte significatif
# on enlève celles dont le nom contient `__`
len([method for method in dir(str) if '__' not in method])