<span style="float:left;">Licence CC BY-NC-ND</span><span style="float:right;">François Rechenmann &amp; Thierry Parmentelat&nbsp;<img src="media/inria-25.png" style="display:inline"></span><br/>

# Complément : quelques rudiments de python

Maintenant que vous savez utiliser un notebook, voyons quelques notions de base de python.

**On rappelle que la façon habituelle de lire l'ensemble du notebook consiste à partir de la première cellule, et à taper *Maj+Entrée* -- ou *Shift+Enter*  -- jusqu'au bout du notebook, de sorte à bien évaluer toutes les cellules de code.** 


On ne donne ici qu'un **très rapide** aperçu, pour vous donner un avant-goût du langage. Naturellement si vous connaissez déjà le langage, vous pouvez ignorer ce complément. À l'inverse, si vous ne connaissez pas du tout, sachez que les notions utilisées seront revues au fur et à mesure du cours.

### Version de python

Pour des raisons techniques, nous utilisons **dans tout le cours python-2.7**. Cela signifie que les notebooks sont évalués par python-2.7. Mais ii vous comptez utiliser plutôt python3 localement sur votre ordinateur, pas de souci particulier toutefois, tout le code **peut être utilisé à l'identique en python3**.

Il existe en effet des incompatibilités entre les deux versions, mais nous n'utilisons que des traits particulièrement simples, qui fonctionnent de manière identique dans les deux versions de python.

##### `print` ou `print()`

S'agissant notamment de `print`, nous utiliserons systématiquement la formule magique suivante, qui nous permet d'utiliser `print()` indiféremment en python2 et python3&nbsp;:

In [None]:
# la formule magique pour utiliser print() en python2 et python3
from __future__ import print_function

Aussi vous trouverez dans l'entête de tous les notebooks de ce cours une cellule contenant cette instruction.

### Nombres

On peut faire en python tous les calculs habituels comme avec une calculette, comme par exemple

In [None]:
# calcul sur de petits entiers
256 - 27

J'en ai profité pour vous montrer que ce qui apparaît après le signe dièse `#` est **ignoré**, c'est un **commentaire**.

In [None]:
# ou sur de très gros entiers
6786897689768976893324534535 * 34535678909876543567890876

In [None]:
# ou sur des flottants
3.14159 * 2

### Le cas de la division

L'autre différence pour nous entre python2 et python3 concerne la division. À nouveau nous utiliserons la formule magique suivante, qui permet de gommer les différences entre les deux versions de python&nbsp;:

In [None]:
# pour que la division se comporte en python2 comme en python3
from __future__ import division

Avec ceci en place, on obtient toujours un flottant lorsqu'on fait une division entre deux entiers&nbsp;:

In [None]:
100/8

Et pour obtenir le quotient de la division entière, on utilise `//`&nbsp;:

In [None]:
100//8

### Variables et affectation

Évidemment dès qu'on doit faire des calculs, il faut pouvoir mémoriser un résultat et le ranger dans une variable. En python cela se présente tout simplement avec le signe `=`&nbsp;:

In [None]:
a = 12
b = 36
c = a * b
print(c)

Ou si on veut faire un petit effort de présentation&nbsp;:

In [None]:
# on peut passer à la fonction print plusieurs parametres
print("c=", c)

### Les chaines de caractères

Python propose évidemment aussi comme type de base la **chaine de caractères**&nbsp;:

In [None]:
# on peut utiliser indifféremment ""
prenom = "Jean"
# ou ''
nom = 'Dupont'
# pour concaténer plusieurs chaines, on les ajoute avec +
complet = prenom + " " + nom
print("nom complet:", complet)

### La boucle `for` sur une chaine

C'est très facile de parcourir une chaine avec une boucle `for`&nbsp;:

In [None]:
ADN = "AGCTGTCGCG"
for lettre in ADN:
    print('la séquence contient', lettre)

### Les listes

Les objets de type **liste** permettent de stoker plusieurs résultats, en préservant leur ordre&nbsp;:

In [None]:
# On construit une liste avec des crochets []
liste1 = [ 1, 2 ]
# on peut mélanger les types dans une liste
liste2 = [ "trois", 4.]
# comme pour les chaines on peut concaténer avec +
liste = liste1 + liste2
print(liste)

Enfin on peut ajouter au bout d'une liste avec `append`&nbsp;:

In [None]:
# on ajoute la chaine "cinq" a la fin de la liste
liste.append("cinq")
print(liste)

### Le test `if`

On peut faire un test avec l'instruction `if` .. `elif` .. `else`&nbsp;:

In [None]:
x = 10
if x < 4:
    print("petit")
elif x < 20:
    print("moyen")
else:
    print("grand")

### La fonction : `def` et `return`

On peut définir une fonction pour réutiliser le code. Ainsi ce qu'on vient d'écrire pourrait aussi bien devenir, de manière strictement équivalente, ceci&nbsp;:

In [None]:
# une fonction qui retourne une chaine 'petit', 'moyen' ou 'grand'
def triage(x):
    if x < 4:
        return "petit"
    elif x < 20:
        return "moyen"
    else:
        return "grand"

message = triage(10)
print(message)

Remarquez tout de même ici&nbsp;:
 * l'utilisation de `def` qui définit la fonction de nom `triage` 
 * l'appel de la fonction `triage(10)`, et le fait qu'on range le résultat dans la variable `message`
 * l'utilisation de `return` dans le code de la fonction, qui indique quel est le résultat que doit renvoyer la fonction - et qui donc dans ce cas, sera rangé dans `message`

Comme ici, il **est très souvent plus malin** de concevoir une fonction qui **calcule** un résultat sans l'imprimer, et d'imprimer le résultat après coup, si c'est vraiment nécessaire, plutôt que d'imprimer directement dans la fonction. En effet dans un calcul plus compliqué, l'impression est en général facultative.

Avec cette façon de faire on peut facilement recommencer le même calcul avec une autre valeur pour `x`&nbsp;:

In [None]:
print(triage(0))

In [None]:
print(triage(8))

In [None]:
print(triage(20))

### Boucle `for` sur une liste

On peut faire un `for` sur autre chose qu'une chaine, en fait sur presque tout, et notamment les listes; on peut donc récrire les trois cellules précédentes comme ceci&nbsp;:

In [None]:
sujets = [0, 8, 20]
for sujet in sujets:
    print(triage(sujet))

### Les dictionnaires

python offre également un type de données très pratique, le dictionnaire. Pour simplifier à l'extrême, voici comment on s'en sert&nbsp;:

In [None]:
# pour créer un dictionnaire simple qui donne l'âge à partir du prénom
age_de = { 'jean' : 12, 'eric' : 25, 'anne' : 48 }
age_de

Comme on le voit un dictionnaire contient un ensemble de couples $clé ➞ valeur$; ici on a trois clés qui sont les trois chaines `jean`, `eric` et `anne`; Remarquez d'ailleurs que cette fois l'ensemble est non ordonné, contrairement au cas des listes.

Une fois qu'on a un dictionnaire on peut rechercher l'information associée à une clé comme ceci&nbsp;:

In [None]:
# rechercher la caleur attachée à la clé 'anne'
age_de['anne']

Le point à retenir concernant les dictionnaires c'est que la **performance** de cette recherche **ne dépend pas de la taille du dictionnaire** (ou en tous cas pas de manière linéaire).

C'est le principal usage des dictionnaires que de permettre de **ranger un grand nombre de résultats** sans ralentir leur utilisation future. On aura l'occasion de reparler de cela.

### Une variable n'est pas une chaîne

Remarquez aussi que dans notre dernière cellule de code, les quotes `'` sont nécessaires&nbsp;:

In [None]:
# si on enlève les ' on obtient une erreur NameError
age_de[anne]

En effet, ce fragment serait valide si on avait défini une **variable** `anne`. Il convient de bien faire la différence entre
 * la **variable** `anne` - qui dans notre cas n'est pas définie, car on n'a jamais fait `anne = quelque chose`, 
 * la chaîne `'anne'` qui est présente comme clé dans le dictionnaire.
    
Ce qui veut dire que par contre ce fragment-ci est valable&nbsp;:

In [None]:
prenom = 'anne'
age_de[prenom]

### Un exemple de fonction complète

En guise de conclusion, voici un tout petit morceau de code qui permet de
 * travailler sur une **chaine** de caractères `adn` en entrée; on suppose que la chaine ne contient que des 'A' ou 'B'
 * calcule (et retourne) une **liste**, constituée d'autant d'éléments que la chaîne `adn`, valant `'haut'` ou `'bas'` selon que la chaine d'entrée contient `A` ou `B` respectivement.

In [None]:
def liste_directions(adn):
    # on initialise le résultat
    resultat = []
    # on balaie toutes les lettres de adn
    for lettre in adn:
        # si c'est un A
        if lettre == 'A':
            # on ajoute au resultat la chaine 'haut'
            resultat.append('haut')
        # presque pareil si c'est un B
        elif lettre == 'B':
            resultat.append('bas')
        # sinon: on affiche juste un message
        else:
            print("lettre non reconnue", lettre)
    # a ce stade on a dans resultat la liste qui
    # nous interesse
    return resultat

Ce qui donne, appliqué à quelques entrées&nbsp;:

In [None]:
liste_directions('ABAB')

In [None]:
liste_directions('BBBAAA')

### Pour conclure

À nouveau cette introduction est uniquement un survol extrêmement rapide (2% du lanagage peut être..) pour nous permettre de commencer. Il existe un très grand nombre de ressources sur Internet pour apprendre le langage de manière plus exhaustive, mais ce n'est pas du tout notre sujet.