<span style="float:left;">Licence CC BY-NC-ND</span><span style="float:right;">François Rechenmann &amp; Thierry Parmentelat&nbsp;<img src="media/inria-25.png" style="display:inline"></span><br/>

# Quelques rudiments de python

Maintenant que vous savez utiliser un notebook, voyons quelques notions de base de python.

**On rappelle que la façon habituelle de lire l'ensemble du notebook consiste à partir de la première cellule, et à taper *Maj+Entrée* -- ou *Shift+Enter*  -- jusqu'à la fin du notebook, de sorte à bien évaluer toutes les cellules de code.** 

On ne donne ici qu'un **très rapide** aperçu, pour vous donner un avant-goût du langage. Naturellement si vous connaissez déjà le langage, vous pouvez ignorer ce complément. À l'inverse, si vous ne connaissez pas du tout, sachez que les notions utilisées seront revues au fur et à mesure du cours.

### Formules magiques

Vous trouverez au début de chaque notebook de ce cours la cellule suivante&nbsp;:

In [None]:
# la formule magique pour utiliser print() en python2 et python3
from __future__ import print_function
# pour que la division se comporte en python2 comme en python3
from __future__ import division

Nous discutons ceci plus en détails à la fin de ce complément, mais dans l'immédiat, sachez simplement que ces "formules magiques" vont nous permettre d'écrire du code qui fonctionne indifféremment avec python2 et python3. 

### Nombres

On peut faire en python tous les calculs habituels comme avec une calculette, par exemple&nbsp;:

In [None]:
# calcul sur de petits entiers
256 - 27

J'en ai profité pour vous montrer que ce qui apparaît après le signe dièse `#` est **ignoré**, c'est un **commentaire**.

In [None]:
# ou sur de très gros entiers
6786897689768976893324534535 * 34535678909876543567890876

In [None]:
# ou sur des flottants
3.14159 * 2

### Le cas de la division

Avec les "formules magiques" que nous avons adoptées, la division en python se présente de la façon suivante.

 * On obtient toujours **un flottant** lorsqu'on fait une division simple avec `/`, même entre deux entiers&nbsp;:

In [None]:
100/8

 * Et pour obtenir le **quotient** de la division entière, on utilise `//`&nbsp;:

In [None]:
100//8

### Variables et affectation

Évidemment dès qu'on doit faire des calculs, il faut pouvoir mémoriser un résultat et le ranger dans une variable. En python cela se présente tout simplement avec le signe `=`&nbsp;:

In [None]:
a = 12
b = 36
c = a * b
print(c)

Ou si on veut faire un petit effort de présentation&nbsp;:

In [None]:
# on peut passer à la fonction print plusieurs paramètres
# qui sont tous imprimés, avec un ESPACE entre chaque
print("c=", c)

###  `print` ou pas `print` ?

Vous remarquez que nous avons parfois utilisé `print`, et parfois non. La logique est la suivante : lorsqu'on évalue une cellule, le **dernier** résultat est imprimé par défaut. C'est pourquoi j'obtiens une sortie même si je fais simplement&nbsp;:

In [None]:
c

Mais par contre si je fais maintenant&nbsp;:

In [None]:
c = 200

cela ne produit pas d'impression. Ce qui se passe ici, c'est que ce fragment de code, on l'appelle en langage savant une *affectation*, ne retourne pas de résultat. Dans ce cas-là, il nous faut appeler `print` explicitement si on veut voir le résultat.

In [None]:
c = 300
print(c)

En suivant cette logique, on peut être amené à appeler `print` si on veut imprimer des résultats intermédiaires (avant d'arriver à la fin de la cellule), ou si on veut améliorer un peu la présentation.

In [None]:
a = 12
print("a=", a)
b = 36
print("b=", 36)
c = a + b//2
print("c=", c)

### Les chaines de caractères

Python propose évidemment aussi comme type de base la **chaine de caractères**&nbsp;:

In [None]:
# on peut utiliser indifféremment ""
prenom = "Jean"
# ou ''
nom = 'Dupont'
print(nom, prenom)

In [None]:
# pour concaténer plusieurs chaines, on les ajoute avec +
complet = prenom + " " + nom
print("nom complet:", complet)

### La boucle `for` sur une chaine

C'est très facile de parcourir une chaine avec une boucle `for`&nbsp;:

In [None]:
DNA = "AGCTGTCGCG"
for lettre in DNA:
    print('la séquence contient', lettre)

### Les listes

Les objets de type **liste** permettent de stocker plusieurs résultats, en préservant leur ordre&nbsp;:

In [None]:
# On construit une liste avec des crochets []
liste1 = [ 1, 2 ]
# on peut mélanger les types dans une liste
liste2 = [ "trois", 4.]
print(liste2)

In [None]:
# comme pour les chaines on peut concaténer avec +
liste = liste1 + liste2
print(liste)

Enfin on peut ajouter au bout d'une liste avec `append`&nbsp;:

In [None]:
# on ajoute la chaine "cinq" à la fin de la liste
liste.append("cinq")
print(liste)

### Le test `if`

On peut faire un test avec l'instruction `if` .. `elif` .. `else`&nbsp;:

In [None]:
x = 10
if x < 4:
    print("petit")
elif x < 20:
    print("moyen")
else:
    print("grand")

### La fonction : `def` et `return`

On peut définir une **fonction** pour **réutiliser** le code. Ainsi ce qu'on vient d'écrire pourrait aussi bien se faire comme ceci&nbsp;:

In [None]:
# on définit une fonction qui retourne
# une chaine 'petit', 'moyen' ou 'grand'
def triage(x):
    # c'est important d'indenter la zone de texte
    # qui contient le code de la fonction
    if x < 4:
        return "petit"
    elif x < 20:
        return "moyen"
    else:
        return "grand"
    
# en revenant à la première colonne, on termine la définition 
# de la fonction triage    

Vous remarquez que même après avoir évalué cette cellule, vous n'obtenez pas d'impression&nbsp;; c'est le comportement normal. Ce qu'on vient de faire, c'est uniquement de définir une fonction, on ne l'a pas encore appelée.

Maintenant que la fonction est définie, on peut l'appeler&nbsp;:

In [None]:
message = triage(10)
print(message)

Remarquez tout de même ici&nbsp;:
 * l'utilisation de `def` qui définit la fonction de nom `triage` 
 * l'appel de la fonction `triage(10)`, et le fait qu'on range le résultat dans la variable `message`
 * l'utilisation de `return` dans le code de la fonction, qui indique quel est le résultat que doit renvoyer la fonction - et qui donc dans ce cas, sera rangé dans `message`

Comme ici, il **est très souvent plus malin** de concevoir une fonction qui **calcule** un résultat sans l'imprimer, et d'imprimer le résultat après coup, si c'est vraiment nécessaire, plutôt que d'imprimer directement dans la fonction. En effet dans un calcul plus compliqué, l'impression est en général facultative.

Avec cette façon de faire on peut facilement recommencer le même calcul avec une autre valeur pour `x`&nbsp;:

In [None]:
print(triage(0))

In [None]:
print(triage(8))

In [None]:
print(triage(20))

### Syntaxe et indentation

Ceux qui sont habitués à des langages comme C/C++ ou Java doivent être surpris de constater l'absence de marqueurs de début et de fin, comme `{}` ou `begin/end` dans d'autres langages. 

En python, la syntaxe repose en fait uniquement sur l'indentation du code, comme vous pouvez le voir sur les quelques exemples qui précèdent. Ce qui permet de se débarrasser presque complètement de ces marqueurs - il reste à penser à mettre un `:` avec les instructions comme `if`, `for` et `def`.

Il faut admettre que ce choix paraît étrange lorsqu'on rencontre ce style de syntaxe pour la première fois, mais vous verrez à l'usage qu'après un temps très court d'adaptation, cette syntaxe s'avère très agréable à la fois à lire et à écrire.

### Boucle `for` sur une liste

On peut faire un `for` sur autre chose qu'une chaine, en fait sur presque tout, et notamment les listes&nbsp;; on peut donc récrire les trois cellules précédentes comme ceci&nbsp;:

In [None]:
sujets = [0, 8, 20]
for sujet in sujets:
    print(triage(sujet))

### Les dictionnaires

python offre également un type de données très pratique, le dictionnaire. Pour simplifier à l'extrême, voici comment on s'en sert&nbsp;:

In [None]:
# pour créer un dictionnaire simple qui donne l'âge à partir du prénom
age_de = { 'jean' : 12, 'eric' : 25, 'anne' : 48 }
age_de

Comme on le voit un dictionnaire contient un ensemble de couples (clé ➞ valeur)&nbsp;; ici on a trois clés qui sont les trois chaines `jean`, `eric` et `anne`. Remarquez d'ailleurs que cette fois l'ensemble est non ordonné, contrairement au cas des listes.


Une fois qu'on a un dictionnaire on peut rechercher l'information associée à une clé comme ceci&nbsp;:

In [None]:
# rechercher la valeur attachée à la clé 'anne'
age_de['anne']

Le point à retenir concernant les dictionnaires c'est que la **performance** de cette recherche **ne dépend pas de la taille du dictionnaire** (ou en tous cas pas de manière linéaire). C'est le principal usage des dictionnaires que de permettre de **ranger un grand nombre de résultats** sans ralentir leur utilisation future. On aura l'occasion de reparler de cela.

### Une variable n'est pas une chaîne

Remarquez aussi que dans notre dernière cellule de code, les quotes `'` sont nécessaires&nbsp;:

Si on enlevait les `'` on obtiendrait une erreur&nbsp;:
```
>>> age_de[anne]
---------------------------------------------------------------------------
NameError                                 Traceback (most recent call last)
<ipython-input-220-a83ba2c48145> in <module>()
      1 # si on enlève les ' on obtient une erreur NameError
----> 2 age_de[anne]

NameError: name 'anne' is not defined
```

En effet, ce fragment serait valide si on avait défini une **variable** `anne`. Il convient de bien faire la différence entre
 * la **variable** `anne` - qui dans notre cas n'est pas définie, car on n'a jamais fait `anne = quelque chose`, 
 * la chaîne `'anne'`, qui elle est bien présente comme clé dans le dictionnaire.
    
Ce qui veut dire que par contre ce fragment-ci est valable&nbsp;:

In [None]:
prenom = 'anne'
age_de[prenom]

### Un exemple de fonction complète

En guise de conclusion, voici un tout petit morceau de code qui permet de
 * travailler sur une **chaine** de caractères `dna` en entrée&nbsp;; on suppose que la chaine ne contient que des 'A' ou 'T'
 * calcule (et retourne) une **liste**, constituée d'autant d'éléments que la chaîne `dna`, valant `'haut'` ou `'bas'` selon que la chaine d'entrée contient `A` ou `T` respectivement.

In [None]:
def directions(dna):
    # on initialise le résultat
    resultat = []
    # on balaie toutes les lettres de dna
    for lettre in dna:
        # si c'est un A
        if lettre == 'A':
            # on ajoute au resultat la chaine 'haut'
            resultat.append('haut')
        # presque pareil si c'est un T
        elif lettre == 'T':
            resultat.append('bas')
        # sinon: on affiche juste un message
        else:
            print("lettre non reconnue", lettre)
    # a ce stade on a dans resultat la liste qui
    # nous interesse
    return resultat

Ce qui donne, appliqué à quelques entrées&nbsp;:

In [None]:
directions('ATAT')

In [None]:
directions('TTTAAA')

### Version de python

Le code qui apparaît dans ce cours peut être **exécuté indifféremment avec python2 et python3**. 

Pour des raisons techniques, c'est python-2.7 qui est à l'oeuvre dans l'infrastructure du cours. Cela signifie que lorsque vous exécutez du code à partir d'un **notebook en ligne** sur FUN, il sera évalué par python-2.7. 

Mais si vous comptez utiliser plutôt python3 localement sur votre ordinateur, pas de souci particulier toutefois, tout le code **peut être utilisé à l'identique en python3** (et en fait, sans les "formules magiques").

Pour faire court, il existe en effet des incompatibilités entre les deux versions de python, mais nous n'utilisons que des traits particulièrement simples, qui fonctionnent de manière identique dans les deux versions de python, à part le cas de `print` et de la division&nbsp;; c'est le propos des "formules magiques" que nous avons vues au début du complément.

### Performances

Le langage python est très pratique, car étant interprété il permet de réaliser des calculs interactivement, et ainsi de se livrer à des tâtonnements, de faire très vite des moyennes et autres statistiques ou visualisations.

Cependant, il faut être conscient du fait que pour des algorithmes qui requièrent beaucoup de calculs, il peut se révéler assez lent. Nous approfondirons ce point au sujet notamment de l'algorithme de Needleman et Wunsch en Semaine 4, Séquence 9.

Retenez simplement, à ce stade, que les algorithmes que nous verrons dans ce cours ont une vocation principalement pédagogique, et que dans certains cas ils sont très inefficaces par rapport à ce qu'il serait possible d'obtenir avec un langage compilé comme C ou C++.

En pratique, on utilise des **librairies de fonctions** qui contiennent les algorithmes de base écrits dans un **langage compilé** de ce genre, et qui sont **accessibles depuis python** au travers de *wrappers*, c'est-à-dire de fonctions python qui appellent le code compilé. On obtient ainsi à la fois le beurre et l'argent du beurre, c'est-à-dire une **grande souplesse d'utilisation**, tout en préservant des **performances optimales**.  

### Pour conclure

À nouveau cette introduction est uniquement un survol extrêmement rapide (1% du langage peut-être..) pour nous permettre de commencer. Il existe un très grand nombre de ressources sur Internet pour apprendre le langage de manière plus exhaustive, mais ce n'est pas du tout notre sujet. 