# Utiliser Python avec des données géographiques: une introduction

## 1. Aperçu

Python est un langage de programmation puissant et facile à utiliser et apprendre. Python est très utilisé comme **langage de scriptage** dans beaucoup de logiciels, notamment dans le domaine SIG (p.ex. QuantumGIS ou ArcGIS). Il permet de développer rapidement des petits scripts comme des applications complètes. Python possède également une riche bibliothèque d’extensions permettant d’accéder à des nombreuses librairies spécialisées. En plus, il est facile d’ajouter des nouvelles fonctionnalités grâce à des modules. Sa relative facilité d'utilisation combiné avec les possibilités d'extension ont rendu ce langage populaire dans beaucoup de domaines, dont l'analyse de données («data science» en anglais), et les SIG.

Python est un **langage interprété**, ce qui rend possible le développement rapide sans compilation. Des langages comme C, C++ ou Java sont des langages compilés, c’est-à-dire le code doit d’abord être traduit en code machine avant d’être exécuté. Dans le cas d’un langage interprété, cette étape de compilation et faite pendant l’exécution du logiciel. Ceci rend le code un peu plus lent, mais accélère et facilite considérablement le développement.

Python est un langage open-source; l’interpréteur Python ainsi que les librairies standard peuvent être téléchargés librement depuis le [site Web Python](http://www.python.org).

Python est un langage multi-plateforme. L’interpréteur et le code écrit tournent en principe sur toutes les plateformes majeures.

### 1.1 Documentation

Python possède une riche documentation accessible sur Internet, sur [python.org](http://www.python.org) (en anglais). La page [wiki.python.org/moin/FrenchLanguage](http://wiki.python.org/moin/FrenchLanguage) donne un aperçu de la documentation Python en français.

Nous allons utiliser beaucoup la documentation, car il est impossible de mémoriser toutes les fonctions et astuces.

Il est possible de télécharger l'archive complet, si vous ne possédez pas tout le temps une connexion Internet.

Il y a aussi de nombreux tutoriels pour apprendre Python, par exemple: [dept-info.labri.fr/ENSEIGNEMENT/projetprog1/TutorielPython.pdf](http://dept-info.labri.fr/ENSEIGNEMENT/projetprog1/TutorielPython.pdf). Ce tutoriel est plus complet que ce cours, mais présente évidemment uniquement une introduction à Python, sans focaliser sur les données spatiales.

Python peut être utilisé de deux manières différentes: en **mode interactif** et en **mode script** où un fichier enregistré sur le disque est exécuté. Nous commençons d’abord par le mode interactif. Sur un système Unix, l’interpréteur Python peut généralement être lancé depuis le Terminal en tapant

    python
    
Parfois, un interpréteur un peu plus sophistiqué est installé; il s’appelle `iPython` (pour interactive python). Si iPython n'est pas installé, il vaut la peine de l'installer. Pour le lancer, simplement taper

    ipython

Python démarre alors la console avec quelques informations sur la version, et puis attend notre code: 

![Figure 1. La console Python](img/console-python.png)

## 2. Un bref exemple pour démarrer

Essayons le code suivant: 

In [1]:
a = "Paul"
if a == "Paul":
    print "Hello Paul"
else:
    print "Hello inconnu" 

Hello Paul


Ceci montre déjà quelques caractéristiques typiques de Python:

- `a = "Paul"` définit une nouvelle **variable** contenant un «string»
- Il n'y a **pas de caractère de fin de ligne** comme dans C ou Java (mais ça marche tout de même avec un point-virgule...)
- Dans une condition `if ... else ...`, il n'y a *pas d'accolades* {...}, mais un double-point
- **L'indentation est importante**: elle permet de regrouper les instructions

Pour quitter la console Python, vous pouvez taper Ctrl-D. 

### 2.1 Commentez votre code!

Il est très important d'écrire des commentaires qui font du sens. Ils sont là pour que vous compreniez votre code plus tard, et pour que votre collègue le comprenne aussi.

En Python, tout ce qui suit un dièse (`#`) est ignoré jusqu'à la fin de la ligne. Essayez:

In [2]:
# Moi, je vous dis que ce programme ne fait presque rien
print "Bonjour!"   # Cette ligne affiche "Bonjour!"
# Vous pouvez utiliser le dièse aussi pour "désactiver" une ligne:
# print "Moi je ne fais rien" 

Bonjour!


En plus, Python connaît un commentaire spécial, le **docstring**, qui sert à la documentation. Il est placé tout au début du fichier, d'une fonction, ou d'une classe, entre des triple-apostrophes. Il est typiquement utilisé pour informer ce le code est censé faire, et comment il faut l'utiliser. Un exemple (on verra les fonctions plus loin): 

In [3]:
def au_carre(x):
    """Calcul le carré de la valeur d'entrée.
    Prend qu'un seul argument numérique."""
    return x**2 

### 2.2 Les variables

Une variable est un nom pour un morceau de données stocké dans la mémoire vive de l'ordinateur. Un nom de variable peut être composé de caractères (sans accents), de chiffres et «underscores» (soulignés). Le nom doit commencer par un caractère. Python distingue entre minuscules et majuscules. Essayez: 


In [4]:
adresse = "Avenue de la Gare, Lausanne"
code_postale = 1003
distance_a_la_gare_km = 0.15
print adresse, " se trouve à ", distance_a_la_gare_km, "km" 

Avenue de la Gare, Lausanne  se trouve à  0.15 km


Par convention, on remplace les espaces par des underscores, et tous les noms de variables sont en minuscules. On utilisera les majuscules plus tard pour les noms de classes.

Il est évidemment possible d'utiliser les variables pour des opérations et calculs: 

In [5]:
distance_a_la_gare_metres = distance_a_la_gare_km * 1000
print distance_a_la_gare_metres 

150.0


Il est possible d'attribuer la même valeur à plusieurs variables: 

In [9]:
a = b = c = 1
print a, b, c 

1 1 1


Pour supprimer une variable, on peut taper:

In [10]:
del a     # ça efface la variable a 

### 2.3 Quelques astuces pour la console interactive

La console interactive iPython offre deux mécanismes qui peuvent considérablement simplifier la vie du programmeur:

- Si vous commencez à taper un nom d'une variable ou d'une fonction, et vous appuyez sur la touche `Tab`, iPython va automatiquement lister toutes les variables et fonctions commençant avec le texte tapé: ![](img/ipython-autocomplete.png)

- Si vous tapez `?nom_fonction`, iPython affichera la documentation pour `nom_fonction`. Essayez p.ex. `?str`.



### 2.4 Les iPython notebooks (ou Jupyter notebooks)

Intégré dans iPython, il y a les *notebooks*. Tapez simplement dans la console:

    ipython notebook

Il y a alors une fenêtre de votre navigateur qui s'ouvre qui vous permet de créer des *notebooks*. Un notebook est un document de type `.ipynb` sur votre disque dur qui peut être visualisé à l'aide d'iPython dans votre navigateur Web. Le notebook permet de créer une série de *cellules* (ou containeurs) avec du contenu différent, en principe soit du [Markdown](http://daringfireball.net/projects/markdown/), donc du texte formaté, ou du code qui sera exécuté.

## 3. Types de données Python 

Python connaît un certain nombre de types de données, p.ex. pour les chaînes de caractères (type: **string**), les nombres entiers (type: **integer**), les nombre à virgule flottante (type: float), ou les arrays (type: list). Pour la plupart du temps, ces types fonctionnent de **manière implicite**, c'est-à-dire il ne faut pas les déclarer, comme p.ex. dans C. Par contre, on ne peut pas utiliser un integer à la place d'un string, ou un string à la place d'un float, etc. Il y a des fonctions de **conversion** pour faire cela. 

### 3.1 Les chaînes de caractères

Les chaînes de caractères (string) peuvent être déclarées très simplement avec des guillemets, apostrophes, ou triple guillemets: 

In [18]:
str1 = "Une chaine de caracteres"
str2 = 'C\'est aussi une chaîne de caracteres'
str3 = """Et ça aussi, c'est une chaîne de caractères.
C'est une chaîne de caractères sur plusieurs lignes!""" 

Remarquez que dans la deuxième ligne, nous avons «protégé» l'apostrophe à l'intérieur du texte par un «backslash». C'est pour éviter que le string se termine à cet endroit déjà. On peut faire de même pour un string avec guillemets: 

In [12]:
str4 = "Dis \"bonjour\"" 

ou plus simplement: 

In [13]:
str5 = 'Dis "bonjour"'

L'utilisation de guillemets ou apostrophes est strictement équivalent (contrairement à C ou PHP p.ex.). 

Nous pouvons demander la longueur d'un string avec `len`: 

In [14]:
print len(str5) 

13


Pour extraire uniquement une sélection d'une chaîne, on peut utiliser des indices. P.ex. les 4 premiers caractères de str1 peuvent être obtenu comme suit: 

In [15]:
str1[0:4]      # Les indices en Python commencent à 0 

'Une '

ce qui est équivalent à 

In [16]:
str1[:4]       # Le 0 initial peut être omis 

'Une '

Si on veut omettre les 3 derniers caractères, il suffit d'utiliser des indices négatifs: 

In [19]:
str1[:-3] 

'Une chaine de caracte'

Et si on veut juste les 3 derniers caractères:


In [20]:
str1[-3:] 

'res'

Évidemment, on peut aussi juste extraire un seul caractère: 

In [21]:
str1[4]        # Le 5ème caractère 

'c'

#### Quelques autres fonctions utiles

Beaucoup de fonctions permettent de manipuler les chaînes de caractères. Voici un bref aperçu sur les fonctions les plus utiles. Les fonctions suivent le string (ou le nom de la variable), séparées par un point. 

Pour enlever des espaces blancs (espace, tabulateur, retour de lignes etc.) au début et à la fin d'une chaîne: 

In [23]:
" C'est tres pratique pour nettoyer   \n".strip() 

"C'est tres pratique pour nettoyer"

(le «\n» est un signe de «nouvelle ligne»). 

Pour enlever un ou plusieurs caractères spécifiques: 

In [24]:
"--- Enlever les traits-d'union et espaces ---".strip('- ') 

"Enlever les traits-d'union et espaces"

Pour chercher un texte à l'intérieur d'une chaîne:

In [25]:
"auto" in "C'est une belle automobile"   # Retourne True or False 

True

In [26]:
"C'est une belle automobile".find("auto")
    # Retourne l'endroit dans la chaîne ou "auto" a été trouvé,
    # ou -1 si la chaîne n'a pas été trouvée 

16

Et pour remplacer un texte par un autre: 

In [27]:
"C'est une belle voiture".replace('voiture', 'moto') 

"C'est une belle moto"

Pour convertir une chaîne en liste en utilisant un caractère de séparation: 

In [29]:
"Separer les mots".split()

['Separer', 'les', 'mots']

In [30]:
"Separer les phrases. Par des points.".split('.') 

['Separer les phrases', ' Par des points', '']

Nous allons discuter les listes plus en détail un peu plus loin.

Une documentation plus exhaustive des méthodes s'appliquant à des string peut être trouvée à l'URL: [http://docs.python.org/library/stdtypes.html#string-methods](http://docs.python.org/library/stdtypes.html#string-methods).

### Les chaînes unicode

Dans Python, il y a également des chaînes de caractères un peu différentes: les chaînes unicode. Unicode permet d'utiliser les caractères de tous les alphabets. Les chaînes unicodes sont pour la plupart du temps transparentes dans Python. Pour créer un string unicode, il suffit de mettre un «u» devant la chaîne: 

In [37]:
print u"C'est une chaîne de caractères Unicode" 

C'est une chaîne de caractères Unicode


Il est possible de convertir une chaîne unicode vers une chaîne 8-bits d'un encodage donné, et vice-versa:


In [35]:
print u"àéè".encode('utf-8') 

àéè


In [36]:
print unicode('àéè', 'iso-8859-1') 

Ã Ã©Ã¨
