# 1. Introduction

Conçu à la fin des années 1980 comme un langage d'enseignement et de script, Python est depuis devenu un outil essentiel pour de nombreux programmeurs, ingénieurs, chercheurs et data scientists dans le monde universitaire et l'industrie. 

L'attrait de Python réside dans sa simplicité et sa beauté, ainsi que dans la commodité du vaste écosystème d'outils spécifiques au domaine qui ont été construits à partir de lui. Par exemple, la plupart du code Python dans le domaine du calcul scientifique et de la science des données est construit autour d'un groupe de paquets matures et utiles :


- [NumPy](http://numpy.org) fournit un stockage et un calcul efficace pour les tableaux de données multidimensionnels.
- [SciPy](http://scipy.org) contient un large éventail d'outils numériques tels que l'intégration et l'interpolation numériques.
- [Pandas](http://pandas.pydata.org) fournit un objet DataFrame ainsi qu'un ensemble puissant de méthodes pour manipuler, filtrer, grouper et transformer les données.
- [Matplotlib](http://matplotlib.org) fournit une interface utile pour la création de graphiques et de figures de qualité professionnelle.
- [Scikit-Learn](http://scikit-learn.org) fournit une boîte à outils uniforme permettant d'appliquer aux données des algorithmes d'apprentissage automatique courants.
- [IPython/Jupyter](http://jupyter.org) fournit un terminal amélioré et un environnement de notebook interactif utile pour l'analyse exploratoire, ainsi que pour la création de documents interactifs et exécutables. Par exemple, cette presentation est un notebook Jupyter.

Les nombreux autres outils et paquets qui les accompagnent ne sont pas moins importants : si vous souhaitez effectuer une tâche scientifique ou d'analyse de données, il y a de fortes chances que quelqu'un ait écrit un paquet qui le fera pour vous.

Toutefois, pour exploiter la puissance de cet écosystème de science des données, il faut d'abord se familiariser avec le langage Python lui-même.
Cette présentation vise à combler cette niche.
Elle offrira un tour d'horizon de la syntaxe et de la sémantique essentielles de Python, des types et structures de données intégrés, des définitions de fonctions, des instructions de flux de contrôle et d'autres aspects du langage.

Vous repartirez avec une base solide à partir de laquelle vous pourrez explorer la pile de données scientifiques que nous venons de décrire.


## Installation et considérations pratiques

L'installation de Python et de la suite de bibliothèques qui permettent le calcul scientifique est simple, que vous utilisiez Windows, Linux ou Mac OS X. Cette section présente quelques-unes des considérations à prendre en compte lors de la configuration de votre ordinateur.

### Installation avec conda

Bien qu'il existe plusieurs façons d'installer Python, celle que je vous suggère - en particulier si vous souhaitez utiliser les outils de science des données mentionnés ci-dessus - est la distribution multiplateforme Anaconda.
Il existe deux versions de la distribution Anaconda :

- [Miniconda](http://conda.pydata.org/miniconda.html) vous donne l'interpréteur Python lui-même, ainsi qu'un outil de ligne de commande appelé "conda" qui fonctionne comme un gestionnaire de paquets multiplateforme orienté vers les paquets Python, similaire dans son esprit aux outils "apt" ou "yum" que les utilisateurs de Linux connaissent peut-être.
- [Anaconda](https://www.continuum.io/downloads) inclut à la fois Python et ``conda``, et propose en plus une suite d'autres paquets pré-installés orientés vers le calcul scientifique.

Tous les paquets inclus dans Anaconda peuvent aussi être installés manuellement au-dessus de Miniconda ; pour cette raison, je suggère de commencer avec Miniconda.

Pour commencer, téléchargez et installez le paquetage Miniconda - assurez-vous de choisir une version avec Python 3 - et installez ensuite le package IPython notebook :
```
[~]$ conda install ipython-notebook
```
Pour plus d'informations sur ``conda``, y compris des informations sur la création et l'utilisation des environnements conda, reportez-vous à la documentation du package Miniconda dont le lien figure à la page ci-dessus.

With that, let's start our tour of the Python language.

# Tour rapide de la syntaxe du langage Python

Python a été développé à l'origine comme un langage d'enseignement, mais sa facilité d'utilisation et sa syntaxe claire l'ont fait adopter par les débutants comme par les experts.
La propreté de la syntaxe de Python a conduit certains à l'appeler "pseudocode exécutable", et il est en effet souvent beaucoup plus facile de lire et de comprendre un script Python que de lire un script similaire écrit en C, par exemple.
Ici, nous allons commencer à discuter des principales caractéristiques de la syntaxe de Python.

La syntaxe fait référence à la structure du langage (c'est-à-dire à ce qui constitue un programme correctement formé).
Pour l'instant, nous ne nous intéresserons pas à la sémantique - la signification des mots et des symboles dans la syntaxe - mais nous y reviendrons plus tard.

Considérons l'exemple de code suivant

In [None]:
# definir le point median
midpoint = 5

# creer deux listes vides
lower = []; upper = []

# diviser les nombres en supérieur et inférieur
for i in range(10):
    if (i < midpoint):
        lower.append(i)
    else:
        upper.append(i)
        
print("lower:", lower)
print("upper:", upper)

lower: [0, 1, 2, 3, 4]
upper: [5, 6, 7, 8, 9]


Ce script est un peu simpliste, mais il illustre de manière compacte plusieurs des aspects importants de la syntaxe Python.
Parcourons-le et discutons de certaines des caractéristiques syntaxiques de Python.

## Les commentaires sont marqués par ``#''.
Le script commence par un commentaire :
``` python
# définir le point médian
```
En Python, les commentaires sont indiqués par un dièse (``#``), et tout ce qui se trouve sur la ligne qui suit le dièse est ignoré par l'interpréteur.
Cela signifie, par exemple, que vous pouvez avoir des commentaires autonomes comme celui que vous venez de voir, ainsi que des commentaires en ligne qui suivent une déclaration. Par exemple :
``` python
x += 2 # abréviation de x = x + 2
```
Python ne possède pas de syntaxe pour les commentaires multi-lignes, comme la syntaxe ``/* .... */`` utilisée en C et C++, bien que les chaînes de caractères multi-lignes soient souvent utilisées pour remplacer les commentaires multi-lignes
``` python
"""
Ceci
est
un
commentaire
multi
ligne
"""
```




## La fin de ligne termine une déclaration
La ligne suivante du script est
``` python
midpoint = 5
```
Il s'agit d'une opération d'affectation, dans laquelle nous avons créé une variable nommée "midpoint" et lui avons attribué la valeur "5".
Remarquez que la fin de cette instruction est simplement marquée par la fin de la ligne.
Cela contraste avec des langages comme C et C++, où chaque instruction doit se terminer par un point-virgule (``;``).

En Python, si vous souhaitez qu'une instruction continue à la ligne suivante, il est possible d'utiliser le marqueur "``\``" pour l'indiquer :

In [None]:
x = 1 + 2 + 3 + 4 +\
    5 + 6 + 7 + 8

Il est également possible de poursuivre les expressions sur la ligne suivante entre parenthèses, sans utiliser le marqueur "````" :

In [None]:
x = (1 + 2 + 3 + 4 +
     5 + 6 + 7 + 8)

La plupart des guides de style Python recommandent la deuxième version de la continuation de ligne (entre parenthèses) à la première (utilisation du marqueur "``\``")

## Le point-virgule peut éventuellement terminer une déclaration
Il peut parfois être utile de placer plusieurs instructions sur une seule ligne.
La partie suivante du script est

``` python
lower = [] ; upper = []
```
Ceci montre comment le point-virgule (``;``) familier en C peut être utilisé optionnellement en Python pour mettre deux déclarations sur une seule ligne.
D'un point de vue fonctionnel, cela revient à écrire
```python
lower = []
upper = []
```
L'utilisation d'un point-virgule pour placer plusieurs instructions sur une seule ligne est généralement déconseillée par la plupart des guides de style Python, bien que cela s'avère parfois pratique.

## Indentation : L'espace vide est important !
Ensuite, nous passons au bloc de code principal :
```Python
for i in range(10) :
    if i < midpoint :
        lower.append(i)
    else :
        upper.append(i)
```
Il s'agit d'une instruction de flux de contrôle composée comprenant une boucle et une conditionnelle - nous nous pencherons sur ces types d'instructions ultérieurement.
Pour l'instant, considérez que ceci démontre ce qui est peut-être la caractéristique la plus controversée de la syntaxe de Python : les espaces vides sont significatifs !

Dans les langages de programmation, un *bloc* de code est un ensemble d'instructions qui doit être traité comme une unité.
En C, par exemple, les blocs de code sont désignés par des accolades :
``` C
// Code C
for(int i=0 ; i<100 ; i++)
   {
      // Les accolades indiquent le bloc de code
      total += i ;
   }
```
En Python, les blocs de code sont signalés par une *indentation* :
``` python
for i in range(100) :
    # l'indentation indique le bloc de code
    total += i
```
En Python, les blocs de code indentés sont toujours précédés de deux points (``:``) sur la ligne précédente.

L'utilisation de l'indentation permet de renforcer le style uniforme et lisible que beaucoup trouvent attrayant dans le code Python.
Mais elle peut être source de confusion pour les non-initiés ; par exemple, les deux extraits suivants produiront des résultats différents :
```python
>>> if x < 4 :         >>> if x < 4 :
...     y = x * 2      ...     y = x * 2
...     print(x)       ... print(x)
```
Dans l'extrait de gauche, ``print(x)`` est dans le bloc indenté, et ne sera exécutée que si ``x`` est inférieur à ``4``.
Dans l'extrait de droite, ``print(x)`` est en dehors du bloc, et sera exécuté quelle que soit la valeur de "x" !

L'utilisation par Python d'espaces vides significatifs est souvent surprenante pour les programmeurs habitués à d'autres langages, mais en pratique, elle peut conduire à un code beaucoup plus cohérent et lisible que les langages qui n'imposent pas l'indentation des blocs de code.

Enfin, sachez que la *quantité* d'espaces vides utilisés pour l'indentation des blocs de code est laissée à l'appréciation de l'utilisateur, pour autant qu'elle soit cohérente dans tout le script.
Par convention, la plupart des guides de style recommandent d'indenter les blocs de code de quatre espaces, et c'est la convention que nous suivrons dans ce cours.
Notez que de nombreux éditeurs de texte comme Emacs et Vim contiennent des modes Python qui effectuent automatiquement l'indentation à quatre espaces.

## Les espaces vides *à l'intérieur* des lignes n'ont pas d'importance
Si le mantra de l'espace vide significatif est vrai pour l'espace vide *avant* les lignes (qui indiquent un bloc de code), l'espace vide *dans* les lignes de code Python n'a pas d'importance.
Par exemple, les trois expressions suivantes sont équivalentes :

In [None]:
x=1+2
x = 1 + 2
x             =        1    +                2

L'abus de cette flexibilité peut entraîner des problèmes de lisibilité du code - en fait, l'abus des espaces blancs est souvent l'un des principaux moyens d'obscurcir intentionnellement le code (ce que certaines personnes font pour le plaisir).
L'utilisation efficace des espaces vides peut conduire à un code beaucoup plus lisible, 
surtout dans les cas où les opérateurs se suivent - comparez les deux expressions suivantes pour l'exponentiation par un nombre négatif :
``` python
x=10**-2
```
à
``` python
x = 10 ** -2
```
Je trouve la deuxième version avec espaces beaucoup plus lisible au premier coup d'œil.
La plupart des guides de style Python recommandent d'utiliser un seul espace autour des opérateurs binaires, et aucun espace autour des opérateurs unaires.


## Les parenthèses servent à regrouper ou à appeler.

Dans l'extrait de code précédent, nous voyons deux utilisations des parenthèses.
Tout d'abord, elles peuvent être utilisées de manière classique pour regrouper des déclarations ou des opérations mathématiques :

In [None]:
2 * (3 + 4)

14

Elles peuvent également être utilisées pour indiquer qu'une *fonction* est appelée.
Dans l'extrait suivant, la fonction "print()`` est utilisée pour afficher le contenu d'une variable.
L'appel de fonction est indiqué par une paire de parenthèses ouvrantes et fermantes, avec les *arguments* de la fonction contenus à l'intérieur :

In [None]:
print('first value:', 1)

first value: 1


In [None]:
print('second value:', 2)

second value: 2


Certaines fonctions peuvent être appelées sans aucun argument, auquel cas les parenthèses ouvrantes et fermantes doivent être utilisées pour indiquer une évaluation de fonction.
Un exemple de ceci est la méthode " Sort " pour trier des listes :

In [None]:
L = [4,2,3,1]
L.sort()
print(L)

[1, 2, 3, 4]


Les "``()``" après ``sort`` indiquent que la fonction doit être exécutée, et sont requis même si aucun argument n'est nécessaire.

## Conclusion

Ceci a été une très brève exploration des caractéristiques essentielles de la syntaxe Python ; son but est de vous donner un bon cadre de référence pour la lecture du code dans les sections suivantes.
Nous avons mentionné à plusieurs reprises les "guides de style" Python, qui peuvent aider les développeurs à écrire du code dans un style cohérent.
Le guide de style le plus largement utilisé en Python est connu sous le nom de PEP8 et peut être consulté à l'adresse https://www.python.org/dev/peps/pep-0008/.
Si vous commencez à écrire du code Python, il serait utile de le lire !
Les suggestions de style contiennent la sagesse de nombreux gourous de Python, et la plupart des suggestions vont au-delà de la simple pédanterie : ce sont des recommandations basées sur l'expérience qui peuvent aider à éviter des erreurs et des bugs subtils dans votre code.