# <a href="https://www.python.org/"><img src="https://upload.wikimedia.org/wikipedia/commons/thumb/f/f8/Python_logo_and_wordmark.svg/390px-Python_logo_and_wordmark.svg.png" style="max-width: 200px; display: inline" alt="Python"/></a> [pour Statistique et Science des Données](https://github.com/wikistat/Intro-Python)

# Introduction à <a href="https://www.python.org/"><img src="https://upload.wikimedia.org/wikipedia/commons/thumb/f/f8/Python_logo_and_wordmark.svg/390px-Python_logo_and_wordmark.svg.png" style="max-width: 150px; display: inline" alt="Python"/></a> pour Calcul Scientifique - Statistique

**Résumé** Présentation de pyhton, exécution de commandes interactives ou de scripts avec un IDE, utilisation d'un notebook; les types et structures élémentaires de données, les structures de contrôle, les fonctions, classes et modules. 


## 2 Utilisation de Python
Python exécute programmes ou scripts, programmes qui peuvent être pré-compilés pour plus d'efficacité. Ce langage s'exécute également à l'aide d'un interprète de commande (`IDLE`) ou {`IPython`) de manière interactive.  En situation pédagogique, c'est l'utilisation et la réalisation d'un *notebook Ipython* ou plutôt maintenant *Jupyter* qui est privilégiée à partir d'un simple navigateur.


### 2.1 Notebook *Jupyter*

Les commandes sont regroupées dans des cellules suivies de leur résultat après exécution. Ces résultats et commentaires sont  stockés dans un fichier spécifique `.ipynb` et sauvegardés. Les commandes LaTeX sont acceptées pour intégrer des formules, la mise en page est assurée par des balises HTML ou [*Markdown*](http://fr.wikipedia.org/wiki/Markdown). 

La commande de sauvegarde permet également d'extraire les seules commandes Python dans un fichier d'extension `.py`. C'est une façon simple et efficace de conserver tout l'historique d'une analyse pour en faire une présentation ou créer un tutoriel. Le notebook peut être en effet chargé  sous un autre format: page `html`, fichier `.pdf` ou diaporama.

Le projet [Jupyter](http://jupyter.org/) propose cet environnement de notebook pour beaucoup de langages (Python, Julia, Scala...) dont R. Il devient un outil indispensable pour assurer simplement la *reproductibilité* des analyses. 

Une fois le notebook ouvert, 
- Entrer des commandes Python dans une cellule,
- Cliquer sur le bouton d'exécution de la cellule.
- Ajouter une ou des cellules de commentaires et balises HTML ou [Markdown](http://fr.wikipedia.org/wiki/Markdown).
Itérer l'ajout de cellules. Une fois l'exécution terminée:
- Sauver le notebook `.ipynb` 
- Charger éventuellement une version `.html` pour une page web.
- Charger le fichier `.py` regroupant les commandes python pour une version opérationnelle.

**Attention** Un notebook de IPython ou Jupyter est un outil de travail exploratoire efficace et un compte rendu nécessairement *chronologique* d'exécution.


### 2.2 IDE  `Spyder`
Pour la réalisation d'applications et programmes plus complexes, l'usage d'un IDE (*integrated Development Environment*) libre comme [Spyder](http://code.google.com/p/spyderlib/) est recommandé. Ce dernier est intégré à la distribution `Anaconda` et sa présentation  proche de celles de Matlab ou RStudio. Cet environnement exécutant IPython reconnaît évidemment les commandes précédentes. 
 
Comme pour RStudio, `Spider` ouvre plusieurs fenêtres:
- un éditeur de commandes dont les boutons du menu exécutent tout le fichier ou interactivement la cellule courante, sauvent le fichier, contrôlent le débogage. Une cellule débute par la balise: `#%%`.
- Un explorateur d'objets avec aide en ligne, des variables en cours, du répertoire courant. Les boutons de l'explorateur de variables permettent de supprimer, sauver les objets créés ou encore d'importer des données.
- La console IPython avec les résultats et son historique.

### 2.3 Exemple

En résumé, utiliser un notebook pour des analyses exploratoires élémentaires et un IDE `Spyder`, `pycharm` ou `Eclipse` (un peu compliqué!) pour la construction de programmes et modules. 



In [None]:
# Ceci est le début d'une session Python gérée à l'aide d'un notebook.
# Le script est divisé en cellules avec généralement l'affichage d'au plus un résultat par cellule.
## Importer les librairies nécessaires 
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from pylab import *
import os 
## Définir si nécessaire le répertoire courant spécifique 
##  à l'utilisateur
os.chdir(r'.')
## Commande magique pour obtenir les graphiques dans le notebook
%matplotlib inline

In [None]:
#%% Créer un data frame avec pandas
data = pd.DataFrame({
    'Gender': ['f', 'f', 'm', 'f', 'm', 'm', 'f', 'm', 'f', 'm'],
    'TV': [3.4, 3.5, 2.6, 4.7, 4.1, 4.0, 5.1, 4.0, 3.7, 2.1]})
data

In [None]:
# Génération de variables aléatoires gaussiennes
xx = randn(100,100)
y = mean(xx,0)
# graphique
plot(y)
show()

## 3. Types de données

### 3.1 Scalaires et chaînes
La déclaration des variables est implicite ({integer, float, boolean, string), la syntaxe est très proche de celle de R mais il n'y a pas de type `factor`.

In [1]:
a=3  # est un entier
b=1. # est un flottant
# Attention:
a/2  # a pour résultat 1.5 en Python 3.4 
     # mais 1 en 2.7

1.5

Opérateurs de comparaison : `==, >, <, !=` de résultat booléen.

In [2]:
# Comparaison
a==b  

False

In [3]:
#  affichage et type des variables
type(a)

int

In [4]:
# Chaîne de caractère
a='bonjour '
b='le '
c='monde'
a+b+c

'bonjour le monde'

Attention à l'encodage des caractères. Ce n'est pas le même en python 2 (ascii) et python 3 (utf-8). Ce n'est pas fait dans ces exemples élémentaires mais il est vivement recommander de gérer systématiquement des textes complexes avec caractères spéciaux (accents, guillements...) en utf-8

In [5]:
a=u'bonjour' # encodage utf-8
type(a)

str

In [6]:
a='bonjour'  # encodage ascii
type(a)

str

### 3.2 Structures de base

#### Listes
Les listes permettent des combinaisons de types. 
**Attention**, le premier élément d'une liste ou d'un tableau est indicé par **0**, pas par 1.

In [7]:
# exemples de listes
liste_A = [0,3,2,'hi']
liste_B = [0,3,2,4,5,6,1]
liste_C = [0,3,2,'hi',[1,2,3]]    
# Elément d'une liste 
liste_A[1]

3

In [8]:
liste_C[-1] #  dernier élément

[1, 2, 3]

In [9]:
liste_C[-1][0]

1

In [10]:
liste_C[-2]

'hi'

In [None]:
liste_B[0:2] #  Sous-liste

In [None]:
liste_B[0:5:2]  # début:fin:pas

In [None]:
liste_B[::-1]

In [None]:
# Fonctions de listes
List=[3,2,4,1]
List.sort() 
print(List)

In [None]:
List.append('hi')
print(List)

In [None]:
List.count(3) 

In [None]:
List.extend([7,8,9])
print(List)

In [None]:
List.append([10,11,12])
print(List)

#### t-uple
Un tuple est similaire à une liste mais ne peut être modifié, il est défini par des parenthèses.

In [None]:
MyTuple=(0,3,2,'h')
MyTuple[1]

In [None]:
MyTuple[1]=10 # TypeError: "tuple" object

#### Dictionnaire
Un dictionnaire est similaire à une liste mais chaque entrée est assignée par une clé / un nom, il est défini avec des accolades. Cet objet est utilisé pour la construction de l'index des colonnes (variables) du type *DataFrame* de la librairie `pandas`.


In [None]:
months = {'Jan':31 , 'Fev': 28, 'Mar':31}
months['Jan'] 	

In [None]:
months.keys()

In [None]:
months.values()

In [None]:
months.items()

## 4. Syntaxe de Python

### 4.1 Structures de contrôle élémentaires
Un bloc de commandes ou de codes est défini par *deux points suivis d'une indentation fixe*.  Cela oblige à l'écriture de codes faciles à lire mais à être très attentif sur la gestion des indentations car la fin d'indentation signifie la fin d'un bloc de commandes.

#### Structure conditionnelle

In [None]:
# si alors sinon
a=2
if a>0:
    b=0
    print(b)
else:
    b=-1
print(b)

#### Structure itérative

In [None]:
for i in range(4):
    print(i)

In [None]:
for i in range(1,8,2):
    print(i)

In [None]:
# Définition d'une fonction
def pythagorus(x,y):
    """ Calcule l'hypotenuse d'un triangle """
    r = pow(x**2+y**2,0.5)
    return x,y,r
pythagorus(3,4)

### 4.2 Fonctions

In [None]:
# exemple d'appel
pythagorus(x=3,y=4)

In [None]:
# aide intégrée
help(pythagorus)

In [None]:
pythagorus.__doc__

In [None]:
# Valeurs des paramètres par défaut
def pythagorus(x=1,y=1):
    """ calcule l'hypoténuse d'un triangle """
    r = pow(x**2+y**2,0.5)
    return x,y,r
pythagorus()

### 4.4 Modules et librairies
#### Modules 
Un module contient plusieurs fonctions et commandes qui sont regroupées dans un fichier d'extension `.py`. Insérer un fichier vide de nom `_init_.py` dans chaque dossier et sous-dossier contenant un module à importer.  Un module est appelé par la commande `import`. Un module est considéré comme un script s'il contient des commandes. Lors de l'import d'un script, les commandes sont exécutées tandis que les fonctions sont seulement chargées.

Commencer par définir un module dans un fichier texte contenant les commandes suivantes.

``
def DitBonjour():
    print("Bonjour")
def DivBy2(x):
    return x/2
``

Sauver le fichier avec pour nom `testM.py` dans le répertoire courant.

Il est possible d'importer toutes les fonctions en une seule commande `import`. 


In [None]:
import testM
testM.DitBonjour()

In [None]:
print(testM.DivBy2(10))

In [None]:
from testM import *
DitBonjour()

In [None]:
print(DivBy2(10))

Ou seulement celles qui seront utilisées. Préférer cette dernière méthode pour les grosses librairies.

In [None]:
import testM as tm
tm.DitBonjour()

In [None]:
print(tm.DivBy2(10))
# délétion des objets
%reset 

In [None]:
from testM import DitBonjour
DitBonjour()

In [None]:
print(DivBy2(10)) # erreur

Lors de son premier appel, un module est pré-compilé dans un fichier `.pyc` qui est utilisé pour les appels suivants. **Attention**, si le fichier a été modifié / corrigé, il a besoin d'être rechargé par la commande `reload(name)`.

Une librairie (*package*) regroupe plusieurs modules dans différents sous-répertoires. Le chargement spécifique d'un des modules se fait en précisant le chemin. 
`import sound.effects.echo`

## Références

**Mac Kinney W.** (2013). *Python for Data Analysis*, O’Reilly. [pdf](http://it-ebooks.info/book/104)

**Sheppard K.** (2014). *Introduction to Python for Econometrics, Statistics and Data Analysis*, [pdf](https://www.kevinsheppard.com/images/0/09/Python_introduction.pdf)

**Wikistat** (2019) *La syntaxe, les objects et classes de Pyhton. Initiation au langage.* [notebook](https://github.com/wikistat/Intro-Python/blob/master/Cal1-introPython.ipynb)