# Calcul scientifique avec Python

<img src="images/matplotlib_numpy_scipy.png">

<img src="images/python_numpy.png">

In [None]:
import numpy as np
%load_ext memory_profiler

In [None]:
%conda install memory_profiler

# Introduction

## Création d'un conteneur de 10 000 000 de valeurs et incrémentation

In [None]:
liste1 = range(10000000)
liste2 = [i+1 for i in liste1]

In [None]:
liste1 = range(10000000)
liste2 = map(lambda i: i+1, liste1)

In [None]:
tableau1 = np.arange(10000000)
tableau2 = tableau1 + 1

## Quelle solution choisir ?

Pour le déceler, nous allons utiliser des commandes magiques de ipython `%lsmagic` pour toutes les connaîtres ou presque ;)

un seul `%` n'applique la commande que sur une seule ligne
un double `%%` applique la commande sur la cellule entière

Nous utiliserons les commandes :
 - `%%time` : pour connaître le temps d'une seule exécution de la cellule
 - `%%timeit` : pour connaître le temps moyen et sa variabilité de l'exécution de la cellule
 - `%%memit` : pour conaître l'emprise mémoire

### Programmation basique

In [None]:
%%time
liste1 = range(10000000)
liste2 = [i+1 for i in liste1]

In [None]:
%%timeit
liste1 = range(10000000)
liste2 = [i+1 for i in liste1]

In [None]:
%memit
liste1 = range(10000000)
liste2 = [i+1 for i in liste1]

### Fonctions avancées

In [None]:
%%timeit
liste1 = range(10000000)
liste2 = map(lambda i: i+1, liste1)

In [None]:
%%memit
liste1 = range(10000000)
liste2 = map(lambda i: i+1, liste1)

### Numpy

In [None]:
%%timeit
tableau1 = np.arange(10000000)
tableau2 = tableau1 + 1

In [None]:
%%memit
tableau1 = np.arange(10000000)
tableau2 = tableau1 + 1

# Manipulation des données

Prenons l'exemple du calcul d'une norme
<center>
$cst1 = 3$<br/>
$cst2 = 4$<br/>
$\sqrt{cst1 + cst2} = 5$
<\center>

In [None]:
import math

cst1 = 3; cst2 = 4
math.sqrt(cst1**2 + cst2**2)

## Peut-on travailler directement sur un conteneur Numpy

In [None]:
# un autre exemple de calcul de norme
cst1 = 10**10
cst2 = 10**10
math.sqrt(cst1**2 + cst2**2)

## Le module `Scipy`

In [None]:
from scipy import linalg

mat_np = np.array([cst1, cst2])
linalg.norm(mat_np, 2)

# Les sous-modules du modules Scipy

In [1]:
%%html
<iframe width='100%' height='350' src="https://docs.scipy.org/doc/scipy/reference/tutorial/index.html"></iframe>

# Qu'est ce que Numpy ?

- Historique :
    - 1995 : Initialement `Numeric`
    - 2006 : NUmpy remplace `Numeric`
    => Développé par : Travis Oliphant
- Module Python pour manipuler des tableaux et matrices
- Contient des routines numpy :
    - Création de tableaux
    - Manipulation de tableaux
- Contient des sous-modules :
    - fft
    - random
    - linalg
    - ...

# Qu'est ce que Scipy

- Un ensemble de bibliothèques Python destinée au calcul scientifique. Il est basé sur Numpy.
- Collection d'algorithme mathématiques
- Objectif : proposer un environnement similaire à Matlab ou Scilab
- Intégre les objets tableau et matrice du module Numpy

# Aide sur les modules

In [None]:
help(np.array)

In [None]:
help(linalg)

# Quelques commandes intéressantes
## inspecter la liste des variables

In [None]:
whos

## Vider l'espace de nom

In [None]:
%reset

## permettre de disposer des graphiques au sein du notebook

In [None]:
%matplotlib inline

## Ecrire puis exécuter un script depuis le notebook

In [None]:
%%writefile exemple.py
#!/usr/bin/env/ python3
# -*- coding: utf-8 -*-
"""
Created on %(date)s

@author: %(username)s
"""
print('hello world')

In [None]:
%run exemple.py

## l'aide de python et l'aide d'ipython est légèrement différente

In [None]:
# aide ipython
len?

In [None]:
# aide python
help(len)

## les commandes shell

Bien qu'on puisse tout faire en python, en ipython, nous pouvons utiliser les commandes shell préfixées du `!`

In [None]:
import sys

if sys.platform.startswith('win'):
    # sous Windows
    !dir
    print('-------------------')
    !dir data
    print('-------------------')
    !echo %cd%
else:
    # sous Unix
    !ls
    print('-------------------')
    !ls data
    print('-------------------')
    !pwd

In [None]:
# sous windows
!type exemple.py

# sous Unix
# !cat exemple.py

La liste complète peut être obtenu en demandant l'aide :smile:

In [None]:
?

## revenons aux commandes magiques
afficher l'historique des commandes

In [None]:
%hist

## afficher l'entrée de la cellule exécutée en numéro 2

In [None]:
_ih[14]

In [None]:
print(In[14])

In [None]:
print(Out[14])

In [2]:
%%html
<iframe width='100%' height='350' src="https://jakevdp.github.io/PythonDataScienceHandbook/01.04-input-output-history.html"></iframe>

## un petit clin d'oeil à R

[documentation](https://github.com/IRkernel/IRkernel)  
Après une installation de classique de `R`puis  
`conda install rpy2`  
`conda install -c r r-irkernel`

https://irkernel.github.io/installation/

In [None]:
%load_ext rpy2.ipython

In [None]:
# installation à partir du module rpy2
from rpy2.robjects.packages import importr
utils = importr('utils')
utils.install_packages('ggplot2', repos="https://cloud.r-project.org")

In [None]:
%%R
# dependencies
library(ggplot2)
library(tibble)

# load data from files
nt <- 5
np <- 10
res_red <- matrix(scan("./data/dice_res_red.txt"), nrow=nt, byrow=TRUE)
res_green <- matrix(scan("./data/dice_res_green.txt"), nrow=nt, byrow=TRUE)
res_blue <- matrix(scan("./data/dice_res_blue.txt"), nrow=nt, byrow=TRUE)

m.red <- round(apply(res_red, 2, mean), digits=1)
m.green <- round(apply(res_green, 2, mean), digits=1)
m.blue <- round(apply(res_blue, 2, mean), digits=1)

set.seed(1)
df <- tibble(obs = c(m.red, m.green, m.blue),
             gp = factor(c(rep("Red", np),
                           rep("Green", np),
                           rep("Blue", np)))
             )

# preserve factor order
df$gp <- as.character(df$gp)
df$gp <- factor(df$gp, levels=unique(df$gp))

print(ggplot(df, aes(gp, obs)) + theme_linedraw() +
      geom_point(aes(colour = gp), position = position_jitter(width = 0.1)) +
        scale_color_manual(values=c("red", "green4", "blue")) +
        theme(legend.position = "none",
      axis.text = element_text(size = 14),
      axis.title = element_text(size = 16)) +
        labs(x = "Groups", y = "Observations") +   
        coord_cartesian(ylim = c(0, 12)) +
        scale_y_continuous(breaks = seq(0, 12, 2)) +
        geom_errorbar(stat = "summary", fun.y = mean, fun.ymin = mean,
                      fun.ymax = mean, colour = "grey", width = .55, size = 3) +
        geom_errorbar(stat = "summary", fun.y = mean, fun.ymin = mean,
      fun.ymax = mean, colour = "black", width = .5, size = 1))