# `numpy` (tableaux multi-dimensionnels) et `matplotlib` (visualisation 2D / 3D)

      Joseph Salmon : joseph.salmon@umontpellier.fr

Adapted from the work by 

- A. Gramfort (alexandre.gramfort@inria.fr) http://alexandre.gramfort.net/
- J.R. Johansson (robert@riken.jp) http://dml.riken.jp/~rob/

In [None]:
%matplotlib inline

**Remarque**: la commande "magique" `%matplotlib inline` peut aussi avoir de l'intérêt (à essayer donc!)  

Voir aussi:
- https://jakevdp.github.io/PythonDataScienceHandbook/01.03-magic-commands.html
- https://ipython.org/ipython-doc/3/config/extensions/autoreload.html (pour `autoreload`)
- https://ipython.readthedocs.io/en/stable/interactive/magics.html

## Introduction

* `numpy` est un module utilisé dans presque tous les projets de calcul numérique sous `Python`
   * Il fournit des structures de données performantes pour la manipulation de vecteurs, matrices et tenseurs plus généraux
   * `numpy` est écrit en `C` et en `Fortran` d'où ses performances élevées lorsque les calculs sont vectorisés, c'est-à-dire formulés comme des opérations sur des vecteurs/matrices.
  
* `matplotlib` est un module performant pour la génération de graphiques en 2D et 3D
   * syntaxe très proche de celle de Matlab
   * supporte texte et étiquettes en $\LaTeX$
   * sortie de qualité dans divers formats (.png, .pdf, .svg, .gif,etc.)
   * interface graphique intéractive pour explorer les figures

Pour utiliser `numpy` et `matplotlib` il faut commencer par les importer :

In [None]:
import numpy as np  # usual shortcut
import matplotlib.pylab as plt

## *Arrays* in `numpy`

In `numpy`, vectors, matrices and other mutli-dimensional tensors (arrays with more than 2 dimensions) are called *arrays*.


## Creating  `numpy` *arrays* 

Several possibilities are offered:

 * transform `Python` lists or n-uplets
 * use a dedicated function, such as  `arange`, `linspace`, etc.
 * load a file

### `numpy` *arrays* from lists
Use simply the `numpy.array` command:

In [None]:
# Creating a vector from a list
v = np.array([1, 3, 2, 4])
print(v)
print(type(v))

Let us visualize this vector with `matplotlib`:

In [None]:
x = np.array([0, 1, 2, 3])

fig = plt.figure()
plt.plot(x, v, 'rv--', label='v(x)')
# r for red, v for triangle, -- for dash line
plt.legend(loc='lower right')
plt.xlabel('x')
plt.ylabel('v')

plt.title('Mon titre')

plt.xlim([-1, 4])
plt.ylim([0, 5])

plt.show()  # optionnal
# fig.savefig('toto.svg')  # uncomment to save on disk

**Remarque**: on peut omettre la commande `plt.show()` lorsque la méthode `ion()` (pour  *Interaction ON*) a été appelée.
C'est le cas dans `spyder` et `pylab` (qu'on lance par exemple avec la commande `ipython --pylab` dans un terminal Linux).

###  Create matrices / 2-d `numpy` arrays from a list of lists

In [None]:
M = np.array([[1, 2], [3, 4]])
print(M)

In [None]:
M[0, 1]

Les objets `v` et `M` sont tous deux du type `ndarray` (fournis par `numpy`)

In [None]:
type(v), type(M)

`v` et `M` ne diffèrent que par leur taille, que l'on peut obtenir via la propriété `shape` :

In [None]:
v.shape  # noter qu'ici un vecteur a une dimension vide pour sa deuxième

In [None]:
n= v.shape
n[0]

In [None]:
M.shape

Pour obtenir le nombre d'éléments d'un *array* :

In [None]:
v.size

In [None]:
M.size

On peut aussi utiliser `numpy.shape` et `numpy.size`

In [None]:
np.shape(M)

Les *arrays* ont un type qu'on obtient via `dtype`:

In [None]:
print(M)
print(M.dtype)

Les types doivent être respectés lors d'assignations à des *arrays*

In [None]:
M[0,0] = "hello"

### `numpy` *arrays* dtype is fixed 

In [None]:
a = np.array([1,2,3])
a[0] = 3.2
print(a)
a.dtype

In [None]:
a = np.array([1,2,3], dtype=np.int64)
b = np.array([2,2,3], dtype=np.int64)
b = b.astype(float)
print(a / b)

On peut définir le type de manière explicite en utilisant le mot clé `dtype` en argument: 

In [None]:
M = np.array([[1, 2], [3, 4]], dtype=complex)
M

 * Other possible types `dtype` : `int`, `float`, `complex`, `bool`, `object`, etc.

 * The bit precision can be specified: `int64`, `int16`, `float128`, `complex128`.
 
See possible types here https://docs.scipy.org/doc/numpy/user/basics.types.html

###  `numpy` *arrays* deterministically generated 

#### `arange`

In [None]:
# Create a simple interval
x = np.arange(0, 10, 2) # arguments: start, stop, step
x

In [None]:
x = np.arange(-1, 1, 0.1)
x

#### `linspace` and `logspace`

In [None]:
# Attention : la fin EST inclus avec linspace
np.linspace(0, 10, 25)

In [None]:
np.linspace(0, 10, 11)

In [None]:
xx = np.linspace(-10, 10, 100)
fig = plt.figure(figsize=(5, 5))
plt.plot(xx, np.sin(xx))
plt.show()

In [None]:
print(np.logspace(0, 10, 10, base=np.e))

### <font color='red'> EXERCISE : log/exp </font>
What is the value 3.03777 corresponding to ?

In [None]:
logarray = np.logspace(1, 1000,3)
np.log(logarray)

In [None]:
(np.logspace(1, 3, num=3))

In [None]:
np.logspace?

#### `diag`

In [None]:
# une matrice diagonale
A = np.diag([1,2,3])
A [1,2] = 17
A
np.diag(A)

In [None]:
# une matrice diagonale avec décalage par rapport à la diagonale principale
np.diag([1,2,3], k=1)

In [None]:
# np.diag?
my_diag = np.array([0, 0, 0])
print(my_diag.shape)
print(M.shape)
np.diag(my_diag)
np.fill_diagonal(M, my_diag)
M

#### `diag`

Cette fonction permet (aussi!) d'extraire la diagonale ou une sous-diagonale d'un *array* :

In [None]:
print(A)
print(np.diag(A))

In [None]:
np.diag(A, -1)

#### `zeros`, `ones` et  `full`

In [None]:
np.zeros((3,), dtype=int)  # attention zeros(3,3) est FAUX
print(np.zeros((3,), dtype=int).dtype)


In [None]:
zero_mat_float = np.zeros((3,4,6))

print(zero_mat_float.dtype)
zero_mat_float.shape
zero_mat_float[1,:,:]

In [None]:
np.ones((3,)).shape

In [None]:
print(np.zeros((3,), dtype=int))
print(np.zeros((1, 3), dtype=int))
print(np.zeros((3, 1), dtype=int))

In [None]:
np.full((5, 4), 9)


### `numpy` *array* (pseudo)-randomly generated 

In [None]:
# uniform at random in [0,1] samples
np.random.rand(5,5)

In [None]:
# normal random samples
np.random.randn(5,5)  # n stands for normal here

#### Random seed
Il est utile dans certains contextes de fixer la 'graine' du générateur aléatoire.
https://fr.wikipedia.org/wiki/Graine_al%C3%A9atoire

In [None]:
np.random.rand(12)

Maintenant le résultat est toujours le même pour une même graine (en: *seed*) si on relance la cellule plusieurs fois:

In [None]:
np.random.seed(seed=33)
np.random.rand(12)

#### Histograms for random samples

In [None]:
a = np.random.randn(10000)
plt.figure(figsize=(5,2))
plt.subplot(1, 2, 1)
plt.hist(a, bins=40, density=False)
plt.title('Histogramme (effectifs)')
plt.ylabel('Effectifs')

plt.subplot(1, 2, 2)

plt.hist(a + 10, bins=40, density=True)
plt.title('Histogramme (densité)')
plt.ylabel('Densité')

plt.tight_layout() # évite certains chevauchement de noms d'axes

In [None]:
import matplotlib
matplotlib.__version__

In [None]:
fig, axes = plt.subplots(2, 1, sharex='col')

axes[0].hist(a, bins=40, density=False)
axes[0].set_ylabel('Effectifs')
axes[0].set_title('Histogramme (effectifs)')

axes[1].hist(a + 10, bins=40, density=True)
axes[1].set_ylabel('Densité')
axes[1].set_title('Histogramme (densité)')

plt.tight_layout()

##  Fichiers d'Entrées/Sorties (E/S)

### Fichiers séparés par des virgules (CSV)

Un format fichier classique est le format CSV (Comma-Separated Values).
Pour lire de tels fichiers on peut utiliser `numpy.genfromtxt`, mais on utilisera surtout le module `pandas` par la suite pour cela.

A l'aide de `numpy.savetxt` on peut enregistrer un *array* `numpy` dans un fichier txt:

In [None]:
M = np.random.rand(3,3)
print(M)
np.savetxt("random-matrix.txt", M)  # regader dans votre dossier, un nouveau fichier est apparu

In [None]:
pwd

In [None]:
MM = np.genfromtxt('random-matrix.txt') # on peut alors générer un array depuis un fichier texte
print(MM)

### `numpy` default storing format  (`.npy`)

To save and load `numpy` *arrays* : `numpy.save` et `numpy.load` :

In [None]:
np.save("random-matrix.npy", M)
!cat random-matrix.npy

In [None]:
N = np.load("random-matrix.npy")
N

## Autres propriétés des *arrays* `numpy`

In [None]:
M

In [None]:
M.dtype

In [None]:
M.itemsize # octets par élément

In [None]:
# nombre d'octets, see https://fr.wikipedia.org/wiki/Byte
np.random.randn(1000, 1000).nbytes

**Remark**: the memory foot print of an array can change with its type.

In [None]:
MM = np.random.randn(1000, 1000).astype(np.int8)
MM.nbytes

In [None]:
print("%d bytes" % (M.size * M.itemsize))

In [None]:
M.nbytes / M.size

In [None]:
M.ndim # nombre de dimensions

In [None]:
print(np.zeros((3,), dtype=int).shape)
print(np.zeros((1, 3), dtype=int).shape)
print(np.zeros((3, 1), dtype=int).shape)
print(np.zeros((3, 2, 3), dtype=int).shape)


In [None]:
print(np.zeros((3,), dtype=int).ndim)
print(np.zeros((1, 3), dtype=int).ndim)
print(np.zeros((3, 1), dtype=int).ndim)
print(np.zeros((3, 2, 3, 6), dtype=int).ndim)

## Manipulation d'*arrays*

### Indexation

In [None]:
# v est un vecteur, il n'a qu'une seule dimension -> un seul indice
v[3]

In [None]:
# M est une matrice, ou un array à 2 dimensions -> deux indices 
M[1,1]

Contenu complet :

In [None]:
M

La deuxième ligne :

In [None]:
M[:,2]

On peut aussi utiliser `:` 

In [None]:
M[1,:].shape # 2 ème ligne (indice 1)

In [None]:
M[:,1] # 2 ème colonne (indice 1)

In [None]:
print(M.shape)
print(M[1,:].shape, M[:,1].shape)

On peut assigner des nouvelles valeurs à certaines cellules :

In [None]:
M[0,0] = 1

In [None]:
M

In [None]:
# on peut aussi assigner des lignes ou des colonnes
M[1,:] = -1
M

In [None]:
M[1,:] = [1, 2, 3]
M

## *Slicing* ou accès par tranches

Le *Slicing* fait référence à la syntaxe `M[start:stop:step]` pour extraire une partie d'un *array* :

In [None]:
A = np.array([1,2,3,4,5])
A

In [None]:
A[1:3]

Les tranches sont modifiables :

In [None]:
A[1:3] = [-2,-3]
A

On peut omettre n'importe lequel des argument dans `M[start:stop:step]`:

In [None]:
A[::] # indices de début, fin, et pas avec leurs valeurs par défaut
A[:] # indices de début, fin, et pas avec leurs valeurs par défaut

In [None]:
A[::2] # pas = 2, indices de début et de fin par défaut

In [None]:
A[:3] # les trois premiers éléments

In [None]:
A[3:] # à partir de l'indice 3

In [None]:
np.arange(12)

In [None]:
M = np.arange(12).reshape(4, 3, order='F')
print(M)

In [None]:
np.reshape?

On peut utiliser des indices négatifs :

In [None]:
A = np.array([1,2,3,4,5])

In [None]:
A[-1] # le dernier élément

In [None]:
A[:-1]

In [None]:
A[-3:] # les 3 derniers éléments

### <font color='red'> EXERCISE : finite differencing </font>
Compute the finite differencing of $A$, i.e., the vector $A[k+1]-A[k]$ for $k=0, \dots,n-1$ (where $n$ is the length of A).
Remark: this is often used to perform derivatives approximations.

Le *slicing* fonctionne de façon similaire pour les *array* multi-dimensionnels

In [None]:
A = np.array([[n+m*10 for n in range(5)] for m in range(5)])
A

In [None]:
A[1:4, 1:4]  # sous-tableau

In [None]:
# sauts de trois en trois:
A[::3, ::3]

In [None]:
A

In [None]:
print(A[[0, 1, 3]])
print(A[[0, 1, 3],:])
print(A[:,[0, 1, 3]])


### <font color='red'> EXERCISE : slicing </font>

Create a $6 \times 6$ matrix where the integers from 1 to 36 are stored (in columns ordering).
Then, substitute all even number by 0, **without using a loop**.

In [None]:
np.transpose(np.arange(1,37).reshape(6,6))

In [None]:
(np.arange(1,37).reshape(6,6)).T

### Indexation avancée (*fancy indexing*)

Lorsque qu'on utilise des listes ou des *array* pour définir des tranches : 

In [None]:
row_indices = [1, 2, 3]
print(A)
print(A[row_indices])
print(A.shape)

In [None]:
print(A[[1, 2], [3, 4]])

In [None]:
A[np.ix_([1, 2], [3, 4])] = 0
print(A)

On peut aussi utiliser des masques binaires :

In [None]:
B = np.arange(5)
B

In [None]:
row_mask = np.array([True, False, True, False, False])
print(B[row_mask])
# print(B[[0,2]])

In [None]:
# ou de façon équivalente
row_mask = np.array([1,0,1,0,0], dtype=bool)
B[row_mask]

In [None]:
# ou encore
a = np.array([1, 2, 3, 4, 5])
print(a < 3)
print(a[a > 3])
print(a)

In [None]:
print(A)
print(a < 3)
print(A[:, a < 3])

## Extraction de données à partir d'*arrays* et création d'*arrays*

#### `where`

Un masque binaire peut être converti en indices de positions avec `where`

In [None]:
x = np.arange(0, 10, 0.5)
print(x)
mask = (x > 5) * (x < 7.5)
# mask = (x > 5) & (x < 7.5)
print(mask)
indices = np.where(mask)
indices

In [None]:
print(x[indices]) # équivalent à x[mask]
print(x[mask])

## Algèbre linéaire

La performance des programmes écrit en `Python/numpy` dépend de la capacité à vectoriser les calculs (les écrire comme des opérations sur des vecteurs/matrices) en évitant au maximum les boucles `for/while`.

### Opérations scalaires

On peut effectuer les opérations arithmétiques habituelles pour multiplier, additionner, soustraire et diviser des *arrays* avec/par des scalaires :

In [None]:
v1 = np.arange(0, 5)
print(v1)

In [None]:
v1 * 2

In [None]:
v1 + 2

In [None]:
plt.figure()
plt.subplot(1,2,1)
plt.plot(v1 ** 2,'g--', label='$y = x^2$')
plt.legend(loc=0)
plt.subplot(1,2,2)
plt.plot(np.sqrt(v1), 'r*-', label='$y = \sqrt{x}$')
plt.legend(loc=2)
plt.show()

### Opérations terme-à-terme sur les *arrays*

Les opérations par défaut sont des opérations **terme-à-terme** (contrairement à Matlab par exemple).

In [None]:
A = np.array([[n+m*10 for n in range(5)] for m in range(5)])
print(A)

In [None]:
A * A # multiplication terme-à-terme

### Algèbre matricielle

Comment faire des multiplications de matrices ? Deux façons :
 
 * en utilisant les fonctions `dot`; 
 * en utilisant le type `@/matmul` (pour les versions récentes de `numpy`).


In [None]:
print(np.dot(A, A))  # matrix / matrix multiplication
print(A.dot(A))  # matrix / matrix multiplication
print(A @ A) # matrix / matrix multiplication
print(A * A)  # element-wise matrix / matrix multiplication

In [None]:
v1

In [None]:
A.dot(v1) # matrix / vector multiplication

In [None]:
np.dot(v1, v1)  # vectors inner product

### Transposition : Matrices symétriques/anti-symétriques

In [None]:
S1 = (A + A.T) / 2  # la projection de A sur les matrices symétriques

In [None]:
A1 = (A - A.T) / 2  # la projection de A sur les matrices anti-symétriques
print(A1)

### Orthogonality for the trace scalar product

https://en.wikipedia.org/wiki/Inner_product_space#Real_matrices

In [None]:
print(A1 + S1)  # donne A
np.trace(S1.dot(A1))

In [None]:
print(v1)
print(v1 * v1)

### Point-wise multiplication:

En multipliant des *arrays* de tailles compatibles, on obtient des multiplications terme-à-terme par ligne :

In [None]:
A.shape, v1.size

In [None]:
print(A)
print(v1)
print(A * v1)

In [None]:
n_samples = 300
C = np.random.rand(n_samples,200)

D = np.dot(C.T,C) # mulitplication de C^T avec C : = C^T C
D = C.T@C # idem mulitplication de C^T avec C : = C^T C
D = C.T.dot(C) # idem mulitplication de C^T avec C : = C^T C


### <font color='red'> EXERCICE : Numpy ninja </font>

Sans utiliser de boucles (`for/while`)
 * <font color='red'> Créer une matrice Mat de taille $ 5 \times 4$ aléatoire</font>
 * <font color='red'> Remplacer une colonne sur deux par sa valeur moins le double de la colonne suivante (sauf la dernière). Plus précisément, si on part de Mat = [C_1, C_2, C_3, C_4] (4 colonnes) on veut créer la matrice
Mat = [C_1 - 2 C_2, C_2 - 2 C3, C_3 -2 C4, C_4]
</font>
 * <font color='red'> Remplacer les valeurs négatives par 0 en utilisant un masque binaire</font>


In [None]:
# Solution 1:
Mat = np.random.rand(5, 4)
print(Mat)
NewMat = np.zeros((5, 4))

for j in range(4-1):
    NewMat[:, j] = Mat[:, j] - 2 * Mat[:, j+1]
NewMat[:,4-1] = Mat[:,4-1]

print(NewMat)
NewMat[NewMat < 0] = 0
print(NewMat)

In [None]:
# Solution 2 (Matrice de transvection)
NewMat = Mat.copy()
for j in range(4-1):
    mat_int = np.eye(4)
    mat_int[j+1,j] = -2
    print(mat_int)
    NewMat = NewMat @ mat_int
NewMat[NewMat < 0] = 0
print(NewMat)

Voir également les fonctions : `inner`, `outer`, `cross`, `kron`, `tensordot`. Utiliser par exemple `help(kron)`.

### Transformations d'*arrays* ou de matrices

 * Plus haut `.T` a été utilisé pour transposer `v`
 * On peut aussi utiliser la fonction `transpose`

**Autres transformations :**

In [None]:
C = np.array([[1j, 2j], [3j, 4j]])
C

In [None]:
np.conj(C)  # conjuguée complexe

Transposée conjuguée :

In [None]:
C.conj().T

Parties réelles et imaginaires :

In [None]:
np.real(C) # équivalent à C.real

In [None]:
np.imag(C) # équivalent à C.imag

Argument et module :

In [None]:
np.angle(C+1) 

In [None]:
np.abs(C)

### Caclul matriciel

#### Analyse de données

`numpy` propose des fonctions pour calculer certaines statistiques des données stockées dans des *arrays* :

In [None]:
data = np.vander([1, 2, 3, 4], increasing=True)  # Matrice de Vandermonde
print(data)

#### `moyenne`

In [None]:
print(np.mean(data))
print(np.mean(data, axis=0))
print(np.mean(data, axis=1))

In [None]:
# la moyenne de la troisième colonne
np.mean(data[:,2])

### <font color='red'> EXERCICE : On-line computation  of the mean </font>
Write a recursive function computing the mean $\bar{x}_n$ (without using `np.sum`,`np.mean` etc.)

*Hint*:

\begin{align}
\bar{x}_{n} & = \frac{1}{n} \sum_{i=1}^{n}x_i \\
              & = \frac{1}{n} \left(\sum_{i=1}^{n-1} x_i  + x_{n} \right)\\
              & = \frac{1}{n} \left( (n-1) \cdot \bar{x}_{n-1}  + x_{n}\right)\\ 
              & = \frac{n-1}{n}  \cdot \bar{x}_{n-1}  + \frac{1}{n} x_{n}\\            
\end{align}

#### Variance and standard deviation

In [None]:
print(np.var(data[:, 2]), np.std(data[:, 2]))

In [None]:
# ddof : Delta Degrees of Freedom
print(np.var(data[:, 2], ddof=1), np.std(data[:, 2], ddof=1))

### <font color='red'> EXERCISE : Degrees of Freedom </font>
Explain the difference in behavior of the last two cells.
See more on this theme and on Stein's theory here: http://www.stat.cmu.edu/~larry/=sml/stein.pdf

#### min / max

In [None]:
data[:,2].min()

In [None]:
data[:,2].max()

In [None]:
data[:,2].sum()

In [None]:
data[:,2].prod()

#### `sum`, `prod`, et `trace`

In [None]:
d = np.arange(0, 10)
d

In [None]:
# somme des éléments
np.sum(d)

ou encore :

In [None]:
d.sum()

In [None]:
# produit des éléments
np.prod(d+1)

In [None]:
# somme cumulée
np.cumsum(d)

In [None]:
# produit cumulé
np.cumprod(d+1)

In [None]:
# équivalent à diag(A).sum()
np.trace(data)

### <font color='red'> EXERCICE : Wallis product (bis) </font>
Using `numpy`, and without any `for` loop, evaluate:
\begin{align}
    \text{Wallis product}\quad \pi&= 2 \cdot \prod_{n=1}^{\infty }\left({\frac{4 n^{2}}{4 n^{2} - 1}}\right)
\end{align}

### Calculs aves données multi-dimensionnelles

Pour appliquer `min`, `max`, etc., par lignes ou colonnes :

In [None]:
m = np.random.rand(3,4)
m

In [None]:
# max global 
m.max()

In [None]:
# max dans chaque colonne
m.max(axis=0)

In [None]:
# max dans chaque ligne
m.max(axis=1)

Plusieurs autres méthodes des classes `array` et `matrix` acceptent l'argument (optional) `axis` keyword argument.

## Copy et "deep copy"

Pour des raisons de performance `Python` ne copie pas automatiquement les objets (par exemple passage par référence des paramètres de fonctions).

In [None]:
A = np.array([[0,  2],[ 3,  4]])
A

In [None]:
B = A

In [None]:
# ATTENTION: changer B affecte A
B[0,0] = 10
B

In [None]:
A

In [None]:
B = A
print(B is A)

Pour éviter ce comportement, on peut demander une *copie profonde* (en: *deep copy*) de `A` dans `B`

In [None]:
B = A.copy()  # identique à B = np.copy(A)

In [None]:
# maintenant en modifiant B, A n'est plus affecté
B[0,0] = -5
B

In [None]:
A  # A n'est pas modifié cette fois!

### <font color='red'> EXERCICE :  interpréter ce qui se passe dans l'exemple ci-dessous </font>


In [None]:
print(A - A[:,0]) 
print(A - A[:,0].reshape((2, 1)))

## Changement de forme et de taille, et concaténation des *arrays*



In [None]:
A

In [None]:
n, m = A.shape

In [None]:
B = A.reshape((1, n * m))
B

In [None]:
B[0, 0:5] = 5  # modifier l'array
B

In [None]:
A

### Attention !

La variable originale est aussi modifiée ! B n'est qu'une nouvelle **vue** (view) de A.

Pour transformer un *array* multi-dimmensionel en un vecteur voici comment faire.
Cette fois-ci, une copie des données est créée (ici avec `flatten`)
https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.flatten.html

In [None]:
A = np.array([[0,  2], [3,  4]])
B = A.flatten()
print(A, B)

In [None]:
B[0:5] = 10
B

In [None]:
A # A ne change pas car B est une copie de A

### Ajouter une nouvelle dimension avec `newaxis`

Par exemple pour convertir un vecteur en une matrice ligne ou colonne :

In [None]:
v = np.array([1,2,3])

In [None]:
np.shape(v)

In [None]:
# créer une matrice à une colonne à partir du vectuer v
v[:, np.newaxis]

In [None]:
v[:, np.newaxis].shape

In [None]:
# créer une matrice à une ligne à partir du vectuer v
v[np.newaxis,:].shape

### Concaténer, répéter des *arrays*

En utilisant les fonctions `repeat`, `tile`, `vstack`, `hstack`, et `concatenate`, on peut créer des vecteurs/matrices plus grandes à partir de vecteurs/matrices plus petites :


#### `repeat` et `tile`

In [None]:
a = np.array([[1, 2], [3, 4]])
a

In [None]:
# répéter chaque élément 3 fois
np.repeat(a, 3)  # résultat 1-d

In [None]:
# on peut spécifier l'argument axis
np.repeat(a, 3, axis=1)

Pour répéter la matrice, il faut utiliser `tile`

In [None]:
# répéter la matrice 3 fois
np.tile(a, 3)

#### `concatenate`

In [None]:
b = np.array([[5, 6]])

In [None]:
np.concatenate((a, b), axis=0)

In [None]:
np.concatenate((a, b.T), axis=1)

#### `hstack` et `vstack`

In [None]:
np.vstack((a,b))

In [None]:
np.hstack((a,b.T))

## Itérer sur les éléments d'un *array*

 * Dans la mesure du possible, il faut éviter l'itération sur les éléments d'un *array* : c'est beaucoup plus lent que les opérations vectorisées
 * Mais il arrive que l'on n'ait pas le choix...

In [None]:
v = np.array([1,2,3,4])

for element in v:
    print(element)

In [None]:
M = np.array([[1, 2], [3, 4]])

for row in M:
    print("row", row)
    for element in row:
        print(element)

Pour obtenir les indices des éléments sur lesquels on itère (par exemple, pour pouvoir les modifier en même temps) on peut utiliser `enumerate` :

In [None]:
for row_idx, row in enumerate(M):
    print("row_idx", row_idx, "row", row)

    for col_idx, element in enumerate(row):
        print("col_idx", col_idx, "element", element)

        # update the matrix M: square each element
        M[row_idx, col_idx] = element ** 2

In [None]:
# chaque élément de M a maintenant été élevé au carré
M

## Utilisation d'*arrays* dans des conditions

Losqu'on s'intéresse à des conditions sur tout on une partie d'un *array*, on peut utiliser `any` ou `all` :

In [None]:
M

In [None]:
if (M > 5).any():
    print("Au moins un élément de M est plus grand que 5.")
else:
    print("Aucun élément de M n'est plus grand que 5.")

In [None]:
if (M > 5).all():
    print("Tous les éléments de M sont plus grands que 5.")
else:
    print("Il existe des éléments de M qui plus petits que 5.")

## *Type casting*

On peut créer une vue d'un autre type que l'original pour un *array*

In [None]:
M = np.array([[-1,2], [0,4]])
M.dtype

In [None]:
M2 = M.astype(float)
M2

In [None]:
M2.dtype

In [None]:
M3 = M.astype(bool)
M3

## 2D function visualisation

#### `mgrid` (meshgrid)

In [None]:
x, y = np.mgrid[0:5, 0:5] 

In [None]:
x

In [None]:
y

In [None]:
plt.figure(figsize=(6, 6))

plt.subplot(2, 2, 1)
plt.imshow(x, origin='lower')

plt.subplot(2, 2, 2)
plt.imshow(y, origin='lower')

plt.subplot(2, 2, 3)
plt.imshow(x, origin='upper')

plt.subplot(2, 2, 4)
plt.imshow(y, origin='upper')

In [None]:
xx, yy = np.mgrid[-50:50, -50:50]
plt.figure(figsize=(3, 3))
plt.imshow(np.angle(1j * yy + xx, deg=True).T,
           extent=[-50, 50, -50, 50], origin='upper')
plt.axis('on')
plt.colorbar()
plt.figure(figsize=(3, 3))
plt.imshow(np.abs(xx + 1j * yy), extent=[-50, 50, -50, 50])
plt.axis('on')
plt.colorbar()
plt.show()

In [None]:
from mpl_toolkits.mplot3d import Axes3D

fig = plt.figure(figsize=(5, 4))
ax = Axes3D(fig)
X = np.arange(-4, 4, 0.2)
Y = np.arange(-4, 4, 0.2)
X, Y = np.meshgrid(X, Y)
R = np.sqrt(X**2 + Y**2)
Z = np.sin(R)
ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='viridis')

In [None]:
C = np.random.rand(300,200)
plt.figure()
plt.imshow(C)
plt.colorbar()
plt.show()

In [None]:
plt.figure()
plt.imshow(C.T @ C)
plt.colorbar()
plt.show()

### <font color='red'> EXERCISE : Mutlivariate Gaussian distribution</font>
Draw the density of a 2D Gaussian distribution.

*Hint*: see
https://docs.scipy.org/doc/scipy-0.14.0/reference/generated/scipy.stats.multivariate_normal.html


In [None]:
### Bonus: locating a source of the code you run:
import inspect
import numpy as np
inspect.getfile(np.linalg.norm)

In [None]:
### Bonus: display the source of the code you run (2nd version)
inspect.getsourcelines(np.linalg.norm) 

In [None]:
### Bonus: locating a source of the code you run:
np.linalg.norm??

## Further reading:

* http://numpy.scipy.org
* http://scipy.github.io/old-wiki/pages/Tentative_NumPy_Tutorial.html
* http://scipy-lectures.org/ - the holly bible for advance features (e.g. sparse matrices)
* http://scipy.org/NumPy_for_Matlab_Users - guide migrating MATLAB users