<div class="licence">
<span>Licence CC BY-NC-ND</span>
<span>Thierry Parmentelat</span>
</div>

In [None]:
from plan import plan_extras; plan_extras("numpy", "supérieures")

# numpy - dimensions > 1

In [None]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
plt.ion()

# conventions sur les indices des dimension

## dimension 2: **lignes** x **colonnes**

In [None]:
np.zeros( (4, 8 ))

## dimension 3: **plans** x **lignes** x **colonnes**

In [None]:
np.ones( (2, 4, 8))

## en dimensions supérieures

* les deux derniers éléments de la dimension
* correspondent toujours aux lignes et colonnes

In [None]:
np.zeros( (2, 1, 4, 5))

# résumé attributs

In [None]:
x = np.zeros( (3, 5, 7), dtype=np.float64)


| *attribut* | *signification* | *exemple* | 
|------------|-----------------|-----------|
| `shape` | tuple des longueurs | `(3, 5, 7)` |
| `ndim` | nombre dimensions  | `3` | 
| `size` | nombre d'éléments | `3*5*7` |
| `dtype` | type de chaque élément | `np.float64` |
| `itemsize` | taille en octets d'un élément | `8` |

# changement de forme

## `reshape`

Avec `reshape`, on peut

* changer de forme
* en fait on crée une **vue**
* sur les mêmes données
* les deux tableaux **partagent** les données

In [None]:
# profitons-en pour utiliser numpy.random
# et notamment `random_sample`
# qui renvoie des flottants dans `[0..1]`
x = np.random.random_sample(15); print(x)

### exercice

* que vaut `x.shape` ?

## `reshape` et partage

y est une vue sur les mêmes données que x

In [None]:
y = x.reshape( (3, 5)); 

In [None]:
# mais avec une autre géométrie
x.shape

In [None]:
y.shape

* les deux `array` **partagent les données** sous-jacentes
* on y reviendra

In [None]:
x[0]=0.; y

* chaque tableau accès aux données via sa propre géométrie

In [None]:
y.shape

In [None]:
y[1, 0] = 1.; x

Évidemment il faut que la nouvelle forme convienne

In [None]:
try : x.reshape( (3, 6))
except Exception as e: print("OOPS", e)

## `ravel`

La fonction `ravel` permet d'*aplatir* n'importe quel tableau

In [None]:
a = np.random.random_sample( (2, 3, 4)); print (a)

In [None]:
print(np.ravel(a))

In [None]:
# pour tout array ceci est vrai
all(np.ravel(a) == a.reshape( (a.size,)))

### impression avec `print()`

vous remarquerez que l'impression de gros tableaux montre les coins en tronquant le reste

In [None]:
big = np.arange(10**6).reshape( (100, 100, 100))
print(big)

### produits cartésiens et similaires

* pour créer des tableaux sans passer par reshape, exemples
* une image contenant un cercle
* un tableau contenant 10*i + j
* une grille en dimension 2
  * pour plotter une fonction (x, y) -> z
* le broadcasting (vu plus loin) est aussi pertinent

## `indices`

imaginez une construction du genre de

```
a = np.empty( (n, m))
for i in range(n):
   for j in range(m):
      a[i, j] = fonction(i, j)
```

ce qui nous rappelle un peu en python 'natif' des boucles comme

```
for i in range(len(liste)):
    item = liste[i]
    une_fonction(item, i)
```

dont on a dit qu'il était préférable de faire plutôt:

```
for i, item in enumerate(liste):
    une_fonction(item, i)    
```

`np.indices` joue - un peu - le même rôle que `enumerate` à cet égard:

* `indices( (2, 3) )` renvoie 2 tableaux (parce que dimension 2)
* chacun de dimension `(2, 3)`
* le premier contient l'indice en X et le second l'indice en Y

In [None]:
ix, iy = np.indices((2, 3))
for i in range(2):
    for j in range(3):
        print("{} x {} -> X: {} Y: {}"
              .format(i, j, ix[i, j], iy[i, j]))

In [None]:
N = 128
ix, iy = np.indices( (N, N))
image = ix**2 + iy**2
plt.imshow(image);

## `ix_` - produit cartésien

* la fonction `ix_` 
 * réalise une sorte de produit cartésien économique
* en renvoyant des tableaux dans une seule direction
* qu'on peut ensuite combiner par broadcasting
* on reverra tout ça en détail

In [None]:
# un exemple en dimension 2
lines = np.arange(3)
print(lines)

In [None]:
# pour l'instant c'est en dimension 1
columns = np.arange(5)
print(columns)

In [None]:
# avec ix_ on retourne deux tableaux
# le premier c'est les lignes
X, Y = np.ix_(lines, columns)
print(X)

In [None]:
# et le deuxieme les colonnes
print(Y)

In [None]:
# la magie du broadcasting !
X * 10 **Y

## `meshgrid`


* la fonction `meshgrid` 
* fait directement un produit cartésien
* en plusieurs dimensions

In [None]:
np.meshgrid?

In [None]:
nx = np.linspace(0, 1, 3)
ny = np.linspace(10, 11, 3)

In [None]:
# 
xi, yi = np.meshgrid(nx, ny)

In [None]:
xi

In [None]:
yi

utile par exemple pour

* calculer une grille de coordonnées (x, y)
* appliquer une fonction
* pour la [représenter en 3d avec `mplot3d`](http://matplotlib.org/mpl_toolkits/mplot3d/tutorial.html)

tp ?

# exercices 

* circles
  * centrer la figure
  * ajouter des rayures
* distributions
  * génération d'une distribution uniforme / normale en 2d
* by-the-tens
  * création de tableaux où tab[i, j] = f(i, j)
  * en utilisant plusieurs méthodes
* dice
  * énumérer les tirages de 3 ou 4 dés
  * calculer les probabilités de chacun

# indexation simple

* indexation simple
  * lorsque les **indices** sont des **entiers**
* on peut aussi utiliser
  * .. un ou des **tableaux** comme indices
  * mais nous verrons cela plus tard

In [None]:
n = 5
a = np.arange(n*n).reshape( (n, n)); print(a)

In [None]:
# avec un seul index on obtient naturellement une ligne
a[0]

In [None]:
# qu'on peut a nouveau indexer
a[0][2]

In [None]:
# ou plus simplement indexer par un tuple
a[0, 2]

In [None]:
# On peut affecter des indices individuellement naturellement
a[0][1] = 101
a[0, 2] = 102
print(a)

In [None]:
# Ou toute une ligne
a[2] = np.arange(200, 205); print(a)

# slicing

In [None]:
# Grâce au slicing on peut aussi changer toute une colonne
a[:, 3] = range(300, 305); print(a)

In [None]:
# on pourrait aussi écrire a[1:6:3, :] = ...
a[1:6:3] = np.arange(400, 410).reshape(2, 5); print(a)

le slicing peut servir à extraire des blocs compacts:

In [None]:
b = np.arange(100).reshape(10, 10); print(b)

In [None]:
# un bloc au hasard dans b
print(b[2:5, 6:9])

In [None]:
c = 1000 + np.arange(49).reshape(7, 7); print(c)

In [None]:
# on remplace un bloc de c avec un bloc de même taille de b
c[1:4, 2:5] = b[2:5, 6:9]; print(c)

In [None]:
c = 1000 + np.arange(49).reshape(7, 7); print(c)

In [None]:
# les blocs de départ ou d'arrivée peuvent ne pas être compacts
c[::3, ::3] = b[2:5, 6:9]; print(c)

## différences majeures avec python natif

* la taille d'un objet numpy est par définition constante
  * on ne peut pas le déformer avec du slicing
* une slice sur un objet numpy renvoie une **vue**
  * c'est à dire qu'il y a partage

### slicing et tailles  

* les types de base python (ici: listes)
  * sont élastiques
  * et peuvent changer de taille lors du slicing
* ce n'est pas le cas avec numpy
  * la taille de l'objet reste fixe
  * logique par rapport aux objectifs de performance

In [None]:
liste = list(range(6))
print("avant: {}".format(len(liste)))
liste[2:4] = range(10, 15)
print("après: {}".format(len(liste)))
liste

* bien entendu c'est différent avec les arrays numpy
* il faut que la géométrie soit préservée

In [None]:
a = np.zeros( (4, 4))
# on peut remplacer une zone carrée de 1 x 1 par une zone de la même taille
a[ 2:3, 2:3] = np.ones( (1, 1))
print(a)

In [None]:
# mais si ça ne colle pas en terme de taille, boom !
try: a[ 2:3, 2:3] = np.ones( (1, 2))
except Exception as e: print("OOPS", e)

### slicing et partage

**ATTENTION** à cette embûche possible avec les slices

In [None]:
l1 = [1, 2, 3]
# la slice l2 est 
# une **shallow copie**
l2 = l1[:2]
# on peut modifier l2
# sans toucher l1
l2[1] = 5
print('l1', l1)
print('l2', l2)

In [None]:
a1 = np.array([1, 2, 3])
# la slice a2 est 
# **une vue**
a2 = a1[:2]
# du coup il y a partage !!
a2[1] = 5
print('a1', a1)
print('a2', a2)

# broadcasting

lorsqu'on a vu la programmation vectorielle, on a vu

* tableau et tableau (mêmes tailles)
* tableau et scalaire

en fait le broadcasting est ce qui permet 

* d'unifier le sens de ces deux opérations
* et de donner du sens à des cas intermédiaires.

voir notebook optionnel

## exemples en 2d

### broadcasting (3, 5) et (1)

In [None]:
a = 100 * np.ones((3, 5), dtype=np.int32); print(a)

In [None]:
b = 3; print(b)

***

In [None]:
c = a + b; print(c)

In [None]:
print(c - a)

### broadcasting (3, 5) et (5)

In [None]:
print(a)

In [None]:
b = np.arange(1, 6); print(b)

****

In [None]:
c = a + b; print(c)

In [None]:
print(c - a)

### broadcasting (3, 5) et (1, 5)

In [None]:
print(a)

In [None]:
b = np.arange(1, 6).reshape(1, 5); print(b)

***

In [None]:
c = a + b; print(c)

In [None]:
print(c - a)

### broadcasting (3, 5) et (3, 1)

In [None]:
print(a)

In [None]:
b = np.arange(1, 4).reshape(3, 1); print(b)

****

In [None]:
c = a + b; print(c)

In [None]:
print(c - a)

### broadcasting (3, 1) et (1, 5)

In [None]:
col = np.arange(3)[:, np.newaxis]; print(col)

In [None]:
line = np.arange(5); print(line)

****

In [None]:
m = 100*(line+1) + col; print(m)

* Remarquer qu'ici les **deux** entrées ont été étirées
* pour atteindre une dimension commune

## broadcasting - dimensions supérieures

exemples de dimensions compatibles

```
A   (2d array):  15 x 3 x 5
B   (scalaire):           1
Res (2d array):  15 x 3 x 5
```

```
A   (3d array):  15 x 3 x 5
B   (3d array):  15 x 1 x 5
Res (3d array):  15 x 3 x 5
```

```
A   (3d array):  15 x 3 x 5
B   (2d array):       3 x 5
Res (3d array):  15 x 3 x 5
```

```
A   (3d array):  15 x 3 x 5
B   (2d array):       3 x 1
Res (3d array):  15 x 3 x 5
```

exemples de dimensions **non compatibles**

```
A   (1d array):  3
B   (1d array):  4 
```

```
A      (2d array):      2 x 1
B      (3d array):  8 x 4 x 3 
```

* on ne peut broadcaster que de **1** vers n
* si $p>1$ divise n, on ne **peut pas** broadcaster de p vers n 

# slicing & broadcasting

### slicing & broadcasting (3,5) vs (1)

In [None]:
a = 10 * np.ones((5, 7), dtype=np.int32); print(a)

In [None]:
b = 3; print(b)

***

In [None]:
a[::2, ::2] = b; print(a)

In [None]:
print(a[::2, ::2])

### slicing & broadcasting ctd

In [None]:
a = 10 * np.ones((5, 7), dtype=np.int32); print(a)

In [None]:
b = np.arange(1, 5); print(b)

****

In [None]:
a[::2, ::2] = b; print(a)

In [None]:
print(a[::2, ::2])

### slicing & broadcasting ctd

In [None]:
a = 10 * np.ones((5, 7), dtype=np.int32); print(a)

In [None]:
b = np.array([[1], [2], [3]]); print(b)

***

In [None]:
a[::2, ::2] = b; print(a)

In [None]:
print(a[::2, ::2])

### exercice

implémenter `indices` à base de `arange`, slicing & broadcasting.

# références croisées, shallow et deep copies

avec les tableaux numpy

* les mêmes caractéristiques qu'avec python natif
* il est important de savoir quand les données sont partagées entre 2 arrays

## partage complet

devrait être évident, mais ça va mieux en le redisant:

* l'affectation
* le passage de paramètres

ne créent pas de copie.

In [None]:
a = np.arange(12)
b = a
a is b

In [None]:
print("avant", b.shape)
a.shape = (3, 4)
print("après", b.shape)

In [None]:
def foo(x):
    x[1, 1] = 20

foo(a)
print(b)

## *shallow* copie / views

* plusieurs instances de `np.array` peuvent partager les mêmes données.
* on a déjà vu un exemple avec `reshape`

In [None]:
print(b)

In [None]:
c = a.reshape(6, 2)
c[1, 1] = 100
print(b)

l'objet `view` permet de créer un nouvel objet `array` qui partage les données

In [None]:
v = a.view()
v is a

In [None]:
v.base is a

In [None]:
v.shape = (12,)
v[11] = 1000
a

* le slicing crée **une vue**
* c'est comme cela qu'on peut **modifier un tableau** au travers d'une slice

In [None]:
print(a)

In [None]:
# on crée s une vue sur (un morceau de) a
s = a[:, 1:3]
# s[:] est une vue sur s
s[:] = 2000

print(a)

## *deep* copie

* la fonction [`np.copy`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.copy.html)
* permet de faire une copie complète

# *stacking*

* jusqu'ici on a vu des fonctions qui préservent la taille
* le stacking permet de créer un tableau plus grand
* en (juxta/super)posant plusieurs tableaux

### compatibilité

il faut en général que

* toutes les dimensions soient égales
* sauf celle dans laquelle se fait le collage
* exemple simple en 2d
  * deux tableaux avec autant de colonnes l'un que l'autre
  * donnent un tableau avec l1 + l2 lignes

### `hstack` et `vstack`

In [None]:
a = np.arange(1, 7).reshape(2, 3); print(a)

In [None]:
b = 10 * np.arange(1, 7).reshape(2, 3); print(b)

In [None]:
print(np.hstack( (a, b)))

In [None]:
print(np.vstack ((a, b)))

## vertical stacking

* Vertical = line = **premier** indice 
* les autres dimensions doivent être égales

In [None]:
a = np.ones( (2, 3, 5)); print(a)

In [None]:
b = np.zeros( (1, 3 , 5)); print(b)

In [None]:
print(np.vstack((a, b)))

## horizontal stacking

* horizontal = colonnes = deuxième indice
* à nouveau les autres dimensions doivent être égales

In [None]:
a = np.ones( (2, 3, 5)); print(a)

In [None]:
b = np.zeros( (2, 1 , 5)); print(b)

In [None]:
print(np.hstack((a, b)))

## autres dimensions

* avec concatenate, on peut faire `hstack` et `vstack` et autres
* `vstack`: axis = 0
* `hstack`: axis = 1

In [None]:
a = np.ones( (2, 3, 4)); print(a)

In [None]:
b = np.zeros( (2, 3, 2)); print(b)

In [None]:
print(np.concatenate( (a, b), axis = 2))

Pour conclure:

* `hstack` et `vstack` utiles sur des tableaux 2D
* au-delà, préférez `concatenate` qui a une sémantique plus claire

## `newaxis`

* `newaxis` est une astuce qui permet de 'décaler' les dimensions
* s'utilise dans un slice
* utile notamment dans ces opérations de stacking
* mais pas seulement

* Si par exemple `A` a pour dimension `(a, b)`
* `A[:, newaxis, :]` a pour dimension `(a, 1, b)`

In [None]:
from numpy import newaxis

In [None]:
line = np.arange(3); print(line)

In [None]:
column = line[:, newaxis]; print(column)

In [None]:
tableau = np.arange(6).reshape(2, 3); print(tableau)

In [None]:
print(tableau)

In [None]:
espace = tableau[newaxis, :, newaxis, :]; print(espace)

In [None]:
espace.shape

## `np.tile`

Cette fonction permet de répéter un tableau dans toutes les directions

In [None]:
motif = np.array([[0, 10], [20, 100]])
print(motif)

In [None]:
print(np.tile(motif, (2, 4)))

Le nombre de répétitions n'est pas forcément de la dimension de l'entrée

In [None]:
# un motif de dimension 2 
print(motif)

In [None]:
# peut être répété en dimension 1
print(np.tile(motif, 3))

In [None]:
# ou 3
print(np.tile(motif, (2, 2, 5)))

# splitting

* Opération inverse du stacking
* Consiste à découper un tableau en parties plus ou moins égales

In [None]:
complet = np.arange(24).reshape(4, 6); print(complet)

In [None]:
h1, h2 = np.hsplit(complet, 2)
print(h1)

In [None]:
print(h2)

In [None]:
complet = np.arange(24).reshape(4, 6); print(complet)

In [None]:
v1, v2 = np.vsplit(complet, 2)
print(v1)

In [None]:
print(v2)

Pour les dimensions supérieures

  * [`np.array_split`](https://docs.scipy.org/doc/numpy/reference/generated/numpy.array_split.html#numpy.array_split)
  * permet de préciser la dimension
  * un peu comme `np.concatenate` pour le stacking

# indexation - revisitée

* On peut indexer un tableau A .. par un tableau
* le tableau d'indexes doit contenir des entiers
* tous plus petits que la première dimension de A

## le cas simple: entrée et index de dim. 1

In [None]:
cubes = np.arange(10) ** 3; print(cubes)

In [None]:
# un index qui est une liste python
i = [ 1, 7, 5, 2]
print(cubes[i])

In [None]:
# ou un tableau numpy
i = np.array([3, 2])
print(cubes[i])

## de manière générale

le résultat de `A[index]`

* a la même forme que `index`
* où on a remplacé `i` par `A[i]`
* qui peut donc être un tableau si `A` est de dimension > 1

In [None]:
A = np.array([ [0, 'zero'], [1, 'un'], [2, 'deux'], [3, 'trois']]); print(A)

In [None]:
index = np.array([[0, 1, 2], [1, 2, 0]]); print(index)

In [None]:
print(A[index])

et donc si 

* `index` est de dimension `(i, j, k)` 
* et `a` est  de dimension `(a, b)`
* le résultat est de dimension `(i, j, k, b)`
* il faut que les éléments dans `index` soient dans `[0 .. a[`

In [None]:
# l'entrée
print(A.shape)

In [None]:
# l'index
print(index.shape)

In [None]:
# le résultat
print(A[index].shape)

## entrée de dim. 1, index de dim. > 1

* lorsque l'entrée `A` est de dimension 1
* alors la sortie a **exactement** la même forme que l'index
* c'est comme si `A` était une fonction 
* qu'on applique aux indices dans index

In [None]:
print(cubes)

In [None]:
i2 = np.array( [ [2, 4], [8, 9]])
print(i2)

In [None]:
print(cubes[i2])

### application 1

application au codage des couleurs dans une image

In [None]:
N = 32
colors = 6
image = np.empty((N, N), dtype = np.int32)
for i in range(N):
    for j in range(N):
       image[i, j] = (i+j) % colors

In [None]:
plt.imshow(image)

**remarque**:

* comme pour les boucles du genre 
  `for i in range(len(tableau))`

* cela n'est pas très élégant (on va voir tout de suite comment améliorer)

**exercice**:

* notre préoccupation: les couleurs sont non significatives
* notre image contient des entiers dans `range(colors)`
* on voudrait pouvoir choisir la vraie couleur correspondant à chaque valeur

In [None]:
# une palette de couleurs
palette = np.array([
  [255, 255, 255], # 0 -> blanc
  [255, 0, 0],     # 1 -> rouge
  [0, 255, 0],     # 2 -> vert
  [0, 0, 255],     # 3 -> bleu
  [0, 255, 255],   # 4 -> cyan
  [255, 255, 0],   # 5 -> magenta
 ], dtype=np.uint8)

In [None]:
plt.imshow(palette[image]);

In [None]:
image.shape

In [None]:
palette[image].shape

## généralisation: indices multiples

* lorsque `index1` et `index2` ont la même forme
* on peut écrire `A[index1, index2]`
* qui a la même forme que les `index`
* où on a remplacé `i, j` par `A[i][j]`
* qui peut donc être un tableau si `A` est de dimension > 2

In [None]:
ix, iy = np.indices((4, 3))
A = 10 * ix + iy
print(A)

In [None]:
index1 = [ [3, 2], [0, 1 ]]  # doivent être <4
index2 = [ [2, 0], [0, 2 ]]  # doivent être <3
print(A[index1, index2])

et donc si

* `index1` et `index2` sont de dimension `(i, j, k)` 
* et `a` est  de dimension `(a, b, c)`
* le résultat est de dimension `(i, j, k, c)`
* il faut alors que les éléments  de `index1` soient dans `[0 .. a[` 
* et les éléments de `index2` dans `[0 .. b[`

## avec slices

* on peut combiner cela avec des slices
* typiquement juste `:`

In [None]:
print(A)

In [None]:
print(A[:, [0, 2]])

In [None]:
print(A[ [0, 2], :])

In [None]:
# ce genre d'expression peut servir à affecter
A[ [0, 2], :] = 1000
print(A)

In [None]:
# ou avec broadcast
A[ [1, 2], :] = np.array([1, 2])[:, newaxis]

In [None]:
print(A)

### application 2

* recherche de maxima
* par l'intermédiaire de `np.argmax`

In [None]:
times = np.linspace(1000, 5000, num=5, dtype=int); print(times)

In [None]:
series = np.array( [ [10, 25, 32, 23, 12], [12, 8, 4, 10, 7], [100, 80, 90, 110, 120]])
print(series)

In [None]:
indices = np.argmax(series, axis=1); print(indices)

In [None]:
# les trois maxima, un par serie
maxima = series[ range(series.shape[0]), indices ]; print(maxima)

In [None]:
# et ils correspondent à ces instants-ci
times[indices]

## indexation par booléens

* une forme un peu spéciale d'indexation
* consiste à utiliser un tableau de booléens
* qui agit comme un masque

In [None]:
suite = np.array([1, 2, 3, 4, 5, 4, 3, 2, 1])
hauts = suite >= 4
print(hauts)

In [None]:
suite[hauts] = 0
print(suite)

### exercice

mandelbrot

## indexation par tableaux *vs* par listes

In [None]:
ix, iy = np.indices((4, 4))
A = 10 * ix + iy
print(A)

In [None]:
# les deux lignes
print(A[[0, 2]])

In [None]:
# les deux colonnes
print(A[:, [1, 3]])

In [None]:
# par deux listes !
print(A[[0, 2], [1, 3]])

In [None]:
# par un tableau 2D similaire !
indices = np.array([[0, 2], [1, 3]])
print(A[indices])