# IV-1. Cours Python : Introduction à Numpy
> Python - Chapter4 - LESSON 1.

- toc: false 
- badges: true
- comments: false
- categories: [Python-Intermediary, Python-Numpy, Python-Numpy-Introduction]
- layout: post
- permalink: /python/chapter/4/lesson/1/

-Python
    - Numpy
        -lesson = Introduction à Numpy

## 1. Introduction

L'objet principal de NumPy est le tableau multidimensionnel homogène. C'est un tableau d'éléments (généralement de nombres), tous du `même type`, indexés par un tuple d'entiers non négatifs. Dans NumPy, les dimensions sont appelées `axes`.

Par exemple, les coordonnées d'un point dans l'espace 3D `[1, 2, 1]` ont un axe. Cet axe contient 3 éléments, nous disons donc qu'il a une longueur de 3.
Dans l'exemple illustré ci-dessous, le tableau a 2 axes. Le premier axe a une longueur de 2, le deuxième axe a une longueur de 3.

```
[[1., 0., 0.],
 [0., 1., 2.]]
```

La classe d'un tableau de NumPy s'appelle `ndarray`. Il est également connu par l'alias : `array`.

Les attributs les plus importants d'un objet `ndarray` sont :

| Méthode | Description |
| ------- | ----------- |
| `ndarray.ndim` | le nombre d'axes (dimensions) du tableau. |
| `ndarray.shape` | les dimensions du tableau. Il s'agit d'un tuple d'entiers indiquant la taille du tableau dans chaque dimension. Pour une matrice avec `n` lignes et `m` colonnes, la forme (`shape`) sera `(n,m)`. La longueur du tuple de forme est donc le nombre d'axes, `ndim`. |
| `ndarray.size` | le nombre total d'éléments du tableau. Ceci est égal au produit des éléments de `shape`. |
| `ndarray.dtype` | un objet décrivant le type des éléments du tableau. On peut créer ou spécifier des dtype en utilisant des types Python standard. De plus, NumPy fournit ses propres types. `numpy.int32`, `numpy.int16` et `numpy.float64` en sont quelques exemples. |
| `ndarray.itemsize` | la taille en octets de chaque élément du tableau. Par exemple, un tableau d'éléments de type `float64` a une `itemsize` de 8 (=64/8), tandis qu'un autre de type complex32 a une taille d'élément 4 (=32/8). Il est équivalent à `ndarray.dtype.itemsize`. |
| `ndarray.data` | le tampon contenant les éléments réels du tableau. Normalement, nous n'aurons pas besoin d'utiliser cet attribut car nous accéderons aux éléments d'un tableau à l'aide de fonctions d'indexation. |

Quelques exemples : 

In [None]:
import numpy as np

# Generate 2 dimensions array
a = np.arange(15).reshape(3, 5)
print(a)

# Show infos
print(a.shape)
print(a.ndim)
print(a.dtype.name)
print(a.itemsize)
print(a.size)
print(type(a))


# Create 1 dimension array
b = np.array([6, 7, 8])
print(b)
print(type(b))


## 2. Création de tableaux

Il existe plusieurs façons de créer des tableaux numpy.

Par exemple, vous pouvez créer un tableau à partir d'une liste ou d'un tuple Python standard à l'aide de la fonction `array`. Le type du tableau résultant est déduit du type des éléments dans les séquences.



In [None]:
import numpy as np

a = np.array([2, 3, 4])
print(a)
print(a.dtype)

b = np.array([1.2, 3.5, 5.1])
print(b)
print(b.dtype)

# Be careful !
a = np.array(1, 2, 3, 4)    # WRONG
a = np.array([1, 2, 3, 4])  # RIGHT

`array` transforme des séquences de séquences en tableaux bidimensionnels, des séquences de séquences de séquences en tableaux tridimensionnels, etc.

In [None]:
b = np.array([(1.5, 2, 3), (4, 5, 6)])
print(b)

La fonction `zeros` crée un tableau plein de zéros, la fonction `ones` crée un tableau plein de uns et la fonction `empty` crée un tableau dont le contenu initial est aléatoire et dépend de l'état de la mémoire. Par défaut, le `dtype` du tableau créé est `float64`, mais il peut être spécifié via le mot clé argument `dtype`.

In [None]:
print(np.zeros((3, 4)))
print(np.ones((2, 3, 4), dtype=np.int16))
print(np.empty((2, 3)))

Pour créer des séquences de nombres, NumPy fournit la fonction `arange` qui est analogue à la fonction Python `range`, mais renvoie un `array`.

In [None]:
print(np.arange(10, 30, 5))
print(np.arange(0, 2, 0.3))

Lorsque `arange` est utilisé avec des arguments à virgule flottante, il n'est généralement pas possible de prédire le nombre d'éléments obtenus, en raison de la précision de la virgule flottante finie. Pour cette raison, il est généralement préférable d'utiliser la fonction `linspace` qui reçoit en argument le nombre d'éléments que l'on veut, au lieu de l'étape :

In [None]:
from numpy import pi

print(np.linspace(0, 2, 9))

x = np.linspace(0, 2 * pi, 100)
print(x)

f = np.sin(x)
print(f)


## 3. L'affichage des tableaux

Lorsque vous affichez un tableau, NumPy l'affiche de la même manière que les listes imbriquées, mais avec la disposition suivante :
 - le dernier axe est affiché de gauche à droite,
 - l'avant-dernier est affiché de haut en bas,
 - le reste est également affiché de haut en bas, chaque tranche étant séparée de la suivante par une ligne vide.

Les tableaux à une dimension sont ensuite affichés sous forme de lignes, les bidimensionnels sous forme de matrices et les tridimensionnels sous forme de listes de matrices.

In [None]:
a = np.arange(6)
print(a)

b = np.arange(12).reshape(4, 3)
print(b)

c = np.arange(24).reshape(2, 3, 4)
print(c)

Si un tableau est trop grand pour être affiché, NumPy ignore automatiquement la partie centrale du tableau et n'affiche que les coins :

In [None]:
print(np.arange(10000))
print(np.arange(10000).reshape(100, 100))

Pour désactiver ce comportement et forcer NumPy à afficher l'intégralité du tableau, vous pouvez modifier les options d'impression à l'aide de `set_printoptions`.

In [None]:
import sys
np.set_printoptions(threshold=sys.maxsize)

## 4. Les opérations de base

Les opérateurs arithmétiques sur les tableaux s'appliquent élément par élément. Un nouveau tableau est créé et rempli avec le résultat.

In [None]:
a = np.array([20, 30, 40, 50])
b = np.arange(4)
print(c - b)
print(b ** 2)
print(10 * np.sin(a))
print(a < 35)

L'opérateur de produit `*` fonctionne par élément dans les tableaux NumPy.
Le produit matriciel peut être réalisé à l'aide de l'opérateur `@` ou de la fonction ou méthode `dot` :

In [None]:
A = np.array([[1, 1], [0, 1]])
B = np.array([[2, 0], [3, 4]])
print(A * B)
print(A @ B)
print(A.dot(B))

# 5. Les fonctions universelles

NumPy fournit des fonctions mathématiques connues telles que `sin`, `cos` et `exp`. Dans NumPy, celles-ci sont appelées « fonctions universelles » (`ufunc`). Ces fonctions opèrent élément par élément sur un tableau, produisant un tableau en sortie.

In [None]:
B = np.arange(3)
print(B)

print(np.exp(B))
print(np.sqrt(B))

C = np.array([2., -1., 4.])
print(C)
print(np.add(B, C))

D'autres fonctions connues : `all`, `any`, `apply_along_axis`, `argmax`, `argmin`, `argsort`, `average`, `bincount`, `ceil`, `clip`, `conj`, `corrcoef`, `cov`, `cross`, `cumprod`, `cumsum`, `diff`, `dot`, `floor`, `inner`, `invert`, `lexsort`, `max`, `maximum`, `mean`, `median`, `min`, `minimum`, `nonzero`, `outer`, `prod`, `re`, `round`, `sort`, `std`, `sum`, `trace`, `transpose`, `var`, `vdot`, `vectorize`, `where`

## 6. L'indexation, découpage et itération

Les tableaux à une dimension peuvent être indexés, découpés et itérés, un peu comme les listes et autres séquences Python.

In [None]:
a = np.arange(10)
print(a)

# Get element
print(a[2])

print(a[2:5])

# equivalent to a[0:6:2] = 1000
a[:6:2] = 1000
print(a)

# reverted array
print(a[::-1])

for i in a:
    print(i)

Les tableaux multidimensionnels peuvent avoir un index par axe. Ces indices sont donnés dans un tuple séparé par des virgules :

In [None]:
def f(x, y):
    return 10 * x + y

# We can create an array using a function
b = np.fromfunction(f, (5, 4), dtype=int)
print(b)

# Get element
print(b[2, 3])

# each row in the second column of b
# equivalent to : b[:, 1]
print(b[0:5, 1])

# each column in the second and third row of b
print(b[1:3, :])

# the last row. Equivalent to b[-1, :]
print(b[-1])

L'expression entre crochets dans `b[i]` est traitée comme un `i` suivi d'autant d'instances de `:` que nécessaire pour représenter les axes restants. NumPy vous permet également d'écrire ceci en utilisant des points comme `b[i, ...]`.

Les points (`...`) représentent autant de `:` que nécessaire pour produire un tuple d'indexation complet. Par exemple, si `x` est un tableau à 5 axes, alors :
 - `x[1, 2, ...]` est équivalent à `x[1, 2, :, :, :]`
 - `x[..., 3]` est équivalent à `x[:, :, :, :, 3]`
 - `x[4, ..., 5, :]` est équivalent à `x[4, :, :, 5, :]`.


In [None]:
# a 3D array (two stacked 2D arrays)
c = np.array([[[  0,  1,  2],
             [ 10, 12, 13]],
             [[100, 101, 102],
             [110, 112, 113]]])

print(c.shape)

print(c[1, ...])

print(c[..., 2])

L'itération sur des tableaux multidimensionnels se fait par rapport au premier axe :

In [None]:
b = np.array([[  0,  1,  2],
             [ 10, 12, 13],
             [100, 101, 102],
             [110, 112, 113]])

for row in b:
    print(row)


# get each element of array in all dimensions
for element in b.flat:
    print(element)