## Introduction

NumPy est une bibliothèque pour langage de programmation Python, destinée à manipuler des matrices ou tableaux multidimensionnels ainsi que des fonctions mathématiques opérant sur ces tableaux.

Plus précisément, cette bibliothèque logicielle libre et open source fournit de multiples fonctions permettant notamment de créer directement un tableau depuis un fichier ou au contraire de sauvegarder un tableau dans un fichier, et manipuler des vecteurs, matrices et polynômes.

De nombreuses bibliothèques Python pour la machine learning sont basées sur NumPy. Il est donc difficile de faire une analyse de données en utilisant Python sans NumPy.

A la fin de ce cours, vous comprendrez les bases de NumPy :

+ Qu'est-ce que NumPy et comment peut-on l'installer puis l'importer?
+ Que sont les tableaux multidimensionnels NumPy.
+ Comment créer et manipuler des tableaux NumPy.
+ Comment faire des opérations mathématiques sur les tableaux NumPy (algèbre linéaire) et l'indexation.
+ Quels sont les générateurs de nombres aléatoires NumPy populaires.

### Qu'est-ce que NumPy pour la Data Science ?

NumPy introduit de puissants tableaux à N dimensions, qui sont plus efficaces en mémoire et plus rapides que les listes Python.

![numpy1.png](attachment:numpy1.png)

NumPy rend Python plus facile pour les opérations numériques, qui fournit des fonctionnalités comparables à MatLab et R.

En plus de cela, NumPy fournit également des fonctionnalités utiles d'algèbre linéaire, de transformée de Fourier et de nombres aléatoires.

De nombreux autres packages d'apprentissage automatique (par exemple, Pandas, SciPy, scikit learn, TensorFlow) sont basés sur ou reposent sur NumPy.

En résumé, NumPy est un package incontournable pour la science des données et l'apprentissage automatique.

### Installer et importer NumPy

Si vous n'avez pas Numpy installé, il faut faire:
**pip install numpy** et aprés l'avoir télécharger il faudra l'importer dans votre programme en utilisant le mot clé **import**

### Création de tableaux NumPy et notions de base

As mentioned earlier, the main object within NumPy is the multi-dimensional array (ndarray). It’s a table of elements (usually numbers), all the same type, indexed by a tuple of non-negative integers. While in NumPy, dimensions of arrays are also called axes.

First, let’s see how to create some NumPy arrays.

To create new NumPy arrays, we use np.array. We’ll show a few common methods used in data science.

Let’s start from the most basic way of creating NumPy arrays: from existing Python sequences.



#### De range à un tableau unidimensionnel

In [1]:
import numpy as np

In [26]:
numpy?

Object `numpy` not found.


In [4]:
import numpy as np
x = np.array(range(100))
x

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

In [5]:
type(x)

numpy.ndarray

Puisqu'il s'agit du premier tableau NumPy que nous avons créé, examinons également ses attributs importants :

+ **ndim** : le nombre d'axes (dimensions).
+ **shape** : les dimensions du tableau sous forme de tuple. Pour une matrice à n lignes et m colonnes, la forme sera (n,m).
+ **size** : le nombre total d'éléments du tableau, qui est égal au produit des éléments de shape.
+ **dtype** : le type de données des éléments du tableau. Plus d'informations à ce sujet dans la section Types de données.
+ **itemsize** : la taille en octets de chaque élément du tableau. Par exemple, int32 a la taille d'élément 4 (=32/8).

In [6]:
x.ndim

1

In [7]:
x.shape

(100,)

In [8]:
x.size

100

In [9]:
x.dtype

dtype('int32')

In [10]:
x.itemsize

4

### De liste à un tableau multidimensionnel

Une autre façon populaire de créer des tableaux est à partir de listes de listes (ou de listes imbriquées).

In [11]:
y = np.array([[1.0,2,3], [4,5,6], [7,8,9]])

y

array([[1., 2., 3.],
       [4., 5., 6.],
       [7., 8., 9.]])

In [13]:
#le premier nbr du premier sous liste
y[0][0]

1.0

In [14]:
y.ndim

2

In [9]:
y.shape

(3, 3)

In [10]:
y.size

9

In [11]:
y.itemsize

8

### Tableaux spéciaux (zeros, ones, full, eye)

Ensuite, utilisons quelques fonctions de tableau pour créer des tableaux spéciaux.

Lorsque la taille du tableau est connue mais pas les éléments, nous pouvons utiliser les fonctions NumPy pour créer des tableaux avec des espaces réservés initiaux. Cela nous aide à éviter les opérations coûteuses de croissance des tableaux par la suite.

Nous pouvons utiliser la fonction **zeros** pour créer des tableaux remplis de zéros. Par défaut, le dtype du tableau créé est float64.

Par exemple, nous pouvons créer un tableau avec des zéros à une dimension et une longueur de 10.

In [15]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

Ou un tableau avec des zéros à deux dimensions en spécifiant son **shape**.

In [16]:
np.zeros((5,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

De même, nous pouvons utiliser la fonction **ones** pour créer des tableaux remplis de uns.

In [17]:
np.ones(10)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

In [18]:
np.ones((5,5))

array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

Nous pouvons également utiliser la fonction **full** pour créer des tableaux remplis avec fill_value défini.

Par exemple, nous pouvons créer un tableau (5,5) rempli du numéro 10.

In [20]:
np.full((5,5), 11)

array([[11, 11, 11, 11, 11],
       [11, 11, 11, 11, 11],
       [11, 11, 11, 11, 11],
       [11, 11, 11, 11, 11],
       [11, 11, 11, 11, 11]])

Nous pouvons également créer des tableaux basés sur la forme des tableaux existants.

In [21]:
x.shape

(100,)

In [25]:
x = np.array([[1, 2, 3], [4, 5, 6]])
x.shape
np.full(x.shape, 53)

array([[53, 53, 53],
       [53, 53, 53]])

Une autre fonction utile est **eye**. Il renvoie un tableau 2D avec des uns sur la diagonale et des zéros ailleurs, qui peut être utilisé pour créer des matrices d'identité.

Par exemple, nous pouvons spécifier le nombre de lignes dans le tableau à 5, tandis que le nombre de colonnes sera le même par défaut. Nous avons maintenant une matrice d'identité de taille 5.

In [26]:
np.eye(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

Ou nous pouvons spécifier à la fois le nombre de lignes et de colonnes.

In [27]:
np.eye(5, 3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.],
       [0., 0., 0.],
       [0., 0., 0.]])

## Types de données

NumPy prend en charge une plus grande variété de types numériques que Python. Par exemple, NumPy a ses types de données comme numpy.int32 et numpy.float64. Différents types de données utilisent différents octets/mémoire.

Nous avons laissé les types de données par défaut lors de la création de tableaux. Essayons de spécifier le type de données à l'aide du paramètre dtype.

Créons deux tableaux à partir de **range** - l'un utilisant le type de données par défaut int32, l'autre utilisant int8.

In [28]:
x = np.array(range(100))

y = np.array(range(100), dtype=np.int8)

In [29]:
x

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

In [30]:
y

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99],
      dtype=int8)

## Manipulation de tableaux

Avant d'adapter des modèles d'apprentissage automatique, nous devons souvent modifier la forme d'un tableau existant.

### Reshape

Par exemple, disons que nous avons un tableau avec des données de longueur 90.

In [5]:
x = np.array(range(90))
x.shape

(90,)

Nous pouvons utiliser la méthode reshape pour modifier la forme de ce tableau tout en conservant ses données.

Ci-dessous, nous changeons x en un tableau bidimensionnel de 10 lignes et 9 colonnes.

In [33]:
x = x.reshape((10,9))
x


ValueError: cannot reshape array of size 100 into shape (10,9)

Nous pouvons également changer le tableau en 3 dimensions de forme (3,3,10).

In [None]:
x.reshape((3,3,10))

In [None]:
x[:,1]

### Ravel(suite)


Nous avons vu des exemples de transformation d'un tableau 1D en un tableau multidimensionnel. Ravel quant à lui permet de faire l'opération inverse.cad passer d'un tableau à n dimension à un tableau de dim 1


Partons d'un tableau 3D:

In [34]:
x = np.array(range(90)).reshape(10,3,3)
x

array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8]],

       [[ 9, 10, 11],
        [12, 13, 14],
        [15, 16, 17]],

       [[18, 19, 20],
        [21, 22, 23],
        [24, 25, 26]],

       [[27, 28, 29],
        [30, 31, 32],
        [33, 34, 35]],

       [[36, 37, 38],
        [39, 40, 41],
        [42, 43, 44]],

       [[45, 46, 47],
        [48, 49, 50],
        [51, 52, 53]],

       [[54, 55, 56],
        [57, 58, 59],
        [60, 61, 62]],

       [[63, 64, 65],
        [66, 67, 68],
        [69, 70, 71]],

       [[72, 73, 74],
        [75, 76, 77],
        [78, 79, 80]],

       [[81, 82, 83],
        [84, 85, 86],
        [87, 88, 89]]])

In [35]:
x.ndim

3

Nous pouvons utiliser la méthode ravel pour l'aplatir en un tableau 1D.

In [36]:
x.ravel()

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89])

### Transpose

Il est aussi possible de transposer un tableau.(cad: inverser l'axe des x avec celle des y) ex T[n:m]= recuprerer les elements de l'indice n à l'indice m-1


Partons de cette exemple.

In [37]:
x = np.array(range(90)).reshape(10,3,3)
x

array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8]],

       [[ 9, 10, 11],
        [12, 13, 14],
        [15, 16, 17]],

       [[18, 19, 20],
        [21, 22, 23],
        [24, 25, 26]],

       [[27, 28, 29],
        [30, 31, 32],
        [33, 34, 35]],

       [[36, 37, 38],
        [39, 40, 41],
        [42, 43, 44]],

       [[45, 46, 47],
        [48, 49, 50],
        [51, 52, 53]],

       [[54, 55, 56],
        [57, 58, 59],
        [60, 61, 62]],

       [[63, 64, 65],
        [66, 67, 68],
        [69, 70, 71]],

       [[72, 73, 74],
        [75, 76, 77],
        [78, 79, 80]],

       [[81, 82, 83],
        [84, 85, 86],
        [87, 88, 89]]])

Pour transposer le tableau, nous pouvons utiliser **T**. Nous pouvons voir que x est transposé de la forme **(10, 3, 3) à (3, 3, 10)**.

In [38]:
x.T

array([[[ 0,  9, 18, 27, 36, 45, 54, 63, 72, 81],
        [ 3, 12, 21, 30, 39, 48, 57, 66, 75, 84],
        [ 6, 15, 24, 33, 42, 51, 60, 69, 78, 87]],

       [[ 1, 10, 19, 28, 37, 46, 55, 64, 73, 82],
        [ 4, 13, 22, 31, 40, 49, 58, 67, 76, 85],
        [ 7, 16, 25, 34, 43, 52, 61, 70, 79, 88]],

       [[ 2, 11, 20, 29, 38, 47, 56, 65, 74, 83],
        [ 5, 14, 23, 32, 41, 50, 59, 68, 77, 86],
        [ 8, 17, 26, 35, 44, 53, 62, 71, 80, 89]]])

### Opérations mathématiques sur un seul tableau

In [39]:
x = np.array(range(1, 101))
x

array([  1,   2,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,  13,
        14,  15,  16,  17,  18,  19,  20,  21,  22,  23,  24,  25,  26,
        27,  28,  29,  30,  31,  32,  33,  34,  35,  36,  37,  38,  39,
        40,  41,  42,  43,  44,  45,  46,  47,  48,  49,  50,  51,  52,
        53,  54,  55,  56,  57,  58,  59,  60,  61,  62,  63,  64,  65,
        66,  67,  68,  69,  70,  71,  72,  73,  74,  75,  76,  77,  78,
        79,  80,  81,  82,  83,  84,  85,  86,  87,  88,  89,  90,  91,
        92,  93,  94,  95,  96,  97,  98,  99, 100])

Il est utile d'en savoir plus sur quelques statistiques du tableau. Nous pouvons effectuer **sum, min, max, mean, std** sur le tableau pour les éléments qu'il contient.

In [40]:
x[3]

4

In [8]:
A=np.array([[2,-5,1],[7,12,19],[15,8,20]])
A

array([[ 2, -5,  1],
       [ 7, 12, 19],
       [15,  8, 20]])

In [9]:
A[:2,:2]

array([[ 2, -5],
       [ 7, 12]])

In [10]:
x.sum()

5050

In [11]:
x.min()

1

In [None]:
x.max()

In [41]:
x.std()

28.86607004772212

Outre ces fonctions, nous pouvons également obtenir **la médiane** ou obtenir **la racine carrée** non négative du tableau.

In [12]:
np.median(x)

50.5

In [None]:
np.sqrt(x)

### Indexation et Slicing(retrancher= prendre une partie du tableau) des tableaux

Semblable aux listes Python, nous pouvons utiliser l'indexation et le slicing pour obtenir des éléments des tableaux NumPy.

In [45]:
x = np.array(range(100)).reshape((10, 10))

x

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49],
       [50, 51, 52, 53, 54, 55, 56, 57, 58, 59],
       [60, 61, 62, 63, 64, 65, 66, 67, 68, 69],
       [70, 71, 72, 73, 74, 75, 76, 77, 78, 79],
       [80, 81, 82, 83, 84, 85, 86, 87, 88, 89],
       [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]])

In [46]:
x[:,2]

array([ 2, 12, 22, 32, 42, 52, 62, 72, 82, 92])

In [47]:
x[:,[1,3,9]]

array([[ 1,  3,  9],
       [11, 13, 19],
       [21, 23, 29],
       [31, 33, 39],
       [41, 43, 49],
       [51, 53, 59],
       [61, 63, 69],
       [71, 73, 79],
       [81, 83, 89],
       [91, 93, 99]])

#### Sélection d'éléments

La sélection la plus basique est un élément ; nous pouvons appeler les éléments du tableau par leurs positions d'index correspondantes.

In [42]:
x[0, 1]

IndexError: too many indices for array

In [43]:
x[2, 9]

IndexError: too many indices for array

#### Sélection de sous-tableau

Nous pouvons également utiliser l'indexation et le slicing pour sélectionner une sous-section du tableau.

Ce concept est plus naturel à apprendre avec un tableau 2D avec des colonnes et des lignes. Par exemple, pour sélectionner la deuxième ligne (position d'index 1), nous utilisons le code Python ci-dessous.

In [44]:
x[1]

2

Pour sélectionner la troisième colonne (position d'index 2), nous utilisons le code Python ci-dessous.

In [None]:
x[:, 2]

Et si nous voulons un morceau du tableau ?

Nous pouvons également utiliser la technique de slicing.

Par exemple, en spécifiant les index de début et de fin, le code ci-dessous peut renvoyer plusieurs lignes. Rappelez-vous que la position d'index d'arrêt n'est pas incluse.

In [48]:
x[1:3]

array([[10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29]])

Nous pouvons également effectuer un découpage similaire pour prendre plusieurs colonnes.

In [14]:
x[:, 1:3]

array([[ 1,  2],
       [11, 12],
       [21, 22],
       [31, 32],
       [41, 42],
       [51, 52],
       [61, 62],
       [71, 72],
       [81, 82],
       [91, 92]])

Ou nous pouvons obtenir des sous-ensembles de lignes et de colonnes.

In [15]:
x[1:3, 1:3]

array([[11, 12],
       [21, 22]])

Nous pouvons également utiliser une indexation avancée pour obtenir des lignes particulières.

In [16]:
x[[0,3,9]]

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [90, 91, 92, 93, 94, 95, 96, 97, 98, 99]])

Ou des lignes particulières et une colonne particulière.

In [17]:
x[[0,3,9], 2]

array([ 2, 32, 92])

Ci-dessous un autre exemple. Dans chaque ligne, un élément spécifique est sélectionné. L'indice de ligne est [0,3,9], et l'indice de colonne précise l'élément à choisir pour la ligne correspondante, ici [0,9,3]

In [18]:
x[[0,3,9], [0,9,3]]

array([ 0, 39, 93])

#### Indexation booléenne

Outre ce qui précède, nous pouvons également utiliser l'indexation booléenne (True/False) sur les tableaux NumPy. C'est pratique pour sélectionner les éléments d'un tableau qui satisfont à certaines conditions.

Par exemple, si nous voulons voir les éléments du tableau x qui sont supérieurs à 50, nous pouvons utiliser le code suivant.

In [28]:
bool_index = (x > 50)
bool_index

array([False, False, False, False, False, False, False, False, False,
       False, False, False, False, False, False, False, False, False,
       False, False, False, False, False, False, False, False, False,
       False, False, False, False, False, False, False, False, False,
       False, False, False, False, False, False, False, False, False,
       False, False, False, False, False, False,  True,  True,  True,
        True,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True,  True,  True,  True,  True,  True,  True,  True,
        True,  True,  True,  True,  True,  True,  True,  True,  True,
        True])

In [19]:
B=np.array([[2,12,7],[7,4,8],[7,2,15]])
B

array([[ 2, 12,  7],
       [ 7,  4,  8],
       [ 7,  2, 15]])

In [20]:
bool_index=(B%2==0)
bool_index

array([[ True,  True, False],
       [False,  True,  True],
       [False,  True, False]])

In [21]:
B[bool_index]

array([ 2, 12,  4,  8,  2])

In [22]:
B[bool_index]=0
B

array([[ 0,  0,  7],
       [ 7,  0,  0],
       [ 7,  0, 15]])

Le bool_index est un tableau booléen de la même forme que x, où chaque élément indique si l'élément correspondant de x est > 50. Ensuite, nous pouvons utiliser ce tableau booléen pour sélectionner des éléments du tableau x.

#### Changements de valeur

Les tableaux NumPy sont modifiables. Avec l'indexation et le découpage, nous pouvons également réaffecter les éléments dans un tableau.

Nous allons montrer un exemple de tableau 3D de forme (3, 3, 3).

In [31]:
x = np.array([[[1, 2, 3], [4, 5, 6], [7, 8, 9]], [[10, 11, 12], [13, 14, 15], [16, 17, 18]], [[19, 20, 21], [22, 23, 24], [25, 26, 27]]])
x

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 14, 15],
        [16, 17, 18]],

       [[19, 20, 21],
        [22, 23, 24],
        [25, 26, 27]]])

Nous pouvons réaffecter l'élément avec l'index 0, 0, 0 à 100.

In [33]:
x[0, 0, 1] = 100
x

array([[[  1, 100, 100],
        [  4,   5,   6],
        [  7,   8,   9]],

       [[ 10,  11,  12],
        [ 13,  14,  15],
        [ 16,  17,  18]],

       [[ 19,  20,  21],
        [ 22,  23,  24],
        [ 25,  26,  27]]])

Nous pouvons également modifier plusieurs éléments à la fois. Il est difficile d'imaginer les dimensions de tableaux supérieurs à 2D. Mais vous pouvez vous faire une idée avec des exemples.

Le code Python ci-dessous réaffecte tous les éléments de 2ème et 3ème dimensions avec la position d'index 1 à 99.

In [24]:
x[:, 1, 1] = 99 # indices: [0,1,1], [1,1,1], [2,1,1]
x

array([[[ 1,  2,  3],
        [ 4, 99,  6],
        [ 7,  8,  9]],

       [[10, 11, 12],
        [13, 99, 15],
        [16, 17, 18]],

       [[19, 20, 21],
        [22, 99, 24],
        [25, 26, 27]]])

Alors que le code Python ci-dessous réaffecte tous les éléments d'index 0 dans la première dimension à -888.

In [None]:
x[0, :, :] = -888 # indices [0, 0, 0], [0, 0, 1], [0, 0, 2], [0, 1, 0], [0, 1, 1], [0, 1, 2], [0, 2, 0], [0, 2, 1], [0, 2, 2]
x

### Tableaux multiples : Stack/Concatenation

Nous allons commencer par combiner deux tableaux NumPy.

Créons deux exemples de tableaux de la même forme.

In [49]:
x = np.array(range(10)).reshape((5,2))
x

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

In [50]:
y = np.array(range(10,20)).reshape((5,2))
y

array([[10, 11],
       [12, 13],
       [14, 15],
       [16, 17],
       [18, 19]])

On peut soit les empiler :

+ horizontalement ou par colonne avec hstack ou
+ verticalement ou par rangée avec vstack.

In [51]:
np.hstack((x, y))

array([[ 0,  1, 10, 11],
       [ 2,  3, 12, 13],
       [ 4,  5, 14, 15],
       [ 6,  7, 16, 17],
       [ 8,  9, 18, 19]])

In [52]:
np.vstack((x, y))

array([[ 0,  1],
       [ 2,  3],
       [ 4,  5],
       [ 6,  7],
       [ 8,  9],
       [10, 11],
       [12, 13],
       [14, 15],
       [16, 17],
       [18, 19]])

### Tableaux multiples : opérations mathématiques / algèbre linéaire

Examinons maintenant certaines opérations sur plusieurs tableaux. Nous inclurons les opérations arithmétiques de base, la diffusion et la multiplication.

La plupart des concepts sont faciles à apprendre avec une connaissance de base des opérations matricielles en algèbre linéaire.

#### Opérations arithmétiques de base

Pour montrer les bases du calcul arithmétique entre tableaux, nous créons deux tableaux simples.

In [37]:
x = np.array(range(10)).reshape((5,2))
x

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

In [38]:
y = np.array(range(10,20)).reshape((5,2))
y

array([[10, 11],
       [12, 13],
       [14, 15],
       [16, 17],
       [18, 19]])

In [53]:
x + y

array([[10, 12],
       [14, 16],
       [18, 20],
       [22, 24],
       [26, 28]])

In [54]:
x - y

array([[-10, -10],
       [-10, -10],
       [-10, -10],
       [-10, -10],
       [-10, -10]])

In [55]:
x * y

array([[  0,  11],
       [ 24,  39],
       [ 56,  75],
       [ 96, 119],
       [144, 171]])

In [56]:
x / y

array([[0.        , 0.09090909],
       [0.16666667, 0.23076923],
       [0.28571429, 0.33333333],
       [0.375     , 0.41176471],
       [0.44444444, 0.47368421]])

#### Multiplication matricielle

La multiplication matricielle est une opération d'algèbre linéaire de base. Voyons comment le faire sur les tableaux NumPy.

Nous utiliserons les mêmes tableaux que dans l'exemple précédent.

Pouvons-nous multiplier les tableaux x et y en utilisant la méthode du produit scalaire (**dot**) ?

In [57]:
x.dot(y)
# il faut que le nbr de collone  de x= nbr de ligne de y

ValueError: shapes (5,2) and (5,2) not aligned: 2 (dim 1) != 5 (dim 0)

In [41]:
++++

SyntaxError: invalid syntax (<ipython-input-41-ee74cb86516d>, line 1)