# Librairies Python Numpy/Scipy

NumPy est une extension du langage de programmation Python, pour
manipuler des matrices ou des tableaux multidimensionnels.
Elle possède des fonctions mathématiques vectorielles opérant sur les tableaux.

NumPy est la base de la librairie SciPy, regroupement de librairies
Python pour le calcul scientifique. 

# Tableau unidimensionnel

In [1]:
import numpy as np
a=np.arange(10)
print(a)

[0 1 2 3 4 5 6 7 8 9]


Pour obtenir le type de l'objet et celui des données sous-jacentes

In [2]:
print(type(a))
print(a.dtype)

<class 'numpy.ndarray'>
int32


Pour créer un tableau de réels, il faut préciser le type explicitement

In [3]:
import numpy as np
a=np.arange(10, dtype='float')
print(a)

[0. 1. 2. 3. 4. 5. 6. 7. 8. 9.]


La donnée membre shape retourne les dimensions du tableau sous la forme d'un tuple

In [4]:
print(a.shape)

(10,)


Application des opérateurs de calcul arithmétique

In [5]:
a=a+1      # ajout de 1 à tous les elements
print(a)
print(2*a) 
print(a*a) # carre de chaque element
print(a/a) # division element par element  DANGER

[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
[ 2.  4.  6.  8. 10. 12. 14. 16. 18. 20.]
[  1.   4.   9.  16.  25.  36.  49.  64.  81. 100.]
[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]


In [6]:
a=np.array([0, 1, 2, 0, 2, 3, 5, 6, 6])
print(a.shape)
print(len(a))
print('valeurs   : ', a.min(), ' ', a.max())
print('positions : ', a.argmin(), ' ', a.argmax())

(9,)
9
valeurs   :  0   6
positions :  0   7


Pour transformer une liste python en numpy.ndarray, on appelle le constructeur ndarray 
ou la fonction membre asarray

In [7]:
lst=list(range(10))
print(lst)
a=np.array(lst, dtype='float')
print(a)
a=np.asarray(lst, dtype='float') # plus efficace que le constructeur
print(a)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0. 1. 2. 3. 4. 5. 6. 7. 8. 9.]
[0. 1. 2. 3. 4. 5. 6. 7. 8. 9.]


In [8]:
a=np.linspace(0., 1., 10, endpoint=False)
print(a)
print(len(a))

[0.  0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
10


In [9]:
#help(np.linspace)

# Tableau multidimensionnel
But : création d'un tableau vide 2x2 

In [84]:
a=np.ndarray(shape=(2, 2)) # NON INITIALISE
print(a) 
print('--------------')
print(a.shape)
print('--------------')
print(a.ndim)

[[1. 1.]
 [1. 1.]]
--------------
(2, 2)
--------------
2


In [90]:
a.fill(1)
print(a)

a[1, 1]=-1
print(a)

[[1. 1.]
 [1. 1.]]
[[ 1.  1.]
 [ 1. -1.]]


In [92]:
print(a)
del a   # supprime l'objet a

a=np.empty(shape=(2, 2), dtype='float64')
print(a.dtype)
print(a)
print(type(a))

[[ 1.  1.]
 [ 1. -1.]]


NameError: name 'a' is not defined

In [13]:
help(np.empty)

Help on built-in function empty in module numpy:

empty(...)
    empty(shape, dtype=float, order='C', *, like=None)
    
    Return a new array of given shape and type, without initializing entries.
    
    Parameters
    ----------
    shape : int or tuple of int
        Shape of the empty array, e.g., ``(2, 3)`` or ``2``.
    dtype : data-type, optional
        Desired output data-type for the array, e.g, `numpy.int8`. Default is
        `numpy.float64`.
    order : {'C', 'F'}, optional, default: 'C'
        Whether to store multi-dimensional data in row-major
        (C-style) or column-major (Fortran-style) order in
        memory.
    like : array_like
        Reference object to allow the creation of arrays which are not
        NumPy arrays. If an array-like passed in as ``like`` supports
        the ``__array_function__`` protocol, the result will be defined
        by it. In this case, it ensures the creation of an array object
        compatible with that passed in via this 

In [14]:
a=np.zeros(shape=(2, 2), dtype='float64')
print(a.dtype)
print(a)
print(type(a))

float64
[[0. 0.]
 [0. 0.]]
<class 'numpy.ndarray'>


bool
Boolean (True or False) stored as a bit

inti
Platform integer (normally either int32 or int64)

int8
Byte (-128 to 127)

int16
Integer (-32768 to 32767)

int32
Integer (-2^31 to 2^31 -1)

int64
Integer (-2^63 to 2 ^ 63 -1)

uint8
Unsigned integer (0 to 255)

uint16
Unsigned integer (0 to 65535)

uint32
Unsigned integer (0 to 2 ^ 32 - 1)

uint64
Unsigned integer (0 to 2 ^ 64 - 1)

float16
Half precision float: sign bit, 5 bits exponent, 10 bits mantissa

float32
Single precision float: sign bit, 8 bits exponent, 23 bits mantissa

float64 or float
Double precision float: sign bit, 11 bits exponent, 52 bits mantissa

complex64
Complex number, represented by two 32-bit floats (real and imaginary components)

complex128 or complex
Complex number, represented by two 64-bit floats (real and imaginary components)

In [15]:
a.fill(1)
print(a)

[[1. 1.]
 [1. 1.]]


In [16]:
z = 2. + 3.j
print(z)
#help(z)
print(abs(z))

(2+3j)
3.605551275463989


## vue d'un tableau

In [17]:
a.fill(1)
view=a  # ATTENTION shallow copy
print('meme objet : ', id(a), ' ==', id(view))

c=a.copy()
print(id(c))
print(id(a))


view[0, 0]=0  # modif de l'element [0, 0] de a !!!
print(a)
print(c)

meme objet :  2839875872304  == 2839875872304
2839875873168
2839875872304
[[0. 1.]
 [1. 1.]]
[[1. 1.]
 [1. 1.]]


L'affectation ne fait qu'une copie superficielle ("shallow copy"), il faut utiliser le module copy avec sa fonction deepcopy pour dupliquer l'objet a avec ses valeurs. 

## cas exotique : tableau d'enregistrement
But : créer un tableau de structure (ou record)

In [18]:
record=np.dtype([('name', str, 40), ('age', 'int32')])

In [19]:
print(record)

[('name', '<U40'), ('age', '<i4')]


In [20]:
item=np.array([('thomas', 17), ('nathan', 13)], dtype=record)
print(item[0])

with open('data', 'bw') as f:
    item.tofile(f)
f.close

with open('data', 'br') as f:
    a=np.fromfile(f, dtype=record)
f.close
print(a)

('thomas', 17)
[('thomas', 17) ('nathan', 13)]


In [21]:
record=np.dtype([('x', float), ('y', float)])
print(record)

[('x', '<f8'), ('y', '<f8')]


In [22]:
coords = np.array([(1.0, 4.0,), (2.0, -1.0), (3, 8)], dtype=record)
print(coords)
print(coords[0]['y'])
print(type(coords))
print(coords.shape)

[(1.,  4.) (2., -1.) (3.,  8.)]
4.0
<class 'numpy.ndarray'>
(3,)


In [23]:
coords.view(np.float64).reshape(coords.shape + (-1,))

array([[ 1.,  4.],
       [ 2., -1.],
       [ 3.,  8.]])

In [24]:
print(coords.shape + (-1,))
A=coords.view(np.float64).reshape((2, -1), order='C')
print(A)

(3, -1)
[[ 1.  4.  2.]
 [-1.  3.  8.]]


# Découpage et indexage
## cas unidimensionnel
Le découpage (slicing) d'un tableau unidimensionnel NumPy est identique à celui d'une liste Python

In [25]:
import numpy as np
a=np.arange(10)
print(a)
# extraction des elements du tableau d'indice dans [3, 7)
print(a[3:7])  
 # extraction des elements avec un pas de 2 jusqu'a l'indice 8 exclu
print(a[:8:2])  
# renverse le tableau
print(a[::-1])   
print(a[-1::-1])

[0 1 2 3 4 5 6 7 8 9]
[3 4 5 6]
[0 2 4 6]
[9 8 7 6 5 4 3 2 1 0]
[9 8 7 6 5 4 3 2 1 0]


## cas multidimensionnel

In [26]:
# tableau unidimensionnel retransformé en tableau 2x3x4
b=np.arange(24).reshape(2, 3, 4) 
print(b)
print('--------------')
print(b.shape)
print('--------------')
print(b.ndim)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
--------------
(2, 3, 4)
--------------
3


On obtient 2 paquets, chacun formé d'une matrice 3x4

In [27]:
# on selectionne l'element placé en [0, 0] de tous les paquets
#view=b[:, 0, 0] 
#print(view)
# dans le paquet 0, on selectionne la ligne 0 
x=b[0, 0, :] 
print(x)
# dans le paquet 0, on selectionne dans la ligne 1 en se déplaçant de 2 en 2
#view=b[0, 1, ::2] 
#print(view)

[0 1 2 3]


In [28]:
x=b[0, 0, :] 
print(x)
x[1] = 188
print(b)

[0 1 2 3]
[[[  0 188   2   3]
  [  4   5   6   7]
  [  8   9  10  11]]

 [[ 12  13  14  15]
  [ 16  17  18  19]
  [ 20  21  22  23]]]


In [29]:
view=b[..., 1] # on selectionne la colonne 1 de tous les paquets
print(view)
print (view.base)

z = view.copy()
print(z.base)

[[188   5   9]
 [ 13  17  21]]
[  0 188   2   3   4   5   6   7   8   9  10  11  12  13  14  15  16  17
  18  19  20  21  22  23]
None


## Exercice sur le slicing
Expliquer le comportement des cas suivants

In [30]:
view=b[-1, ::-1, -1]
print(view)
view=b[0, ::-1, -1]
print(view)
view=b[0, :, -1]
print(view)

[23 19 15]
[11  7  3]
[ 3  7 11]


# Applatissage de tableaux (array flattening)

In [31]:
b=np.arange(24).reshape(2, 3, 4)

flat_nd_copy=b.flatten()
print(flat_nd_copy)
flat_nd_copy[0]=-1
print(b)
print('------------------------------')
flat=b.ravel()  # nouvelle vue
print(flat)

flat[0]=-1  # modifie b
print(b)

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23]
[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
------------------------------
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23]
[[[-1  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


# Concaténation de tableaux
Soient 2 tableaux A et B, comportant le même nombre de ligne, on désire construire le tableau augmenté A | B

In [32]:
A=np.arange(12).reshape(3, 4)
B=A+10
print(id(A))
print(id(B))
S=np.hstack((A, B))
print(S)

2839875776752
2839875778960
[[ 0  1  2  3 10 11 12 13]
 [ 4  5  6  7 14 15 16 17]
 [ 8  9 10 11 18 19 20 21]]


Généralisation suivant les autres directions

In [33]:
A=np.arange(12).reshape(3, 4)
B=A
S=np.vstack((A, B))
print(S)
print('------------------')
S=np.dstack((A, B))
print(S)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
------------------
[[[ 0  0]
  [ 1  1]
  [ 2  2]
  [ 3  3]]

 [[ 4  4]
  [ 5  5]
  [ 6  6]
  [ 7  7]]

 [[ 8  8]
  [ 9  9]
  [10 10]
  [11 11]]]


## zero-padding - rolling

In [34]:
A=np.arange(12).reshape(3, 4)
A=A+1
print(A)
print(type(A))

[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
<class 'numpy.ndarray'>


In [35]:
lx=A.shape[0]
ly=A.shape[1]
A=np.pad(A, ((0, lx), (0, ly)), mode='constant') # (before, after)
print(A)
print('----------------------------')
A=np.roll(A, +ly//2, axis=1)
print(A)

[[ 1  2  3  4  0  0  0  0]
 [ 5  6  7  8  0  0  0  0]
 [ 9 10 11 12  0  0  0  0]
 [ 0  0  0  0  0  0  0  0]
 [ 0  0  0  0  0  0  0  0]
 [ 0  0  0  0  0  0  0  0]]
----------------------------
[[ 0  0  1  2  3  4  0  0]
 [ 0  0  5  6  7  8  0  0]
 [ 0  0  9 10 11 12  0  0]
 [ 0  0  0  0  0  0  0  0]
 [ 0  0  0  0  0  0  0  0]
 [ 0  0  0  0  0  0  0  0]]


Application du zero padding dans le calcul de produit de convolution

#  création d'une matrice
La classe matrix dérive de la classe ndarray

In [36]:
A=np.matrix([[0, 1], [2, 3]])
print(type(A))

M=np.asmatrix(np.diag([2, 1]))
print(M)
print(type(M))

<class 'numpy.matrix'>
[[2 0]
 [0 1]]
<class 'numpy.matrix'>


Création d'un vecteur

In [37]:
print(A)
V=np.matrix([0, 1]).transpose()
print(V)
print('-'*30)
print(A*V)


[[0 1]
 [2 3]]
[[0]
 [1]]
------------------------------
[[1]
 [3]]


In [38]:
r=list(range(0, 10))+list(range(5))
print(r)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 1, 2, 3, 4]


# Comment savoir si c'est une copie ou une vue?

In [25]:
import numpy as np

def is_base(a):
    return a.base is None

def is_view(a):
    return not (a.base is None)

def memory_shared(a, b):
    return np.shares_memory(a, b)

a=np.arange(10)
b=a[0:4]
c=a[4:]
cpy=a[4:].copy()

print(a)
print(a.base) # Base object if memory is from some other object

print('-'*40)

if is_base(a):  # if a.base is None:
    print("il n'y a pas d'objet ayant servi à construire a")

if is_base(b):  # if b.base is None:
    print("il n'y a pas d'objet ayant servi à construire b")
    
if b.base is a:
    print("a a servi à construire b")
    
if cpy.base is a:
    print("a a servi à construire cpy")
 
print('\n === Partage mémoire ===')

print("a et b   ", memory_shared(a, b))
print("a et c   ", memory_shared(a, c))
print("b et c   ", memory_shared(b, c))
print("c et cpy ", memory_shared(c, cpy))

print('-'*40)
b[0]=-1
print(a)

print('-'*40)

print('isbase(a)   : ', is_base(a))
print('isbase(b)   : ', is_base(b))
print('isbase(c)   : ', is_base(c))
print('isbase(cpy) : ', is_base(cpy))

print('-'*40)

a=c
print("mem shared a et c   ", memory_shared(a, c))
print('isbase(a)   : ', is_base(a))
print('isbase(c)   : ', is_base(c))

print('-'*40)
c[4]=-1
print(c)
print(a)

print('-'*40)
a[4]=42
print(c)
print(a)

print('is_view(a)   : ', is_view(a))
print('is_view(c)   : ', is_view(c))


[0 1 2 3 4 5 6 7 8 9]
None
----------------------------------------
il n'y a pas d'objet ayant servi à construire a
a a servi à construire b

 === Partage mémoire ===
a et b    True
a et c    True
b et c    False
c et cpy  False
----------------------------------------
[-1  1  2  3  4  5  6  7  8  9]
----------------------------------------
isbase(a)   :  True
isbase(b)   :  False
isbase(c)   :  False
isbase(cpy) :  True
----------------------------------------
mem shared a et c    True
isbase(a)   :  False
isbase(c)   :  False
----------------------------------------
[ 4  5  6  7 -1  9]
[ 4  5  6  7 -1  9]
----------------------------------------
[ 4  5  6  7 42  9]
[ 4  5  6  7 42  9]
is_view(a)   :  True
is_view(c)   :  True
