#### transformer un tableau

In [2]:
import numpy as np
from time import time
rng = np.random.default_rng(seed=int(time()))
np.__version__

'1.26.3'

In [None]:
arr = rng.integers(
    0, 20, 
    size=16, 
    dtype=np.int8, 
    endpoint=True
).reshape(4, 4)
arr

In [None]:
# broadcast matrice + vecteur (ligne)
arr + [1, 2, 3, 4]
arr + np.array([1, 2, 3, 4])
arr + np.array([1, 2, 3, 4]).reshape(1, 4)


In [None]:
# broadcast matrice + vecteur (colonne)
arr + np.array([1, 2, 3, 4]).reshape(4, 1)

In [None]:
# reshape (x, y) => (y, x) => transposition
row = np.array([1, 2, 3, 4]).reshape(1, 4)
col = row.T
row, col

In [None]:
# row.dot(col) => normal 1, 4 x 4, 1 => scalire
row @ col
# attention 4, 1 x 1, 4 => matrice 4, 4
col @ row

In [None]:
# certaines opérations ont besoin de dimension analogues
[1, 2, 4] @ col

In [None]:
## atention: pour broadcaster la variable 
## doit avoir des dimensions analogues a la variable de départ
arr + np.ones((4,2))

In [None]:
# application linéaire
3 * arr + row

In [None]:
# vectorisation permet la lisibilité du code et 
# d'oublier la boucle for en python (moins performante)
np.around(np.cos(arr) + np.pi / 2, 2)

In [None]:
patients = np.array([[1.65, 64, 126, 76], [1.78, 95, 136, 85]])
patients

In [None]:
# aggrégats liés à toutes les données
# patients.mean(), patients.max(), patients.size 
np.mean(patients, axis=0)
# la moyenne est appliquée sur les objets lignes directement
(patients[0] + patients[1])/2

np.mean(patients, axis=1)
# la moyenne est appliquée à l'intérieur des lignes i.e les objets colonnes
np.array([patients[0].mean(), patients[1].mean()])
np.mean(patients.T, axis=0)

# ==> axis = 0 == LIGNE, axis =1 == COLONNES


In [None]:
# example de l'imc donc je dois manipuler les attributs des lignes donc => les objets colones
# avec des lambda = avec l'axe 1 => le param de la fct est la ligne
np.apply_along_axis(lambda line : line[1]/(line[0]**2), arr=patients, axis=1)

In [None]:
# fonction custom sur les lignes
# avec des lambda = avec l'axe 0 => le param de la fct est la colonne
np.apply_along_axis(lambda c: np.average(c, weights=[0.75,1]), arr=patients, axis=0)
(0.75*patients[0] + patients[1])/1.75

#### filtrer un tableau

In [None]:
arr = rng.integers(1, 100, size=20)
arr

In [None]:
cond_inf_50 = arr < 50
# transtypage en booléen
cond_odd = (arr % 2).astype(dtype=np.bool_)
# arr[cond_inf_50]
## opérateurs booléen en filtrage: &, |, ~ non
arr[(arr < 50) & (~cond_odd)]

In [None]:
(arr % 2).astype(dtype="bool")


#### données non existantes

In [7]:
# une donnée indéterminée dans une structure numpy concernée dans une opération,
# implique un résultat indéterminé
arr = np.array([1, 2, np.nan])
arr.sum()
# nan est considéré comme un réél
arr.dtype

dtype('float64')

In [11]:
# dégager les nan
np.sum(arr[~np.isnan(arr)].astype("i1"))
np.nansum(arr).astype("i1")

3

In [13]:
# corrompre les nan
arr[np.isnan(arr)] = np.nanmean(arr)
arr, np.sum(arr)

4.5