Interface keras et manipulation des tenseurs

In [None]:
import tensorflow as tf
import keras

Organisation modulaire de Keras

In [None]:
# Modules principaux
keras.layers # Couches (Dense, Conv2D, LSTM, etc.)
keras.models # Modèles (Sequential, Model)
keras.optimizers  # Optimiseurs (Adam, SGD, RMSprop)
keras.losses # Fonctions de perte
keras.metrics # Métriques d'évaluation
keras.callbacks  # Callbacks (EarlyStopping, ModelCheckpoint)
keras.datasets  # Datasets intégrés
keras.utils

 Un tenseur est un tableau multidimensionnel typé avec des métadonnées

In [3]:
# Scalaire (0D) - un nombre
scalar = tf.constant(42)
print(f"Shape: {scalar.shape}, Rank: {tf.rank(scalar)}")

# Vecteur (1D) - liste de nombres
vector = tf.constant([1, 2, 3, 4])
print(f"Shape: {vector.shape}, Rank: {tf.rank(vector)}")

# Matrice (2D) - tableau de tableaux
matrix = tf.constant([[1, 2], [3, 4], [5, 6]])
print(f"Shape: {matrix.shape}, Rank: {tf.rank(matrix)}")

# Tenseur 3D - pile de matrices
tensor_3d = tf.constant([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])
print(f"Shape: {tensor_3d.shape}, Rank: {tf.rank(tensor_3d)}")

Shape: (), Rank: 0
Shape: (4,), Rank: 1
Shape: (3, 2), Rank: 2
Shape: (2, 2, 2), Rank: 3


I0000 00:00:1761660709.380587   77825 gpu_device.cc:2020] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 9515 MB memory:  -> device: 0, name: NVIDIA GeForce RTX 4070 SUPER, pci bus id: 0000:01:00.0, compute capability: 8.9


 Méthodes de création courantes

In [None]:
# Tenseurs constants
zeros = tf.zeros(shape=(3, 4))                    # Matrice de zéros [[0., 0., 0., 0.],[0., 0., 0., 0.],[0., 0., 0., 0.]]
ones = tf.ones(shape=(2, 3), dtype=tf.float32)    # Matrice de uns [[1., 1., 1.],[1., 1., 1.]]
fill = tf.fill(dims=(2, 2), value=7)              # Rempli avec une valeur [[7, 7],[7, 7]]

# Tenseurs aléatoires
normal = tf.random.normal(shape=(100, 10), mean=0.0, stddev=1.0) # [[-8.10366809e-01,  1.38839972e+00, -1.99497747e+00 ...]]
uniform = tf.random.uniform(shape=(50, 20), minval=0, maxval=1)  # [[0.85373425, 0.5935111 , 0.19142246, 0.74564636...]]

# Séquences
range_tensor = tf.range(start=0, limit=10, delta=2)       # [0, 2, 4, 6, 8] attention n'inclus pas la limit (ici 10)
linspace = tf.linspace(start=0.0, stop=1.0, num=5)        # [0, 0.25, 0.5, 0.75, 1.0]

# Tenseurs variables (modifiables)
variable = tf.Variable(tf.random.normal((10, 10)))
print(f"Trainable: {variable.trainable}")   # True par défaut

Création de tenseurs

In [17]:
#  Spécification du type et device


tensor_int = tf.constant(value=[1, 2, 3], dtype=tf.int64) # Type explicite
tensor_float = tf.cast(tensor_int, tf.float32)  # Conversion

# Device placement
with tf.device('/CPU:0'):
    cpu_tensor = tf.ones((1000, 1000))

Manipulation des formes (Reshaping)
- Le nombre total d'éléments doit rester constant-1
- -1 dans reshape = "calcule automatiquement cette dimension"
- Les opérations créent de nouveaux tenseurs (immutabilité)
  
 

In [None]:
# Tenseur initial
original = tf.constant([[1, 2, 3], [4, 5, 6]])  # Shape: (2, 3)

# Reshape - change les dimensions mais garde le nombre d'éléments
reshaped = tf.reshape(original, (3, 2))       # Shape: (3, 2)
flattened = tf.reshape(original, (-1,))       # Shape: (6,) - vecteur
      
# Transpose - inverse les axes
transposed = tf.transpose(original)           # Shape: (3, 2)
        
# Expand/squeeze dimensions
expanded = tf.expand_dims(original, axis=0)   # Shape: (1, 2, 3)   
squeezed = tf.squeeze(expanded)               # Shape: (2, 3)
         
# Vérification de compatibilité
print(f"Nombre d'éléments: {tf.size(original).numpy()}")
print(f"Compatible reshape: {tf.size(original) == tf.size(reshaped)}")

Nombre d'éléments: 6
Compatible reshape: True


Opérations mathématiques sur tenseurs

In [19]:
a = tf.constant([[1, 2], [3, 4]], dtype=tf.float32)
b = tf.constant([[5, 6], [7, 8]], dtype=tf.float32)

# Arithmétique élément par élément
addition = a + b        # ou tf.add(a, b)
subtraction = a - b     # ou tf.subtract(a, b)
multiplication = a * b  # ou tf.multiply(a, b) - ATTENTION: pas matriciel
division = a / b        # ou tf.divide(a, b)

# Fonctions mathématiques
sqrt_a = tf.sqrt(a)
exp_a = tf.exp(a)
log_a = tf.math.log(a)
abs_a = tf.abs(a)

Indexation et slicing

In [None]:
tensor = tf.constant([[[1, 2], [3, 4]], 
                      [[5, 6], [7, 8]]])  # Shape: (2, 2, 2)

# Indexation simple

element = tensor[0, 0, 0]  # Accès à un élément: 1
element = tensor[0, 0, 1]  # Accès à un élément: 2
element = tensor[0, 1, 0]  # Accès à un élément: 3
element = tensor[0, 1, 1]  # Accès à un élément: 4

element = tensor[1, 0, 0]  # Accès à un élément: 5
element = tensor[1, 0, 1]  # Accès à un élément: 6
element = tensor[1, 1, 0]  # Accès à un élément: 7
element = tensor[1, 1, 1]  # Accès à un élément: 8

# Slicing (comme NumPy)
slice_1 = tensor[0, :, :]  # Première "page": [[1, 2], [3, 4]]
slice_2 = tensor[:, 0, :]  # Première ligne de chaque page: [[1, 2], [5, 6]]
slice_3 = tensor[..., 1]   # Dernière colonne: [[2, 4], [6, 8]]

# Slicing avec step
every_other = tensor[::2]  # Un élément sur deux

# Indexation conditionnelle
mask = tensor > 4
filtered = tf.boolean_mask(tensor, mask)  # Éléments > 4

tf.Tensor(6, shape=(), dtype=int32)


 Conversions bidirectionnelles

In [30]:
import numpy as np
 
# NumPy vers TensorFlow
numpy_array = np.array([[1, 2, 3], [4, 5, 6]], dtype=np.float32)
tf_tensor = tf.constant(numpy_array)

# ou automatiquement:
tf_tensor_auto = tf.add(numpy_array, 1)

# TensorFlow vers NumPy
tf_tensor = tf.constant([[1, 2], [3, 4]])
numpy_result = tf_tensor.numpy()  # Méthode .numpy()

print(f"Type original: {type(numpy_array)}")
print(f"Type TF: {type(tf_tensor)}")
print(f"Type converti: {type(numpy_result)}")

Type original: <class 'numpy.ndarray'>
Type TF: <class 'tensorflow.python.framework.ops.EagerTensor'>
Type converti: <class 'numpy.ndarray'>


 Interopérabilité automatique

 Attention aux copies mémoire

 - tf.constant(numpy_array) → Copie les données
 - .numpy() → Copie depuis GPU vers CPU si nécessaire
 - Variables partagent parfois la mémoire avec NumPy (CPU uniquement

In [None]:
# TensorFlow accepte automatiquement les arrays NumPy
np_data = np.random.normal(0, 1, (100, 10))
tf_result = tf.reduce_mean(np_data)  # Fonctionne directement

# Les opérations mixtes fonctionnent
mixed = tf.add(np_data, tf.constant(5.0))

Types de données courants

In [None]:
# Types numériques principaux
float_types = [tf.float16, tf.float32, tf.float64]   # demi, simple, double précision
int_types = [tf.int8, tf.int16, tf.int32, tf.int64]  # entiers signés
uint_types = [tf.uint8, tf.uint16]                   # entiers non signés
bool_type = tf.bool                                  # booléen

# Création avec type spécifique
tensor_f16 = tf.constant([1.0, 2.0], dtype=tf.float16)  # Plus rapide, moins précis
tensor_f32 = tf.constant([1.0, 2.0], dtype=tf.float32)  # Standard DL
tensor_f64 = tf.constant([1.0, 2.0], dtype=tf.float64)  # Plus précis, plus lent

# Conversion de types
converted = tf.cast(tensor_f64, tf.float32)

 Bonnes pratiques performance

In [None]:
# Préférer float32 pour le Deep Learning (compromise vitesse/précision)
weights = tf.Variable(tf.random.normal((1000, 1000), dtype=tf.float32))

# Éviter les conversions répétées

# ❌Mauvais
for i in range(100):
    result = tf.cast(weights, tf.float64)  # Conversion à chaque itération
    
# ✅Bon  
weights_f64 = tf.cast(weights, tf.float64)  # Une seule conversion
for i in range(100):
    result = weights_f64

 Cas concret : batch d'images

In [None]:
# Simulation d'un batch d'images RGB 224x224
batch_size = 32
height, width, channels = 224, 224, 3 #(224px X 224px) (r,g,b)

# Création d'un batch aléatoire
images_batch = tf.random.normal((batch_size, height, width, channels))
labels_batch = tf.random.uniform((batch_size,), maxval=10, dtype=tf.int32)

print(f"Images shape: {images_batch.shape}")  # (32, 224, 224, 3)
print(f"Labels shape: {labels_batch.shape}")  # (32,)
print(f"Memory usage: ~{images_batch.numpy().nbytes / 1024**2:.1f} MB")

# One-hot encoding des labels
num_classes = 10
labels_onehot = tf.one_hot(labels_batch, num_classes)
print(f"One-hot shape: {labels_onehot.shape}")  # (32, 10)

# Normalisation (preprocessing typique)
normalized_images = (images_batch - tf.reduce_mean(images_batch)) / tf.math.reduce_std(images_batch)

# Vérifications
print(f"Images normalized - Mean: {tf.reduce_mean(normalized_images):.3f}")
print(f"Images normalized - Std: {tf.math.reduce_std(normalized_images):.3f}")
print(f"One-hot sum per sample: {tf.reduce_sum(labels_onehot, axis=1)}")  # Doit être [1,1,1,...]

Images shape: (32, 224, 224, 3)
Labels shape: (32,)
Memory usage: ~18.4 MB
One-hot shape: (32, 10)
Images normalized - Mean: -0.000
Images normalized - Std: 1.000
One-hot sum per sample: [1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.
 1. 1. 1. 1. 1. 1. 1. 1.]
