# KERAS
    Keras est une librairie de réseaux de neurones écrite en Python et intégrée à TensorFlow. 
    Elle a été développée dans le but de permettre une expérimentation rapide afin de passer    
    de l’idée aux résultats en un minimum de temps. 
    
    La librairie Keras répond aux besoins suivants :

    - Prototypage simple et rapide
    - Prise en charge des réseaux convolutifs (CNN) et des réseaux récurrents (RNN)
    - Déploiement sur CPU ou sur GPU

    Nous présentons dans cette page les trois approches fournies par Keras pour construire des réseaux :

    - La classe Sequential : ce container permet de décrire un réseau séquentiel en empilant différentes couches.
    - L’API Functional : compromis entre la facilité et flexibilité, c'est l’approche la plus utilisée.
    - La classe Model : approche bas-niveau, fournit un contrôle total mais ne donne plus accès à la plupart des    
      fonctionnalités de Keras.

## Les tenseurs
    La librairie Keras n’utilise pas en interne de tableaux NumPy mais un objet équivalent appelé tenseur. 
    Les tenseurs peuvent par exemple être stockés sur GPU alors que les tableaux NumPy sont limités aux CPU. 
    On retrouve de nombreuses similarités :



In [140]:
import tensorflow as tf
T = tf.ones((3,2))
print(f'T.shape --> {T.shape}\n')
print(f'T.dtype --> {T.dtype}\n')
print(T)

T.shape --> (3, 2)

T.dtype --> <dtype: 'float32'>

tf.Tensor(
[[1. 1.]
 [1. 1.]
 [1. 1.]], shape=(3, 2), dtype=float32)


### Conversion vers un tenseur

    Pour stocker les données d’entrée, nous utilisons la syntaxe suivante :

In [146]:
import tensorflow as tf
import numpy as np

Tensor1 = tf.constant([[1, 2, 3],[1, 2, 3],[1, 2, 3],[1, 2, 3]])   # conversion liste => tenseur
print(Tensor1)
A  = np.ones((1,2))
Tensor2 = tf.constant(A)   
print (Tensor2)# conversion numpy array => tenseur

tf.Tensor(
[[1 2 3]
 [1 2 3]
 [1 2 3]
 [1 2 3]], shape=(4, 3), dtype=int32)
tf.Tensor([[1. 1.]], shape=(1, 2), dtype=float64)


    Pour indiquer le type des données en entrée, on peut utiliser le paramètre dtype=tf.float32.

In [147]:
Tensor1 = tf.constant([1, 2, 3],dtype=tf.float32)
print(Tensor1)

tf.Tensor([1. 2. 3.], shape=(3,), dtype=float32)


    Conversion depuis un tenseur

In [148]:
print(Tensor1.numpy())

[1. 2. 3.]


## La classe Sequential

    Keras fournit une classe container permettant une écriture simple et aisée pour construire des réseaux de    neurones séquentiels.

### model.add ( )

    La classe modélisant le réseau séquentiel est instancié en premier :    
    
    model = keras.Sequential(). 
     
    On lui ajoute deux couches de type FC créées en donnant leurs caractéristiques principales.
    Une couche est dite fully-connected (FC) lorsque tous les neurones de la couche précédente sont reliés à tous       les neurones de la couche concernée.

In [150]:
from tensorflow import keras
import numpy as np

model = keras.Sequential()

model.add( keras.layers.Dense(32, input_shape=(16,), activation='relu') )
model.add( keras.layers.Dense(20) )

    Les différents paramètres pour la fonction d’activation : “relu”, “softmax”, “tanh”, “sigmoid”.    
    Le paramètre input_shape est optionnel, s’il est omis, Keras utilisera la taille du tenseur fournit pour la    phase d’apprentissage.    
## model.summary()

    La fonction summary() permet d’afficher une description des différentes couches :

    

In [151]:
model.summary()

Model: "sequential_12"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_24 (Dense)            (None, 32)                544       
                                                                 
 dense_25 (Dense)            (None, 20)                660       
                                                                 
Total params: 1,204
Trainable params: 1,204
Non-trainable params: 0
_________________________________________________________________


In [1]:
import numpy as np
from tensorflow import keras
from keras import backend as K
from keras import optimizers
from keras.models import Sequential
from keras.layers import Dense, Conv2D, Flatten

from keras.models import Model
from keras.models import load_model

import matplotlib.pyplot as plt

In [2]:
from keras.datasets import mnist
from keras.utils import to_categorical

(X_train_data, Y_train_data), (X_test_data, Y_test_data) = mnist.load_data()

In [116]:
N = X_train_data.shape  # 60 000 données
print(N)

(60000, 28, 28)


In [23]:
X_train = np.reshape(X_train_data, (N,28,28,1))

In [115]:
print(X_train.shape)

(60000, 28, 28, 1)


In [106]:
import numpy as np

arr = np.array([
                [[1,1,1,1], [1,1,1,1],
                 [1,1,1,1], [1,1,1,1]],
                [[1,1,1,1], [1,1,1,1],
                 [1,1,1,1], [1,1,1,1]],
                [[1,1,1,1], [1,1,1,1],
                 [1,1,1,1], [1,1,1,1]]
               ])

M = arr.shape
print(M)

(3, 4, 4)


In [128]:
arr_t = np.reshape(arr, (arr.shape[0],4,4,1))
#print(arr_t.shape)
#print(arr_t)

In [53]:
X_test_data.shape[0]

10000

In [56]:
X_test = np.reshape(X_test_data, (X_test_data.shape[0],28,28,1))

In [57]:
X_train = X_train/255

In [60]:
Y_train

array([[0., 0., 0., ..., 0., 0., 0.],
       [1., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       ...,
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 1., 0.]], dtype=float32)

In [70]:
Y_train = to_categorical(Y_train_data, num_classes=10)

In [71]:
Y_train

array([[0., 0., 0., ..., 0., 0., 0.],
       [1., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       ...,
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 0., 0.],
       [0., 0., 0., ..., 0., 1., 0.]], dtype=float32)

In [134]:
import numpy as np
from descente import *
from tensorflow import keras
from keras import backend as K
from keras import optimizers
from keras.models import Sequential
from keras.layers import Dense
from keras_facile import *


modele = Sequential()

# Réseau : 
# 2 entrées (x,y), 
# première couche : 2 neurones
# seconde couche : 1 neurone
# activation = tangente hyperbolique

# Première couche : 2 neurones (entrée de dimension 2)
modele.add(Dense(2, input_dim=2, activation='sigmoid'))

# Seconde et dernière couche : 1 neurone
modele.add(Dense(1, activation='sigmoid'))

mysgd = optimizers.SGD(learning_rate=1)
modele.compile(loss='mean_squared_error', optimizer=mysgd)

# poids_a_zeros(modele,0)  # couche 0, tous les poids à zéros
# poids_a_zeros(modele,1)  # couche 0, tous les poids à zéros
definir_poids(modele,0,0,[1,2],-3)  # couche, rang, [coeffs], biais
definir_poids(modele,0,1,[-3,-2],1)  # couche, rang, [coeffs], biais
definir_poids(modele,1,0,[1,1],-1)  # couche, rang, [coeffs], biais

# definir_poids(modele,0,0,[1,-1],1)  # couche, rang, [coeffs], biais
# definir_poids(modele,0,1,[2,-1],-2)  # couche, rang, [coeffs], biais
# definir_poids(modele,1,0,[2,-3],-1)  # couche, rang, [coeffs], biais

affiche_poids(modele,0)
affiche_poids(modele,1)

# carré rouge +1
# rond bleus 0
carres_rouges = [(0,1), (1,0)]
ronds_bleus   = [(0,0), (1,1)] 

X_train = np.array(carres_rouges+ronds_bleus)
# rouge = 1, bleu = 0
print(f'X_train : {X_train}')
Y_train = np.array( [[1]]*len(carres_rouges) + [[0]]*len(ronds_bleus) )

print(f'Y_train : {Y_train}')

print(X_train.shape)
print(Y_train.shape)






===== Couche numéro 0 =====
Nombre de neurones : 2
Nombre d'entrées par neurones : 2
Nombre de poids par neurones : 3 

    --- Neurone numéro 0 ---
    Coefficients [1. 2.]
    Biais -3.0
    --- Neurone numéro 1 ---
    Coefficients [-3. -2.]
    Biais 1.0


===== Couche numéro 1 =====
Nombre de neurones : 1
Nombre d'entrées par neurones : 2
Nombre de poids par neurones : 3 

    --- Neurone numéro 0 ---
    Coefficients [1. 1.]
    Biais -1.0
X_train : [[0 1]
 [1 0]
 [0 0]
 [1 1]]
Y_train : [[1]
 [1]
 [0]
 [0]]
(4, 2)
(4, 1)


In [132]:
import tensorflow as tf

cifar = tf.keras.datasets.cifar100
(x_train, y_train), (x_test, y_test) = cifar.load_data()
model = tf.keras.applications.ResNet50(
    include_top=True,
    weights=None,
    input_shape=(32, 32, 3),
    classes=100,)

loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=False)
model.compile(optimizer="adam", loss=loss_fn, metrics=["accuracy"])
model.fit(x_train, y_train, epochs=5, batch_size=64)

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-100-python.tar.gz
Epoch 1/5


2023-06-19 16:06:07.966866: W tensorflow/tsl/platform/profile_utils/cpu_utils.cc:128] Failed to get CPU frequency: 0 Hz


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x2fbe7d060>

In [None]:
"""
# From mpariente https://stackoverflow.com/questions/51140950/
def get_weight_grad(model, inputs, outputs):
### Gets gradient of model for given inputs and outputs for all weights
    grads = model.optimizer.get_gradients(model.total_loss, model.trainable_weights)
    symb_inputs = (model._feed_inputs + model._feed_targets + model._feed_sample_weights)
    f = K.function(symb_inputs, grads)
    x, y, sample_weight = model._standardize_user_data(inputs, outputs)
    output_grad = f(x + y + sample_weight)
    return output_grad



print('====================')

# modele.evaluate(X_train, Y_train)

print('====================')

# modele.fit(X_train, Y_train, epochs=1000, batch_size=len(X_train), verbose = 1)
affiche_poids(modele,0)
affiche_poids(modele,1)



# print('========= Erreurs ===========')
# liste_erreur = []
# for i in range(1001):
#     loss = modele.train_on_batch(X_train, Y_train)  # renvoie l'erreur avant l'application du gradient
#     liste_erreur.append(loss)
#     print('loss',loss)
#     modele.evaluate(X_train, Y_train)
# print("Liste des erreurs", liste_erreur)



# # idem mais une époque à la fois
# permet d'afficher les gradients
# poids_a_zeros(modele,0)  # tous les poids à zéros
# poids_a_zeros(modele,0)  # couche 0, tous les poids à zéros
# poids_a_zeros(modele,1)  # couche 0, tous les poids à zéros

# modele.evaluate(X_train, Y_train)
# learning_rate = K.eval(mysgd.learning_rate)  # learning rate

# for i in range(1):
#     poids_avant = modele.get_weights()
#     gradient = get_weight_grad(modele, X_train, Y_train)
#     loss = modele.train_on_batch(X_train, Y_train)  # renvoie l'erreur avant l'application du gradient
#     poids_apres = modele.get_weights()
#     poids_calculer_alamain = [poids_avant[i] - learning_rate*gradient[i] for i in range(len(poids_avant))]
#     print("\n==== Epoque numéro",i)

#     print("Poids avant",poids_avant)  
#     print("Gradient",gradient)
#     print("Poids après, par keras",poids_apres)
#     # print("Poids calculer à la main",poids_calculer_alamain)
#     print("Erreur",loss)


print("Gradient à la main par différence de poids")
learning_rate = K.eval(mysgd.learning_rate)  # learning rate
gradient=[]
for i in range(1):
    poids_avant = modele.get_weights()
    loss = modele.train_on_batch(X_train, Y_train)  # renvoie l'erreur avant l'application du gradient
    poids_apres = modele.get_weights()
    gradient = [-1/learning_rate*(poids_apres[i] - poids_avant[i]) for i in range(len(poids_avant))]
    print("\n==== Epoque numéro",i)

    print("Poids avant",poids_avant)  
    print("Poids après, par keras",poids_apres)
    print("Gradient",gradient)



poids = modele.get_weights()
liste_poids = [ poids[0][0][0], poids[0][1][0], poids[1][0], 
                poids[0][0][1], poids[0][1][1], poids[1][1],
                poids[2][0][0], poids[2][1][0], poids[3][0] ]
liste_gradient = [ gradient[0][0][0], gradient[0][1][0], gradient[1][0], 
                gradient[0][0][1], gradient[0][1][1], gradient[1][1],
                gradient[2][0][0], gradient[2][1][0], gradient[3][0] ]

print("poids\n",liste_poids)
print("gradient\n",liste_gradient)


print("Eval en (0,0)",evaluation(modele,[0,0]))
print("Eval en (1,1)",evaluation(modele,[1,1]))
print("Eval en (1,0)",evaluation(modele,[1,0]))
print("Eval en (0,1)",evaluation(modele,[0,1]))
print("Eval en (0.2,0.9)",evaluation(modele,[0.2,0.9]))
# Y_train_found = modele.predict(X_train)
# Y_test_found = modele.predict(X_test)
# Affichage
# plt.scatter(X_train, Y_train, s=100,  color='blue')
# plt.scatter(X_train, Y_train_found,  color='red')
# plt.scatter(X_test, Y_test, s=100,  color='cyan')
# plt.scatter(X_test, Y_test_found,  color='green')

# X_liste = np.linspace(0,3,30)
# Y_liste = model.predict(X_liste)
# plt.plot(X_liste,Y_liste)
# plt.show()

"""