# Apprentissage de portes logiques

On veut apprendre à un réseau à réaliser les portes logiques: OR, AND, NOR et NAND

In [1]:
import numpy as np

## Sigmoïde

In [2]:
def sigmoid(x):
    return 1/(1+np.exp(-x))

## Modélisation

On prend en entrée deux entiers en binaire, et on attend une sortie binaire.

In [3]:
X = np.array([[0 ,0] , [0 ,1] , [1 ,0] , [1 ,1]])

## Implémentation d'une rétropropagation:

Dans le cas d'un réseau simple (1 couche cachée, pas de biais)

In [8]:
def logicNN(X,t):
    N = 4 # Nombre de couches cachées
    epochs = 10000
    lr = 0.1
    W1 = np.random.rand(2,N) # Initialisation aléatoire des poids de la première couche
    W2 = np.random.rand(N,1) # Initialisation aléatoire des poids de la deuxième couche
    # On n'utilise pas de biais ici

    for e in range(epochs):
        ### forward pass
        out1 = sigmoid(np.dot(X, W1))
        out2 = sigmoid(np.dot(out1, W2))
        
        ### Back propagation
        error = t - out2 # pas besoin de calculer explicitement la fonction de coup, pour la descente de gradient on utilise uniquement sa dérivée

        # Chain rule
        d2 = 2*error*(out2 * (1-out2)) # dloss/dW2 à l'exception de *out_1
        d1 = d2.dot(W2.T) * (out1*(1-out1)) # dloss/dW1 à l'exception de *x
        
        # SGD
        W2 += lr * out1.T.dot(d2) # ici c'est un plus car error = -(y-t)
        W1 += lr * X.T.dot(d1) # idem la mise à jour des paramètres revient bien à V(t+1) = V(t) - lr * dV(t)
    return out2.flatten()

## Application

On effectue l'apprentissage au moyen du réseau précédent, est-ce qu'on parvient à généraliser pour les portes OR, AND, NOR et NAND?

In [9]:
print("OR", logicNN(X, np.array([[0,1,1,1]]).T))
print("AND", logicNN(X, np.array([[0,0,0,1]]).T))
print("XOR", logicNN(X, np.array([[0,1,1,0]]).T))
print("NAND", logicNN(X, np.array([[1,1,1,0]]).T))
print("NOR", logicNN(X, np.array([[1,0,0,0]]).T))


OR [0.04977225 0.97145544 0.96913388 0.99231697]
AND [9.49947437e-04 3.19800640e-02 2.72085476e-02 9.56793292e-01]
XOR [0.05650861 0.94083971 0.94675617 0.05370182]
NAND [0.99705753 0.97492284 0.97330513 0.03757534]
NOR [0.92829403 0.04037275 0.04214101 0.01400944]


In [10]:
# Autre exemples
X = np.array([[0.1,0.1], [0.2,0.9], [0.8,0.15], [0.85,0.8]])
print("OR", logicNN(X, np.array([[0,1,1,1]]).T))

X = np.array([[0,0], [0,1], [1,0], [1,1],[0.1,0.1], [0.2,0.9], [0.8,0.15], [0.85,0.8]])
print("OR", logicNN(X, np.array([[0,1,1,1,0,1,1,1]]).T))

OR [0.05017906 0.97105762 0.96898671 0.99229482]
OR [0.00629241 0.96854508 0.97395575 0.99319932 0.06945269 0.97807898
 0.96788917 0.99171079]


In [11]:
# Exemple du OR
X = np.array([[0,0], [0,1], [1,0], [1,1]])
Y_pred = logicNN(X, np.array([[0,1,1,1]]).T)
print("OR", Y_pred)
print("OR", np.round(Y_pred))

X = np.array([[0.1,0.1], 
              [0.2,0.9], 
              [0.8,0.15], 
              [0.85,0.8]])
logicNN(X, np.array([[0,1,1,1]]).T)
print("OR", Y_pred)
print("OR", np.round(Y_pred))

X = np.array([[0,0], 
              [0,1], 
              [1,0], 
              [1,1],
              [0.1,0.1], 
              [0.2,0.9], 
              [0.8,0.15], 
              [0.85,0.8]])
Y_pred = logicNN(X, np.array([[0,1,1,1,0,1,1,1]]).T)
print(Y_pred)
print("OR", np.round(Y_pred))


OR [0.03095847 0.98254636 0.98242159 0.99493755]
OR [0. 1. 1. 1.]
OR [0.03095847 0.98254636 0.98242159 0.99493755]
OR [0. 1. 1. 1.]
[0.0050721  0.96986333 0.9763879  0.99357257 0.06313955 0.97896164
 0.97044381 0.99220029]
OR [0. 1. 1. 1. 0. 1. 1. 1.]
