### Redes con tensorflow
#### Por Francisco Serradilla

#### Tareas

* Entrenar el perceptrón multicapa suministrado.
* Ampliarlo para meter más capas.
* Ampliarlo para usar activación relu.
* Ampliarlo para evaluar con un conjunto de test.
* Entrenar con 3 de los problemas suministrados y comentar los resultados. Si se entrenan más de 3, el resto se considerarán actividades opcionales.
* (Opcional) Probar otros optimizadores.
* (Opcional) Añadir dropout. ¿Mejora la generalización con alguno de los problemas suministrados?

In [1]:
print('Loading tensorflow...')
import tensorflow as tf
print('Loaded')

# Create a Constant op that produces a 1x2 matrix.  The op is
# added as a node to the default graph.
# The value returned by the constructor represents the output of the Constant op.
matrix1 = tf.constant([[3., 3.]])# Dos columnas y una fila, si hay duda, usa el shap

# Create another Constant that produces a 2x1 matrix.
matrix2 = tf.constant([[2.],[2.]])

# Create a Matmul op that takes 'matrix1' and 'matrix2' as inputs.
# The returned value, 'product', represents the result of the matrix multiplication.
product = tf.matmul(matrix1, matrix2)

print(product)

Loading tensorflow...
Loaded
tf.Tensor([[12.]], shape=(1, 1), dtype=float32)


In [2]:
# Variables

# Create a Variable, that will be initialized to the scalar value 0.
state = tf.Variable(0, name="counter")

# Create an Op to add one to `state`.
one = tf.constant(1)

print(state) # Print the initial value of 'state'
for _ in range(3): # Run the op that updates 'state' and print 'state'.
  state = tf.add(state, one)
  print(state)


<tf.Variable 'counter:0' shape=() dtype=int32, numpy=0>
tf.Tensor(1, shape=(), dtype=int32)
tf.Tensor(2, shape=(), dtype=int32)
tf.Tensor(3, shape=(), dtype=int32)


In [3]:
# define XOR
inputs = tf.constant([[0.0, 0.0], [0.0, 1.0], [1.0, 0.0], [1.0, 1.0]])
labels = tf.constant([[1.0, 0.0], [0.0, 1.0], [0.0, 1.0], [1.0, 0.0]])

In [4]:
# Carga ejemplos de circulo.txt

import tensorflow as tf
import numpy as np

# carga datos de entrenamiento
d = np.loadtxt("samples/circulo.txt")

import random
#print(d)
np.random.shuffle(d) # cuidado, no usar el shuffle de listas, hace cosas raras con arrays de np
#print(d)
inputs = d[:,:2]
labels = d[:,2:]

# convierte a formato tf
inputs = tf.cast(inputs, dtype=tf.float32)
labels = tf.cast(labels, dtype=tf.float32)

In [9]:
# Creación de la red
# Define un perceptrón multicapa con 2 capas usando RMS como medida del error y back proagation como algoritmo de entrenamiento

import tensorflow as tf

class Multilayer:
    def __init__(self, ninput, nhidden, noutput):
        range = 0.1
        self.W1 = tf.Variable(tf.random.uniform([ninput, nhidden], -range, range, dtype=tf.float32))
        self.b1 = tf.Variable(tf.random.uniform([nhidden], -range, range, dtype=tf.float32))
        self.W2 = tf.Variable(tf.random.uniform([nhidden, noutput], -range, range, dtype=tf.float32))
        self.b2 = tf.Variable(tf.random.uniform([noutput], -range, range, dtype=tf.float32))
        
        self.trainable = [self.W1, self.b1, self.W2, self.b2]

    def forward (self, e):
        s1 = tf.nn.sigmoid(tf.matmul(e,self.W1)+self.b1)
        s = tf.nn.sigmoid(tf.matmul(s1,self.W2)+self.b2)
        return s
    
    def loss (self, predicted, labels):
        return tf.reduce_mean(tf.square(predicted - labels))

    def accuracy (self, predicted, labels):
        aciertos = tf.math.equal(tf.argmax(labels,1),tf.argmax(predicted,1))
        return tf.reduce_mean(tf.cast(aciertos, dtype=tf.float32))


In [10]:
# Entrenamiento

net = Multilayer(2, 7, 3) # crea red

optimizer = tf.keras.optimizers.RMSprop(learning_rate=1e-2)
#optimizer = tf.keras.optimizers.Adam(learning_rate=1e-2)

# ejecutamos el número de epochs indicados
epochs = 3000
trace = 500
for i in range(1,epochs+1):
    with tf.GradientTape() as tape: # GradientTape almacena valores para que pueda calcularse el gradiente
        predicted = net.forward(inputs)
        current_loss = net.loss(predicted, labels)

    grads = tape.gradient(current_loss, net.trainable) # calcula los gradientes
    optimizer.apply_gradients(zip(grads, net.trainable)) # aplica el descenso
    
    if i%trace == 0:
        print('Epoch %d; MSE: %.4f; Acc: %.4f' % (i,current_loss.numpy(),net.accuracy(predicted,labels).numpy()))
    

Epoch 500; MSE: 0.2032; Acc: 0.4800
Epoch 1000; MSE: 0.0790; Acc: 1.0000
Epoch 1500; MSE: 0.0483; Acc: 1.0000
Epoch 2000; MSE: 0.0363; Acc: 1.0000
Epoch 2500; MSE: 0.0320; Acc: 1.0000
Epoch 3000; MSE: 0.0302; Acc: 1.0000


In [7]:
#print(inputs)
#print(labels)
#print(forward(inputs))
print(tf.argmax(labels,1))
print(tf.argmax(net.forward(inputs),1))

#print(variables)

predicted = net.forward(inputs)
print(net.accuracy(predicted,labels))

tf.Tensor([1 1 1 0 0 2 2 2 0 2 2 2 1 2 2 0 1 2 2 1 1 0 2 2 1], shape=(25,), dtype=int64)
tf.Tensor([1 1 1 0 0 2 2 2 0 2 2 2 1 2 2 0 1 2 2 1 1 0 2 2 1], shape=(25,), dtype=int64)
tf.Tensor(1.0, shape=(), dtype=float32)


In [8]:
# Región aprendida

import numpy as np

step = 0.1
vmin = -3
vmax = 3
values = np.arange(vmin, vmax, step)

%matplotlib notebook

import matplotlib.pyplot as plt
import matplotlib.patches as patches

fig = plt.figure()
ax = fig.add_subplot(111)
ylim = ax.set_ylim(vmin,vmax)
xlim = ax.set_xlim(vmin,vmax)

for x in values:
    for y in values:
        e = np.array([[x,y]])
        s = net.forward(tf.cast(e, dtype=tf.float32))
        o = tf.argmax(s,1)
        if o==0:
            c = 'r'
        elif o==1:
            c = 'g'
        else: c = 'b'
        ax.add_patch(patches.Rectangle((x, y), step, step, fill=True, color=c))





<IPython.core.display.Javascript object>