### Redes con tensorflow
#### Por Francisco Serradilla

#### Tareas

* [x] Entrenar el perceptrón multicapa suministrado.
* [x] Ampliarlo para meter más capas, usar activación relu y evaluar con un conjunto de test.
* Entrenar con algunos de los problemas suministrados.
* (Opcional) Probar otros optimizadores.
* (Opcional) Añadir dropout. ¿Mejora la generalización con alguno de los problemas suministrados?

In [1]:
# Creación de grafos

print('Loading tensorflow...')
import tensorflow as tf
print('Loaded')

# Create a Constant op that produces a 1x2 matrix.  The op is
# added as a node to the default graph.
# The value returned by the constructor represents the output of the Constant op.
matrix1 = tf.constant([[3., 3.]])

# Create another Constant that produces a 2x1 matrix.
matrix2 = tf.constant([[2.],[2.]])

# Create a Matmul op that takes 'matrix1' and 'matrix2' as inputs.
# The returned value, 'product', represents the result of the matrix multiplication.
product = tf.matmul(matrix1, matrix2)

product

Loading tensorflow...
Loaded


<tf.Tensor 'MatMul:0' shape=(1, 1) dtype=float32>

In [2]:
# Ejecutar un grafo

# Launch the default graph.
sess = tf.Session()
# To run the matmul op we call the session 'run()' method, passing ‘product' which represents the output of the matmul op.  This indicates to the call that we want to get the output of the matmul op back.
# All inputs needed by the op are run automatically by the session.  They typically are run in parallel.
# The call 'run(product)' thus causes the execution of three ops in the graph: the two constants and matmul. The output of the op is returned in 'result' as a numpy `ndarray` object.
result = sess.run(product)
print(result)
# ==> [[ 12.]]

# Close the Session when we're done.
sess.close()

[[12.]]


In [3]:
# Variables

# Create a Variable, that will be initialized to the scalar value 0.
state = tf.Variable(0, name="counter")

# Create an Op to add one to `state`.
one = tf.constant(1)
new_value = tf.add(state, one)
update = tf.assign(state, new_value)

# Variables must be initialized by running an `init` Op after having launched the graph.  
init_op = tf.global_variables_initializer() # We first have to add the `init` Op to the graph

with tf.Session() as sess: # Launch the graph and run the ops
  sess.run(init_op) # Run the 'init' op
  print(sess.run(state)) # Print the initial value of 'state'
  for _ in range(3): # Run the op that updates 'state' and print 'state'.
    sess.run(update)
    print(sess.run(state))

Instructions for updating:
Colocations handled automatically by placer.
0
1
2
3


In [4]:
# fetches

input1 = tf.constant(3.0)
input2 = tf.constant(2.0)
input3 = tf.constant(5.0)
intermed = tf.add(input2, input3)
mul = tf.multiply(input1, intermed)

with tf.Session() as sess:
  result = sess.run([mul, intermed]) # fetches -> lo que se quiere obtener del cálculo
  print(result)

[21.0, 7.0]


In [5]:
# placeholders

input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)
output = tf.multiply(input1, input2)

with tf.Session() as sess:
  print(sess.run(output, feed_dict={input1:[7.], input2:[2.]}))

[14.]


In [119]:
# Carga ejemplos

import numpy as np

ni = 2 # número de entradas
nh = 15 # número de neuronas en capa oculta
no = 3 # número de neuronas en capa de salida
capas = 5 #número de capas ocultas de la red

# carga datos de entrenamiento
d = np.loadtxt("samples/circulo.txt")
inputs = d[:,:ni]

outputs = d[:,ni:]


In [94]:
# Creación de la red
# Define un perceptrón multicapa con 2 capas usando RMS como medida del error y back proagation como algoritmo de entrenamiento

import tensorflow as tf

# un placeholder es un punto de comunicación de datos entre nuestra app y la librería tensorflow
# creamos un placeholder para indicar las entradas a la red de todos los ejemplos
e = tf.placeholder(tf.float32, [None, ni]) # None indica que la primera dimensión no es fija (el número de ejemplos)

# un nuevo placeholder para indicar las salidas deseadas
d = tf.placeholder(tf.float32, [None, no])

# las variables son matrices que residen fuera de python y no son modificadas directamente por nuestra app
W1 = tf.Variable(tf.random_uniform([ni, nh], -0.1, 0.1, dtype=tf.float32))
b1 = tf.Variable(tf.random_uniform([nh], -0.1, 0.1, dtype=tf.float32))
W2 = tf.Variable(tf.random_uniform([nh, no], -0.1, 0.1, dtype=tf.float32))
b2 = tf.Variable(tf.random_uniform([no], -0.1, 0.1, dtype=tf.float32))

# aquí definimos la propagación de la red
s1 = tf.nn.sigmoid(tf.add(tf.matmul(e, W1), b1))
s = tf.nn.sigmoid(tf.add(tf.matmul(s1, W2), b2))

print("s1")
print(s1)

s1
Tensor("Sigmoid_2:0", shape=(?, 7), dtype=float32)


In [59]:
# Entrenamiento

print("d")
print(d)
print("s")
print(s)
# definimos la función a minimizar (error cuadrático medio)
vRMS = tf.sqrt(tf.reduce_mean(tf.square(tf.subtract(d,s)), reduction_indices=0))
RMS = tf.reduce_mean(vRMS)

# definimos el algoritmo de aprendizaje a utilizar (descenso del gradiente sobre la función de coste)
train_step = tf.train.RMSPropOptimizer(0.01).minimize(RMS)

# definimos qué es un acierto  
correct_prediction = tf.equal(tf.argmax(s,1), tf.argmax(d,1))

# definimos la precisión como el porcentaje de aciertos
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# definimos la inicialización de las variables internas
init = tf.global_variables_initializer()

# iniciamos sesión con tensorflow y ejecutamos la inicialización
sess = tf.Session()
sess.run(init)

# ejecutamos el número de epochs indicados
epochs = 1000
trace = 100
for i in range(1,epochs+1):
  sess.run(train_step, feed_dict={e: inputs, d: outputs})
  if i%trace == 0:
    print ('Epoch: %d' % i)
    # calculamos RMS y precisión y la escribimos por pantalla
    print('RMS:',sess.run(RMS, feed_dict={e: inputs, d: outputs}))
    print ('Accuracy:',sess.run(accuracy, feed_dict={e: inputs, d: outputs}))
    
sess.close()

d
Tensor("Placeholder_25:0", shape=(?, 3), dtype=float32)
s
Tensor("Sigmoid_1:0", shape=(?, 3), dtype=float32)
Epoch: 100
RMS: 0.45564017
Accuracy: 0.48
Epoch: 200
RMS: 0.455374
Accuracy: 0.48
Epoch: 300
RMS: 0.42243877
Accuracy: 0.48
Epoch: 400
RMS: 0.3547264
Accuracy: 0.76
Epoch: 500
RMS: 0.3022972
Accuracy: 0.84
Epoch: 600
RMS: 0.26390263
Accuracy: 0.92
Epoch: 700
RMS: 0.23606855
Accuracy: 1.0
Epoch: 800
RMS: 0.21393009
Accuracy: 1.0
Epoch: 900
RMS: 0.19558491
Accuracy: 1.0
Epoch: 1000
RMS: 0.18010312
Accuracy: 1.0


In [72]:
# Cargar datos morosos 

ni = 9 # número de entradas
nh = 3 # número de neuronas en capa oculta
no = 1 # número de neuronas en capa de salida
capas = 2 #número de capas ocultas de la red

# carga datos de entrenamiento
d = np.loadtxt("samples/morosos-ent.txt")
inputs = d[:,:ni]

outputs = d[:,ni:]


In [89]:
# Cargar data2 class

ni = 2 # número de entradas
nh = 7 # número de neuronas en capa oculta
no = 1 # número de neuronas en capa de salida
capas = 5 #número de capas ocultas de la red

# carga datos de entrenamiento
d = np.loadtxt("samples/data_3classes_nonlinear_2D.txt")
inputs = d[:,:ni]

outputs = d[:,ni:]



In [81]:
# Cargar datos quinielas

ni = 60 # número de entradas
nh = 7 # número de neuronas en capa oculta
no = 3 # número de neuronas en capa de salida
capas = 4 #número de capas ocultas de la red

# carga datos de entrenamiento
d = np.loadtxt("samples/quinielas60-3-trn.txt")
inputs = d[:,:ni]

outputs = d[:,ni:]


In [84]:
# Cargar datos aprobados 

ni = 3 # número de entradas
nh = 7 # número de neuronas en capa oculta
no = 1 # número de neuronas en capa de salida
capas = 10 #número de capas ocultas de la red

# carga datos de entrenamiento
d = np.loadtxt("samples/aprobado-ent.txt")
inputs = d[:,:ni]

outputs = d[:,ni:]


In [120]:
# Creación de la red
# Define un perceptrón multicapa con 2 capas usando RMS como medida del error y back proagation como algoritmo de entrenamiento

import tensorflow as tf

# un placeholder es un punto de comunicación de datos entre nuestra app y la librería tensorflow
# creamos un placeholder para indicar las entradas a la red de todos los ejemplos
e = tf.placeholder(tf.float32, [None, ni]) # None indica que la primera dimensión no es fija (el número de ejemplos)

# un nuevo placeholder para indicar las salidas deseadas
d = tf.placeholder(tf.float32, [None, no])

# las variables son matrices que residen fuera de python y no son modificadas directamente por nuestra app
W = []
b = []

W.append(tf.Variable(tf.glorot_uniform_initializer()((ni, nh),dtype=tf.float32)))
b.append(tf.Variable(tf.glorot_uniform_initializer()([nh], dtype=tf.float32)))
for _ in range (1,capas-1):
    W.append(tf.Variable(tf.glorot_uniform_initializer()((nh, nh), dtype=tf.float32)))
    b.append(tf.Variable(tf.glorot_uniform_initializer()([nh], dtype=tf.float32)))

W.append(tf.Variable(tf.glorot_uniform_initializer()((nh, no),  dtype=tf.float32)))
b.append(tf.Variable(tf.glorot_uniform_initializer()([no], dtype=tf.float32)))

# aquí definimos la propagación de la red
s = []
s.append(tf.nn.relu(tf.add(tf.matmul(e, W[0]), b[0])))
for i in range (capas - 1):
    s.append(tf.nn.relu(tf.add(tf.matmul(s[i], W[i+1]), b[i+1])))
    
print("s")
print(s)


s
[<tf.Tensor 'Relu_95:0' shape=(?, 15) dtype=float32>, <tf.Tensor 'Relu_96:0' shape=(?, 15) dtype=float32>, <tf.Tensor 'Relu_97:0' shape=(?, 15) dtype=float32>, <tf.Tensor 'Relu_98:0' shape=(?, 15) dtype=float32>, <tf.Tensor 'Relu_99:0' shape=(?, 3) dtype=float32>]


In [127]:
# Entrenamiento

# definimos la función a minimizar (error cuadrático medio)
vRMS = tf.sqrt(tf.reduce_mean(tf.square(tf.subtract(d,s[capas-1])), reduction_indices=0))
RMS = tf.reduce_mean(vRMS)

# definimos el algoritmo de aprendizaje a utilizar (descenso del gradiente sobre la función de coste)
train_step = tf.train.AdamOptimizer().minimize(RMS)

# definimos qué es un acierto  
correct_prediction = tf.equal(tf.argmax(s[capas-1],1), tf.argmax(d,1))

# definimos la precisión como el porcentaje de aciertos
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# definimos la inicialización de las variables internas
init = tf.global_variables_initializer()

# iniciamos sesión con tensorflow y ejecutamos la inicialización
sess = tf.Session()
sess.run(init)

# ejecutamos el número de epochs indicados
epochs = 1000
trace = 100
for i in range(1,epochs+1):
  sess.run(train_step, feed_dict={e: inputs, d: outputs})
  if i%trace == 0:
    print ('Epoch: %d' % i)
    # calculamos RMS y precisión y la escribimos por pantalla
    print('RMS:',sess.run(RMS, feed_dict={e: inputs, d: outputs}))
    print ('Accuracy:',sess.run(accuracy, feed_dict={e: inputs, d: outputs}))
    
sess.close()

Epoch: 100
RMS: 0.39095473
Accuracy: 0.68
Epoch: 200
RMS: 0.33947322
Accuracy: 0.68
Epoch: 300
RMS: 0.33885527
Accuracy: 0.68
Epoch: 400
RMS: 0.33893725
Accuracy: 0.68
Epoch: 500
RMS: 0.33864462
Accuracy: 0.68
Epoch: 600
RMS: 0.33893752
Accuracy: 0.68
Epoch: 700
RMS: 0.33854952
Accuracy: 0.68
Epoch: 800
RMS: 0.33831987
Accuracy: 0.68
Epoch: 900
RMS: 0.33903947
Accuracy: 0.68
Epoch: 1000
RMS: 0.33879113
Accuracy: 0.68


In [126]:
#Dropout 
y = tf.placeholder("float", [None, 3])

keep_prob = tf.placeholder(tf.float32)  # DROP-OUT here
drop_out = tf.nn.dropout(s[0], keep_prob)  # DROP-OUT here

out_layer = tf.matmul(s[0], W[1]) + b[1]
# Entrenamiento CON DROPOUT 
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=out_layer,labels= y))
optimizer = tf.train.AdamOptimizer().minimize(cost)
# definimos la función a minimizar (error cuadrático medio)

print("dropout")
print(drop_out)
print("out_layer")
print(out_layer)
print("cost")
print(cost)
vRMS = tf.sqrt(tf.reduce_mean(tf.square(tf.subtract(d,s[capas-1])), reduction_indices=0))
RMS = tf.reduce_mean(vRMS)

# definimos el algoritmo de aprendizaje a utilizar (descenso del gradiente sobre la función de coste)
train_step = tf.train.AdamOptimizer().minimize(RMS)

# definimos qué es un acierto  
correct_prediction = tf.equal(tf.argmax(s[capas-1],1), tf.argmax(d,1))

# definimos la precisión como el porcentaje de aciertos
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# definimos la inicialización de las variables internas
init = tf.global_variables_initializer()

# iniciamos sesión con tensorflow y ejecutamos la inicialización
sess = tf.Session()
sess.run(init)

# ejecutamos el número de epochs indicados
epochs = 1000
trace = 100
for i in range(1,epochs+1):
  sess.run(train_step, feed_dict={e: inputs, d: outputs})
  if i%trace == 0:
    print ('Epoch: %d' % i)
    # calculamos RMS y precisión y la escribimos por pantalla
    print('RMS:',sess.run(RMS, feed_dict={e: inputs, d: outputs}))
    print ('Accuracy:',sess.run(accuracy, feed_dict={e: inputs, d: outputs}))
    
sess.close()

dropout
Tensor("dropout_24/mul:0", shape=(?, 15), dtype=float32)
out_layer
Tensor("add_125:0", shape=(?, 15), dtype=float32)
cost
Tensor("Mean_173:0", shape=(), dtype=float32)
Epoch: 100
RMS: 0.40645924
Accuracy: 0.52
Epoch: 200
RMS: 0.16993956
Accuracy: 1.0
Epoch: 300
RMS: 0.07047657
Accuracy: 1.0
Epoch: 400
RMS: 0.009624799
Accuracy: 1.0
Epoch: 500
RMS: 0.0029722613
Accuracy: 1.0
Epoch: 600
RMS: 0.002685617
Accuracy: 1.0
Epoch: 700
RMS: 0.0022879157
Accuracy: 1.0
Epoch: 800
RMS: 0.0023215988
Accuracy: 1.0
Epoch: 900
RMS: 0.0021818297
Accuracy: 1.0
Epoch: 1000
RMS: 0.0020713555
Accuracy: 1.0
