csfoo
diff --git a/‎…N/adversarial_autoencoder/aae_pytorch.py‎ ‎…E/adversarial_autoencoder/aae_pytorch.py‎GAN/adversarial_autoencoder/aae_pytorch.py renamed to VAE/adversarial_autoencoder/aae_pytorch.py b/‎…N/adversarial_autoencoder/aae_pytorch.py‎ ‎…E/adversarial_autoencoder/aae_pytorch.py‎GAN/adversarial_autoencoder/aae_pytorch.py renamed to VAE/adversarial_autoencoder/aae_pytorch.py
diff --git a/‎VAE/adversarial_autoencoder/aae_tensorflow.py‎
Lines changed: 141 additions & 0 deletions b/‎VAE/adversarial_autoencoder/aae_tensorflow.py‎
Lines changed: 141 additions & 0 deletions
diff --git a/‎VAE/adversarial_vb/avb_pytorch.py‎
Lines changed: 135 additions & 0 deletions b/‎VAE/adversarial_vb/avb_pytorch.py‎
Lines changed: 135 additions & 0 deletions
@@ -0,0 +1,141 @@
+import tensorflow as tf
+import numpy as np
+import matplotlib.pyplot as plt
+import matplotlib.gridspec as gridspec
+import os
+from torch.autograd import Variable
+from tensorflow.examples.tutorials.mnist import input_data
+
+
+mnist = input_data.read_data_sets('../../MNIST_data', one_hot=True)
+mb_size = 32
+z_dim = 10
+X_dim = mnist.train.images.shape[1]
+y_dim = mnist.train.labels.shape[1]
+h_dim = 128
+c = 0
+lr = 1e-3
+
+
+def plot(samples):
+    fig = plt.figure(figsize=(4, 4))
+    gs = gridspec.GridSpec(4, 4)
+    gs.update(wspace=0.05, hspace=0.05)
+
+    for i, sample in enumerate(samples):
+        ax = plt.subplot(gs[i])
+        plt.axis('off')
+        ax.set_xticklabels([])
+        ax.set_yticklabels([])
+        ax.set_aspect('equal')
+        plt.imshow(sample.reshape(28, 28), cmap='Greys_r')
+
+    return fig
+
+
+def xavier_init(size):
+    in_dim = size[0]
+    xavier_stddev = 1. / tf.sqrt(in_dim / 2.)
+    return tf.random_normal(shape=size, stddev=xavier_stddev)
+
+
+""" Q(z|X) """
+X = tf.placeholder(tf.float32, shape=[None, X_dim])
+z = tf.placeholder(tf.float32, shape=[None, z_dim])
+
+Q_W1 = tf.Variable(xavier_init([X_dim, h_dim]))
+Q_b1 = tf.Variable(tf.zeros(shape=[h_dim]))
+
+Q_W2 = tf.Variable(xavier_init([h_dim, z_dim]))
+Q_b2 = tf.Variable(tf.zeros(shape=[z_dim]))
+
+theta_Q = [Q_W1, Q_W2, Q_b1, Q_b2]
+
+
+def Q(X):
+    h = tf.nn.relu(tf.matmul(X, Q_W1) + Q_b1)
+    z = tf.matmul(h, Q_W2) + Q_b2
+    return z
+
+
+""" P(X|z) """
+P_W1 = tf.Variable(xavier_init([z_dim, h_dim]))
+P_b1 = tf.Variable(tf.zeros(shape=[h_dim]))
+
+P_W2 = tf.Variable(xavier_init([h_dim, X_dim]))
+P_b2 = tf.Variable(tf.zeros(shape=[X_dim]))
+
+theta_P = [P_W1, P_W2, P_b1, P_b2]
+
+
+def P(z):
+    h = tf.nn.relu(tf.matmul(z, P_W1) + P_b1)
+    logits = tf.matmul(h, P_W2) + P_b2
+    prob = tf.nn.sigmoid(logits)
+    return prob, logits
+
+
+""" D(z) """
+D_W1 = tf.Variable(xavier_init([z_dim, h_dim]))
+D_b1 = tf.Variable(tf.zeros(shape=[h_dim]))
+
+D_W2 = tf.Variable(xavier_init([h_dim, 1]))
+D_b2 = tf.Variable(tf.zeros(shape=[1]))
+
+theta_D = [D_W1, D_W2, D_b1, D_b2]
+
+
+def D(z):
+    h = tf.nn.relu(tf.matmul(z, D_W1) + D_b1)
+    logits = tf.matmul(h, D_W2) + D_b2
+    prob = tf.nn.sigmoid(logits)
+    return prob
+
+
+""" Training """
+z_sample = Q(X)
+_, logits = P(z_sample)
+
+# Sample from random z
+X_samples, _ = P(z)
+
+# E[log P(X|z)]
+recon_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits, X))
+
+# Adversarial loss to approx. Q(z|X)
+D_real = D(z)
+D_fake = D(z_sample)
+
+D_loss = -tf.reduce_mean(tf.log(D_real) + tf.log(1. - D_fake))
+G_loss = -tf.reduce_mean(tf.log(D_fake))
+
+AE_solver = tf.train.AdamOptimizer().minimize(recon_loss, var_list=theta_P + theta_Q)
+D_solver = tf.train.AdamOptimizer().minimize(D_loss, var_list=theta_D)
+G_solver = tf.train.AdamOptimizer().minimize(G_loss, var_list=theta_Q)
+
+sess = tf.Session()
+sess.run(tf.initialize_all_variables())
+
+if not os.path.exists('out/'):
+    os.makedirs('out/')
+
+i = 0
+
+for it in range(1000000):
+    X_mb, _ = mnist.train.next_batch(mb_size)
+    z_mb = np.random.randn(mb_size, z_dim)
+
+    _, recon_loss_curr = sess.run([AE_solver, recon_loss], feed_dict={X: X_mb})
+    _, D_loss_curr = sess.run([D_solver, D_loss], feed_dict={X: X_mb, z: z_mb})
+    _, G_loss_curr = sess.run([G_solver, G_loss], feed_dict={X: X_mb})
+
+    if it % 1000 == 0:
+        print('Iter: {}; D_loss: {:.4}; G_loss: {:.4}; Recon_loss: {:.4}'
+              .format(it, D_loss_curr, G_loss_curr, recon_loss_curr))
+
+        samples = sess.run(X_samples, feed_dict={z: np.random.randn(16, z_dim)})
+
+        fig = plot(samples)
+        plt.savefig('out/{}.png'.format(str(i).zfill(3)), bbox_inches='tight')
+        i += 1
+        plt.close(fig)
@@ -0,0 +1,135 @@
+import torch
+import torch.nn
+import torch.nn.functional as nn
+import torch.autograd as autograd
+import torch.optim as optim
+import numpy as np
+import matplotlib.pyplot as plt
+import matplotlib.gridspec as gridspec
+import os
+from torch.autograd import Variable
+from tensorflow.examples.tutorials.mnist import input_data
+
+
+mnist = input_data.read_data_sets('../../MNIST_data', one_hot=True)
+mb_size = 32
+z_dim = 10
+eps_dim = 4
+X_dim = mnist.train.images.shape[1]
+y_dim = mnist.train.labels.shape[1]
+h_dim = 128
+cnt = 0
+lr = 1e-3
+
+
+# Encoder: q(z|x,eps)
+Q = torch.nn.Sequential(
+    torch.nn.Linear(X_dim + eps_dim, h_dim),
+    torch.nn.ReLU(),
+    torch.nn.Linear(h_dim, z_dim)
+)
+
+# Decoder: p(x|z)
+P = torch.nn.Sequential(
+    torch.nn.Linear(z_dim, h_dim),
+    torch.nn.ReLU(),
+    torch.nn.Linear(h_dim, X_dim),
+    torch.nn.Sigmoid()
+)
+
+# Discriminator: d(z)
+D = torch.nn.Sequential(
+    torch.nn.Linear(z_dim, h_dim),
+    torch.nn.ReLU(),
+    torch.nn.Linear(h_dim, 1),
+    torch.nn.Sigmoid()
+)
+
+
+def reset_grad():
+    Q.zero_grad()
+    P.zero_grad()
+    D.zero_grad()
+
+
+def sample_X(size, include_y=False):
+    X, y = mnist.train.next_batch(size)
+    X = Variable(torch.from_numpy(X))
+
+    if include_y:
+        y = np.argmax(y, axis=1).astype(np.int)
+        y = Variable(torch.from_numpy(y))
+        return X, y
+
+    return X
+
+
+Q_solver = optim.Adam(Q.parameters(), lr=lr)
+P_solver = optim.Adam(P.parameters(), lr=lr)
+D_solver = optim.Adam(D.parameters(), lr=lr)
+
+
+for it in range(1000000):
+    X = sample_X(mb_size)
+    eps = Variable(torch.randn(mb_size, eps_dim))
+    X_eps = torch.cat([X, eps], 1)
+    z = Variable(torch.randn(mb_size, z_dim))
+
+    # Optimize VAE w.r.t. reconstruction loss
+    z_sample = Q(X_eps)
+    X_sample = P(z_sample)
+
+    recon_loss = nn.binary_cross_entropy(X_sample, X)
+
+    recon_loss.backward()
+    P_solver.step()
+    Q_solver.step()
+    reset_grad()
+
+    # Discriminator D(z)
+    z_fake = Q(X_eps)
+    D_real = D(z)
+    D_fake = D(z_fake)
+
+    D_loss = -torch.mean(torch.log(D_real) + torch.log(1 - D_fake))
+
+    D_loss.backward()
+    D_solver.step()
+    reset_grad()
+
+    # Q(z|X,eps)
+    z_fake = Q(X_eps)
+    D_fake = D(z_fake)
+
+    G_loss = -torch.mean(torch.log(D_fake))
+
+    G_loss.backward()
+    Q_solver.step()
+    reset_grad()
+
+    # Print and plot every now and then
+    if it % 1000 == 0:
+        print('Iter-{}; D_loss: {:.4}; G_loss: {:.4}; recon_loss: {:.4}'
+              .format(it, D_loss.data[0], G_loss.data[0], recon_loss.data[0]))
+
+        samples = P(z).data.numpy()[:16]
+
+        fig = plt.figure(figsize=(4, 4))
+        gs = gridspec.GridSpec(4, 4)
+        gs.update(wspace=0.05, hspace=0.05)
+
+        for i, sample in enumerate(samples):
+            ax = plt.subplot(gs[i])
+            plt.axis('off')
+            ax.set_xticklabels([])
+            ax.set_yticklabels([])
+            ax.set_aspect('equal')
+            plt.imshow(sample.reshape(28, 28), cmap='Greys_r')
+
+        if not os.path.exists('out/'):
+            os.makedirs('out/')
+
+        plt.savefig('out/{}.png'
+                    .format(str(cnt).zfill(3)), bbox_inches='tight')
+        cnt += 1
+        plt.close(fig)