adding new example for multivariate dictionary.

sylvchev · Oct 14, 2015 · b5f3e70 · b5f3e70
1 parent a0f2a52
commit b5f3e70
Showing 1 changed file with 73 additions and 32 deletions.
diff --git a/example_multivariate.py b/example_multivariate.py
@@ -5,46 +5,49 @@
 from mdla import multivariate_sparse_encode
 from dict_metrics import hausdorff, emd, detectionRate
 from numpy.linalg import norm
-from numpy import array, arange, zeros
+from numpy import array, arange, zeros, min, max
 from numpy.random import rand, randn, permutation, randint
 
 # TODO: Add SNR, repeat experiments to make stats, make a fast and a 
-#       long version, use callback to compute distance
+#       long version, 
 
-def plot_univariate(objective_error, detection_rate, wasserstein, figname):
-    fig = plt.figure(figsize=(10,6))
+def plot_multivariate(objective_error, detection_rate, wasserstein,
+                    n_iter, figname):
+    fig = plt.figure(figsize=(15,5))
+    step = n_iter
 
     # plotting data from objective error
     objerr = fig.add_subplot(1,3,1)
-    oe = objerr.plot(arange(1, len(objective_error)+1), objective_error, 
+    _ = objerr.plot(step*arange(1, len(objective_error)+1), objective_error, 
                      color='green', label=r'Objective error')
-    # objerr.axis([0, len(objective_error)-1, 0, np.max(objective_error)])
-    # objerr.set_xticks(arange(0,len(objective_error)+1,10))
+    objerr.axis([0, len(objective_error)-1, min(objective_error),
+                 max(objective_error)])
+    objerr.set_xticks(arange(0, step*len(objective_error)+1, step))
     objerr.set_xlabel('Iteration')
     objerr.set_ylabel(r'Error (no unit)')
-    objerr.legend(loc='lower right')
+    objerr.legend(loc='upper right')
 
-    # plotting data from detection rate 0.97
+    # plotting data from detection rate 0.99
     detection = fig.add_subplot(1,3,2)        
-    detrat = detection.plot(arange(1,len(detection_rate)+1), detection_rate,
-                            color='magenta', label=r'Detection rate 0.97')
-    # detection.axis([0, len(detection_rate), 0, 100])
-    # detection.set_xticks(arange(0, len(detection_rate),10))
-    # detection.set_xlabel('Iteration')
+    _ = detection.plot(step*arange(1,len(detection_rate)+1), detection_rate,
+                            color='magenta', label=r'Detection rate 0.99')
+    detection.axis([0, len(detection_rate), 0, 100])
+    detection.set_xticks(arange(0, step*len(detection_rate)+1, step))
+    detection.set_xlabel('Iteration')
     detection.set_ylabel(r'Recovery rate (in %)')
-    detection.legend(loc='lower right')
+    detection.legend(loc='upper left')
 
     # plotting data from our metric
     met = fig.add_subplot(1,3,3)
-    wass = met.plot(arange(1, len(wasserstein)+1), 100-wasserstein,
+    _ = met.plot(step*arange(1, len(wasserstein)+1), 100-wasserstein,
                     label=r'$d_W$', color='red') 
-    # met.axis([0, len(wasserstein), 0, 100])
-    # met.set_xticks(arange(0,len(wasserstein),10))
-    detection.set_xlabel('Iteration')
-    detection.set_ylabel(r'Recovery rate (in %)')
-    met.legend(loc='lower right')
+    met.axis([0, len(wasserstein), 0, 100])
+    met.set_xticks(arange(0, step*len(wasserstein)+1, step))
+    met.set_xlabel('Iteration')
+    met.set_ylabel(r'Recovery rate (in %)')
+    met.legend(loc='upper left')
 
-    # plt.tight_layout(.5)
+    plt.tight_layout(.5)
     plt.savefig(figname+'.png')
 
 def _generate_testbed(kernel_init_len, n_nonzero_coefs, n_kernels,
@@ -57,8 +60,7 @@ def _generate_testbed(kernel_init_len, n_nonzero_coefs, n_kernels,
     Return the dictionary, the dataset and an array indicated how atoms are combined
     to obtain each sample
     """
-    print('Dictionary sampled from uniform distribution')
-    dico = [rand(kernel_init_len, n_dims) for i in range(n_kernels)]
+    dico = [randn(kernel_init_len, n_dims) for i in range(n_kernels)]
     for i in range(len(dico)):
         dico[i] /= norm(dico[i], 'fro')
 
@@ -91,34 +93,73 @@ def _generate_testbed(kernel_init_len, n_nonzero_coefs, n_kernels,
 n_samples, n_dims = 1500, 3
 n_features = kernel_init_len = 20
 n_nonzero_coefs = 3
-n_kernels, max_iter, learning_rate = 50, 25, 1.5
-n_jobs, batch_size = 4, 10
+n_kernels, max_iter, n_iter, learning_rate = 50, 10, 1, 1.5
+n_jobs, batch_size = -1, 10
 detection_rate, wasserstein, objective_error = list(), list(), list()
 
 generating_dict, X, code = _generate_testbed(kernel_init_len, n_nonzero_coefs,
                                              n_kernels, n_samples, n_features,
                                              n_dims)
 
-# Create a dictionary
+# # Create a dictionary
+# dict_init = [rand(kernel_init_len, n_dims) for i in range(n_kernels)]
+# for i in range(len(dict_init)):
+#     dict_init[i] /= norm(dict_init[i], 'fro')
+dict_init = None
+
 learned_dict = MiniBatchMultivariateDictLearning(n_kernels=n_kernels, 
-                                batch_size=batch_size, n_iter=1,
+                                batch_size=batch_size, n_iter=n_iter,
                                 n_nonzero_coefs=n_nonzero_coefs,
                                 n_jobs=n_jobs, learning_rate=learning_rate,
                                 kernel_init_len=kernel_init_len, verbose=1,
-                                dict_init=None, random_state=rng_global)
+                                dict_init=dict_init, random_state=rng_global)
+
 # Update learned dictionary at each iteration and compute a distance
 # with the generating dictionary
 for i in range(max_iter):
     learned_dict = learned_dict.partial_fit(X)
     # Compute the detection rate
     detection_rate.append(detectionRate(learned_dict.kernels_,
-                                        generating_dict, 0.97))
+                                        generating_dict, 0.99))
     # Compute the Wasserstein distance
     wasserstein.append(emd(learned_dict.kernels_, generating_dict,
                         'chordal', scale=True))
     # Get the objective error
     objective_error.append(array(learned_dict.error_ ).sum())
 
-plot_univariate(array(objective_error), array(detection_rate),
-                array(wasserstein), 'univariate-case')
+plot_multivariate(array(objective_error), array(detection_rate),
+                100.-array(wasserstein), n_iter, 'multivariate-case')
+
+# Another possibility is to rely on a callback function such as 
+def callback_distance(loc):
+    ii, iter_offset = loc['ii'], loc['iter_offset']
+    n_batches = loc['n_batches']
+    if np.mod((ii-iter_offset)/int(n_batches), n_iter) == 0:
+        # Compute distance only every 5 iterations, as in previous case
+        d = loc['dict_obj']
+        d.wasserstein.append(emd(loc['dictionary'], d.generating_dict, 
+                                 'chordal', scale=True))
+        d.detection_rate.append(detectionRate(loc['dictionary'],
+                                              d.generating_dict, 0.99))
+        d.objective_error.append(loc['current_cost']) 
+
+# reinitializing the random generator
+learned_dict2 = MiniBatchMultivariateDictLearning(n_kernels=n_kernels, 
+                                batch_size=batch_size, n_iter=max_iter*n_iter,
+                                n_nonzero_coefs=n_nonzero_coefs,
+                                callback=callback_distance,
+                                n_jobs=n_jobs, learning_rate=learning_rate,
+                                kernel_init_len=kernel_init_len, verbose=1,
+                                dict_init=dict_init, random_state=rng_global)
+learned_dict2.generating_dict = list(generating_dict)
+learned_dict2.wasserstein = list()
+learned_dict2.detection_rate = list()
+learned_dict2.objective_error = list()
+
+learned_dict2 = learned_dict2.fit(X)
+
+plot_multivariate(array(learned_dict2.objective_error),
+                array(learned_dict2.detection_rate),
+                100.-array(learned_dict2.wasserstein),
+                n_iter=1, figname='multivariate-case-callback')