PaddlePaddle · QiJune · Mar 12, 2018 · Mar 1, 2018 · Mar 1, 2018 · Mar 1, 2018
diff --git a/python/paddle/fluid/memory_optimization_transpiler.py b/python/paddle/fluid/memory_optimization_transpiler.py
@@ -118,7 +118,7 @@ def _find_var(self, block_desc, var_name, is_forward):
         else:
             return block_desc.find_var_recursive(str(var_name))
 
-    def memory_optimize(self):
+    def memory_optimize(self, level=0):
         def check_var_validity(block_desc, x, is_forward):
             if str(x) == "@EMPTY@":
                 return False
@@ -136,6 +136,18 @@ def check_var_validity(block_desc, x, is_forward):
                 return False
             return True
 
+        def compare_shape(x_shape, cache_shape, opt_level):
+            if opt_level == 0:
+                return x_shape == cache_shape
+            if opt_level == 1:
+                if (x_shape[0] == -1) ^ (cache_shape[0] == -1):
+                    return False
+                x_size = abs(reduce(lambda x, y: x * y, x_shape))
+                cache_size = abs(reduce(lambda x, y: x * y, cache_shape))
+                if x_size <= cache_size:
+                    return True
+            return False
+
         self._build_graph()
         self._dataflow_analyze()
         self.pool = []
@@ -160,7 +172,8 @@ def check_var_validity(block_desc, x, is_forward):
                     for index, cache_pair in enumerate(self.pool):
                         cache_var = cache_pair[0]
                         cache_shape = cache_pair[1]
-                        if x_shape == cache_shape:
+                        if compare_shape(x_shape, cache_shape, level):
+                            # if x_shape == cache_shape:
                             if self._has_var(block_desc, cache_var, is_forward):
                                 x_dtype = self._find_var(block_desc, x,
                                                          is_forward).dtype()
@@ -267,7 +280,7 @@ def get_cfgs(input_program):
     return cfgs
 
 
-def memory_optimize(input_program):
+def memory_optimize(input_program, level=0):
     cfgs = get_cfgs(input_program)
     for cfg in cfgs:
-        cfg.memory_optimize()
+        cfg.memory_optimize(level)
diff --git a/python/paddle/fluid/tests/book_memory_optimization/test_memopt_image_classification_train.py b/python/paddle/fluid/tests/book_memory_optimization/test_memopt_image_classification_train.py
@@ -124,9 +124,9 @@ def conv_block(input, num_filter, groups, dropouts):
 
 accuracy = fluid.evaluator.Accuracy(input=predict, label=label)
 
-fluid.memory_optimize(fluid.default_main_program())
+fluid.memory_optimize(fluid.default_main_program(), level=1)
 
-BATCH_SIZE = 128
+BATCH_SIZE = 16
 PASS_NUM = 1
 
 # fix the order of training data
@@ -155,7 +155,7 @@ def conv_block(input, num_filter, groups, dropouts):
             pass_acc))
         # this model is slow, so if we can train two mini batch, we think it works properly.
 
-        if i > 2:
+        if i > 0:
             exit(0)
         if math.isnan(float(loss)):
             sys.exit("got NaN loss, training failed.")