From edd6655b04c9272ec20b321bf9dbbe639df113c3 Mon Sep 17 00:00:00 2001
From: ZheyuYe <zheyu.ye1995@gmail.com>
Date: Tue, 11 Aug 2020 14:49:36 +0800
Subject: [PATCH] lower tolerance for albert large and xlarge

---
 scripts/conversion_toolkits/convert_tf_hub_model.py | 11 ++++++-----
 1 file changed, 6 insertions(+), 5 deletions(-)

diff --git a/scripts/conversion_toolkits/convert_tf_hub_model.py b/scripts/conversion_toolkits/convert_tf_hub_model.py
index 504c5e036f..06d5caf8c4 100644
--- a/scripts/conversion_toolkits/convert_tf_hub_model.py
+++ b/scripts/conversion_toolkits/convert_tf_hub_model.py
@@ -464,17 +464,18 @@ def convert_qkv_weights(tf_prefix, mx_prefix, is_mlm):
     else:
         raise NotImplementedError
 
+    tolerance = 1E-2 if cfg.MODEL.num_layers == 24 else 1E-3
     def check_backbone(tested_model, tf_token_outputs_np):
         # test conversion results for backbone model
         tf_contextual_embedding = tf_token_outputs_np['sequence_output']
         tf_pooled_output = tf_token_outputs_np['pooled_output']
         contextual_embedding, pooled_output = \
             tested_model(mx_input_ids, mx_token_types, mx_valid_length)
-        assert_allclose(pooled_output.asnumpy(), tf_pooled_output, 1E-3, 1E-3)
+        assert_allclose(pooled_output.asnumpy(), tf_pooled_output, tolerance, tolerance)
         for i in range(batch_size):
             ele_valid_length = valid_length[i]
             assert_allclose(contextual_embedding[i, :ele_valid_length, :].asnumpy(),
-                            tf_contextual_embedding[i, :ele_valid_length, :], 1E-3, 1E-3)
+                            tf_contextual_embedding[i, :ele_valid_length, :], tolerance, tolerance)
 
     if not has_mlm:
         if test_conversion:
@@ -493,12 +494,12 @@ def check_backbone(tested_model, tf_token_outputs_np):
                 tf_mlm_scores = tf_mlm_outputs_np['mlm_logits'].reshape((batch_size, num_mask, -1))
                 contextual_embedding, pooled_output, mlm_scores = \
                     model(mx_input_ids, mx_token_types, mx_valid_length, mx_masked_positions)
-                assert_allclose(pooled_output.asnumpy(), tf_pooled_output, 1E-3, 1E-3)
-                assert_allclose(mlm_scores.asnumpy(), tf_mlm_scores, 1E-3, 1E-3)
+                assert_allclose(pooled_output.asnumpy(), tf_pooled_output, tolerance, tolerance)
+                assert_allclose(mlm_scores.asnumpy(), tf_mlm_scores, tolerance, tolerance)
                 for i in range(batch_size):
                     ele_valid_length = valid_length[i]
                     assert_allclose(contextual_embedding[i, :ele_valid_length, :].asnumpy(),
-                                    tf_contextual_embedding[i, :ele_valid_length, :], 1E-3, 1E-3)
+                                    tf_contextual_embedding[i, :ele_valid_length, :], tolerance, tolerance)
         model.backbone_model.save_parameters(os.path.join(
             save_dir, 'model.params'), deduplicate=True)
         logging.info('Convert the backbone model in {} to {}/{}'.format(hub_model_dir,