modelscope · Jintao-Huang · Feb 28, 2024 · Feb 6, 2024 · Feb 28, 2024 · Feb 28, 2024
diff --git a/swift/llm/utils/model.py b/swift/llm/utils/model.py
@@ -2373,6 +2373,13 @@ def get_model_tokenizer(
                 generation_config_path) and generation_config is None:
             model.generation_config = GenerationConfig.from_pretrained(
                 model_dir)
+        generation_config = getattr(model, 'generation_config', None)
+        # fix llama2 bug
+        if (generation_config is not None
+                and 0 < generation_config.temperature < 1
+                and generation_config.do_sample is False):
+            model.generation_config.do_sample = True
+            logger.warning('Setting model.generation_config.do_sample: True')
     return model, tokenizer
 
 

diff --git a/swift/llm/utils/utils.py b/swift/llm/utils/utils.py
@@ -770,11 +770,12 @@ def get_max_model_len(config: PretrainedConfig) -> Optional[int]:
     INF = int(1e9)
     max_model_len = INF
     possible_keys = [
-        'seq_len',  # qwen, chatglm
+        'seq_length',  # qwen, chatglm
         'max_position_embeddings',  # qwen1.5, llama2
         'n_positions',  # polylm, phi-2
         'model_max_length',  # baichuan2
         # others
+        'seq_len',
         'max_seq_len',
         'max_sequence_length',
         'max_seq_length',