huggingface · ArthurZucker · Apr 3, 2024 · Feb 22, 2024 · Feb 22, 2024 · Feb 22, 2024
diff --git a/src/transformers/models/whisper/generation_whisper.py b/src/transformers/models/whisper/generation_whisper.py
@@ -759,6 +759,8 @@ def generate_with_fallback(
         do_condition_on_prev_tokens,
         kwargs,
     ):
+        kwargs = copy.copy(kwargs)
+
         # 6.6 Batch generate current chunk
         seek_sequence_list = [None for _ in range(cur_bsz)]
         seek_outputs_list = [None for _ in range(cur_bsz)]
@@ -773,8 +775,12 @@ def generate_with_fallback(
             generation_config.do_sample = temperature is not None and temperature > 0.0
 
             generation_config.temperature = temperature if generation_config.do_sample else 1.0
-            generation_config.num_beams = kwargs.pop("num_beams", 1) if not generation_config.do_sample else 1
+            generation_config.num_beams = kwargs.get("num_beams", 1) if not generation_config.do_sample else 1
 
+            generate_kwargs = copy.copy(kwargs)
+            for key in ["do_sample", "temperature", "num_beams"]:
+                if key in generate_kwargs:
+                    del generate_kwargs[key]
             seek_outputs = super().generate(
                 segment_input,
                 generation_config,
@@ -783,7 +789,7 @@ def generate_with_fallback(
                 prefix_allowed_tokens_fn,
                 synced_gpus,
                 decoder_input_ids=decoder_input_ids,
-                **kwargs,
+                **generate_kwargs,
             )
 
             # post-process sequence tokens and outputs to be in list form