huggingface · gante · Mar 27, 2024 · Mar 5, 2024 · Mar 5, 2024 · Mar 5, 2024
diff --git a/src/transformers/generation/stopping_criteria.py b/src/transformers/generation/stopping_criteria.py
@@ -142,12 +142,11 @@ class EOSTokenCriteria(StoppingCriteria):
     def __init__(self, eos_token_id: Union[int, List[int]]):
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
-        self.eos_token_id = eos_token_id
+        self.eos_token_id = torch.tensor(eos_token_id)
 
     @add_start_docstrings(STOPPING_CRITERIA_INPUTS_DOCSTRING)
     def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs) -> torch.BoolTensor:
-        eos_token_ids = torch.tensor(self.eos_token_id, dtype=torch.int64, device=input_ids.device)
-        is_done = (input_ids[:, -1].unsqueeze(1) == eos_token_ids).any(dim=1)
+        is_done = torch.isin(input_ids, self.eos_token_id.to(input_ids.device))[:, -1]
         return is_done
 
 

diff --git a/src/transformers/generation/utils.py b/src/transformers/generation/utils.py
@@ -1542,7 +1542,6 @@ def generate(
                 logits_warper=self._get_logits_warper(generation_config) if generation_config.do_sample else None,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1557,7 +1556,6 @@ def generate(
                 logits_processor=prepared_logits_processor,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1577,7 +1575,6 @@ def generate(
                 logits_processor=prepared_logits_processor,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1606,7 +1603,6 @@ def generate(
                 logits_warper=logits_warper,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1640,7 +1636,6 @@ def generate(
                 logits_processor=prepared_logits_processor,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1680,7 +1675,6 @@ def generate(
                 logits_warper=logits_warper,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1714,7 +1708,6 @@ def generate(
                 logits_processor=prepared_logits_processor,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1788,7 +1781,6 @@ def typeerror():
                 logits_processor=prepared_logits_processor,
                 stopping_criteria=prepared_stopping_criteria,
                 pad_token_id=generation_config.pad_token_id,
-                eos_token_id=generation_config.eos_token_id,
                 output_scores=generation_config.output_scores,
                 output_logits=generation_config.output_logits,
                 return_dict_in_generate=generation_config.return_dict_in_generate,
@@ -1933,12 +1925,15 @@ def _contrastive_search(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -2400,12 +2395,15 @@ def _greedy_search(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -2704,12 +2702,15 @@ def _sample(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -3037,12 +3038,15 @@ def _beam_search(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private and beam scorer refactored
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -3445,12 +3449,15 @@ def _beam_sample(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private and beam scorer refactored
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -3806,12 +3813,15 @@ def _group_beam_search(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private and beam scorer refactored
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -4231,12 +4241,15 @@ def _constrained_beam_search(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private and beam scorer refactored
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]
@@ -4588,12 +4601,15 @@ def _assisted_decoding(
             )
             stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
         else:
+            # TODO remove when the method is totally private and beam scorer refactored
+            # need to get `eos_token_id` and add stopping criteria, so that generation does not go forever
             eos_token_id = [
-                criteria.eos_token_id for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
+                criteria.eos_token_id.tolist() for criteria in stopping_criteria if hasattr(criteria, "eos_token_id")
             ]
-            if not eos_token_id and self.generation_config.eos_token_id:
-                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
+            eos_token_id = eos_token_id[0] if eos_token_id else None
+            if eos_token_id is None and self.generation_config.eos_token_id is not None:
                 eos_token_id = self.generation_config.eos_token_id
+                stopping_criteria.append(EOSTokenCriteria(eos_token_id=eos_token_id))
 
         if isinstance(eos_token_id, int):
             eos_token_id = [eos_token_id]

diff --git a/tests/generation/test_stopping_criteria.py b/tests/generation/test_stopping_criteria.py
@@ -108,6 +108,7 @@ def test_eos_token_criteria(self):
 
         input_ids, scores = self._get_tensors(5)
         input_ids[:2, -1] = 0
+        input_ids[2, -1] = 1
         self.assertListEqual(criteria(input_ids, scores).tolist(), [True, True, False])
 
         input_ids, scores = self._get_tensors(5)