cdpierse · e-tornike · Oct 26, 2022
diff --git a/transformers_interpret/explainer.py b/transformers_interpret/explainer.py
@@ -121,7 +121,7 @@ def _make_input_reference_pair(self, text: Union[List, str]) -> Tuple[torch.Tens
             raise NotImplementedError("Lists of text are not currently supported.")
 
         text_ids = self.encode(text)
-        input_ids = self.tokenizer.encode(text, add_special_tokens=True)
+        input_ids = self.tokenizer.encode(text, add_special_tokens=False, truncation=True, max_length=self.tokenizer.model_max_length)
 
         # if no special tokens were added
         if len(text_ids) == len(input_ids):

diff --git a/transformers_interpret/explainers/text/sequence_classification.py b/transformers_interpret/explainers/text/sequence_classification.py
@@ -91,7 +91,7 @@ def _get_id2label_and_label2id_dict(
         return id2label, label2id
 
     def encode(self, text: str = None) -> list:
-        return self.tokenizer.encode(text, add_special_tokens=False)
+        return self.tokenizer.encode(text, add_special_tokens=False, truncation=True, max_length=self.tokenizer.model_max_length)
 
     def decode(self, input_ids: torch.Tensor) -> list:
         "Decode 'input_ids' to string using tokenizer"