predibase · geoffreyangus · Nov 21, 2023 · Nov 21, 2023 · Nov 21, 2023
diff --git a/server/lorax_server/models/flash_llama.py b/server/lorax_server/models/flash_llama.py
@@ -4,7 +4,7 @@
 
 from loguru import logger
 from opentelemetry import trace
-from transformers.models.llama import LlamaTokenizer, LlamaTokenizerFast
+from transformers import AutoTokenizer
 from tqdm import tqdm
 from typing import Dict, Optional
 
@@ -45,22 +45,13 @@ def __init__(
         else:
             raise NotImplementedError("FlashLlama is only available on GPU")
 
-        try:
-            tokenizer = LlamaTokenizer.from_pretrained(
-                model_id,
-                revision=revision,
-                padding_side="left",
-                truncation_side="left",
-                trust_remote_code=trust_remote_code,
-            )
-        except Exception:
-            tokenizer = LlamaTokenizerFast.from_pretrained(
-                model_id,
-                revision=revision,
-                padding_side="left",
-                truncation_side="left",
-                trust_remote_code=trust_remote_code,
-            )
+        tokenizer = AutoTokenizer.from_pretrained(
+            model_id,
+            revision=revision,
+            padding_side="left",
+            truncation_side="left",
+            trust_remote_code=trust_remote_code,
+        )
 
         config = LlamaConfig.from_pretrained(
             model_id, revision=revision, trust_remote_code=trust_remote_code

diff --git a/server/requirements.txt b/server/requirements.txt
@@ -1,4 +1,4 @@
-accelerate==0.19.0 ; python_version >= "3.9" and python_version < "4.0"
+accelerate==0.24.1 ; python_version >= "3.9" and python_version < "4.0"
 aiohttp==3.8.5 ; python_version >= "3.9" and python_version < "4.0"
 aiosignal==1.3.1 ; python_version >= "3.9" and python_version < "4.0"
 async-timeout==4.0.2 ; python_version >= "3.9" and python_version < "4.0"
@@ -62,7 +62,7 @@ texttable==1.6.7 ; python_version >= "3.9" and python_version < "4.0"
 tokenizers==0.13.3 ; python_version >= "3.9" and python_version < "4.0"
 torch==2.0.1 ; python_version >= "3.9" and python_version < "4.0"
 tqdm==4.65.0 ; python_version >= "3.9" and python_version < "4.0"
-transformers==4.29.2 ; python_version >= "3.9" and python_version < "4.0"
+transformers==4.35.2 ; python_version >= "3.9" and python_version < "4.0"
 typer==0.6.1 ; python_version >= "3.9" and python_version < "4.0"
 typing-extensions==4.7.1 ; python_version >= "3.9" and python_version < "4.0"
 tzdata==2023.3 ; python_version >= "3.9" and python_version < "4.0"