serge-chat · gaby · May 26, 2023 · May 25, 2023 · May 26, 2023 · May 26, 2023
diff --git a/README.md b/README.md
@@ -35,15 +35,15 @@ Setting up Serge on Kubernetes or docker compose can be found in the wiki: https
 
 Currently the following models are supported:
 
-- Alpaca 7B
-- Alpaca 7B-native
-- Alpaca 13B
-- Alpaca 30B
-- GPT4All
-- Vicuna 7B
-- Vicuna 13B
-- Open Assistant 13B
-- Open Assistant 30B
+- GPT4-Alpaca-LoRA-30B
+- Alpaca-LoRA-65B
+- OpenAssistant-30B
+- GPT4All-13B
+- Stable-Vicuna-13B
+- Guanaco-7B
+- Guanaco-13B
+- Guanaco-33B
+- Guanaco-65B
 
 If you have existing weights from another project you can add them to the `serge_weights` volume using `docker cp`.
 
@@ -86,4 +86,4 @@ DOCKER_BUILDKIT=1 docker compose up -d --build
 - [ ] LangChain integration
 - [ ] User profiles & authentication
 
-And a lot more!
+And a lot more!
diff --git a/api/src/serge/routers/model.py b/api/src/serge/routers/model.py
@@ -15,51 +15,51 @@
 )
 
 models_info = {
-    "Alpaca-7B": [
-        "nsarrazin/alpaca",
-        "alpaca-7B-ggml/ggml-model-q4_0.bin", 
-        4.20E9,
+    "GPT4AlpacaLoRA-30B": [
+        "TheBloke/gpt4-alpaca-lora-30B-4bit-GGML",
+        "gpt4-alpaca-lora-30b.ggmlv3.q5_1.bin",
+        24.4E9,
         ],
-    "Alpaca-7B-native": [
-        "nsarrazin/alpaca", 
-        "alpaca-native-7B-ggml/ggml-model-q4_0.bin", 
-        4.20E9,
+    "AlpacaLoRA-65B": [
+        "TheBloke/alpaca-lora-65B-GGML",
+        "alpaca-lora-65B.ggmlv3.q5_1.bin",
+        48.97E9,
         ],
-    "Alpaca-13B": [
-        "nsarrazin/alpaca", 
-        "alpaca-13B-ggml/ggml-model-q4_0.bin", 
-        8.13E9,
+    "OpenAssistant-30B": [
+        "TheBloke/OpenAssistant-SFT-7-Llama-30B-GGML",
+        "OpenAssistant-SFT-7-Llama-30B.ggmlv3.q5_1.bin",
+        24.4E9,
         ],
-    "Alpaca-30B": [
-        "nsarrazin/alpaca", 
-        "alpaca-30B-ggml/ggml-model-q4_0.bin", 
-        20.2E9,
+    "GPT4All-13B": [
+        "TheBloke/GPT4All-13B-snoozy-GGML",
+        "GPT4All-13B-snoozy.ggmlv3.q5_1.bin",
+        9.76E9,
         ],
-    "GPT4All": [
-        "nsarrazin/alpaca",
-        "gpt4all/gpt4all.bin",
-        4.20E9
-    ],
-    "OAsst-LLaMA-13B": [
-        "Black-Engineer/oasst-llama13b-ggml-q4",
-        "qunt4_0.bin",
-        8.13E9,
-    ],
-    "OAsst-LLaMA-30B" : [
-        "Black-Engineer/oasst-llama30b-ggml-q4",
-        "qunt4_0.bin",
-        20.2E9,
-    ],
-    "Vicuna-7B" : [
-        "eachadea/ggml-vicuna-7b-1.1",
-        "ggml-old-vic7b-q4_1.bin",
-        5.04E9,
-    ],
-    "Vicuna-13B" : [
-        "eachadea/ggml-vicuna-13b-1.1",
-        "ggml-old-vic13b-q4_2.bin",  
-        8.13E9,
-    ]
+    "StableVicuna-13B": [
+        "TheBloke/stable-vicuna-13B-GGML",
+        "stable-vicuna-13B.ggmlv3.q5_1.bin",
+        9.76E9,
+        ],
+    "Guanaco-7B": [
+        "TheBloke/guanaco-7B-GGML",
+        "guanaco-7B.ggmlv3.q5_1.bin",
+        5.06E9,
+        ],
+    "Guanaco-13B" : [
+        "TheBloke/guanaco-13B-GGML",
+        "guanaco-13B.ggmlv3.q5_1.bin",
+        9.76E9,
+        ],
+    "Guanaco-33B" : [
+        "TheBloke/guanaco-33B-GGML",
+        "guanaco-33B.ggmlv3.q5_1.bin",
+        24.4E9,
+        ],
+    "Guanaco-65B" : [
+        "TheBloke/guanaco-65B-GGML",
+        "guanaco-65B.ggmlv3.q5_1.bin",
+        48.97E9,
+        ]
 
     }
 

diff --git a/scripts/deploy.sh b/scripts/deploy.sh
@@ -1,6 +1,6 @@
 #!/bin/bash
 
-pip install llama-cpp-python==0.1.49
+pip install llama-cpp-python==0.1.54
 
 redis-server /etc/redis/redis.conf &
 # Start the API